Feb. 7th, 2021

Apple M1

Feb. 7th, 2021 08:09 pm
techwork: (Default)
на самом деле это не просто так. Это многозначительная вещя.

И так Как я ранее описывал рапаралеливание задач CISC процессоров более 16 потоков эффективно невозможно. Да можно сделать чтп где их гораздо больше типа 96 ядерных чипов от Интел. Но это серверы и там потоки не на одного пользователя.

Один пользователь загружает 16 потоков. И ещё 4 потока мотгут загрузить перефереийные задачи и ОС. Почему у Интел и появилась и шина именно на 20 дер и процессоры на 20 ядер. Ну потому что там математики работают и этот законредельности для CISC знают.

На самом деле 20 ядерный процессор без HT это предел. C HT его заменяет 16 HT32 , Потому что HT 32 это примерно эквивалент 22 ядерному процессор без HT. Иногда больше но 22 ядерному он эквивалент гарантированно.

Почему я пару лет назад и писал что предал настольных машин после кремниевого краха это 16 ядер CISC плюс специаизированные матричные процессоры для конкретных задач ( а CUDA это частный случай такой реализации) .

Невозможно ничего сделать дальше. И даже более иногда 8 НТ16 лучше чем 16 НТ32 просто из-за того что более низкий TDP позволяет компенсировать разницу частотой. 4 Ггц 16 НТ32 фактически эквивалентен 4,3 Ггц 8 НТ16. Это кстати почему таже Сони или Майкроософт поставили в свои приставки именнно 8 НТ16. А смысла нет. Для научных задач ещё какой то смысл есть а для игр....
Решается частотой . тем более что у них не крутится не ОС не переферийки на этих ядрах, т.е. им нет потребности в ещё 4 ядрах или потоках. 16 потоков конечно слабее чем 16 честных ядер без НТ но в игровых задачах разницы нет.

Конечно с 2016 года всем было понятно что конец ИТ пузыря приближается. И конец развития ( искуственно заторможенного ради выгоды) тоже намечается. А что потом.

на самом деле что потом идея принадлежит AMD во времена процессора K5. В этом процессоре внутри был RISC процессор от HP поверх которого шла трансляция команд в х86. Интересно это тем что это и прична почему Эльбрус не стал популярны и успешным, почему Transmeta повторяла ход AMD - всё просто - PA-RISC - хвалёный Эльбрус наследник не лицензинного украденного за бугром PA-RISC.

K5 и Эльбрус это родственники. Только К5 законный сын, а Эльбрус бастард.

Но АМД вполне сотрудничали с Московским центром спарк технологий ( МЦСТ) рекрутируя через него джуни. Раз сперли но сперли тоже самое над чем работает АМД то почему бы нет. Правда талантливых или хотя бы пригодных оказалось гораздо меньше чем они рассчитывали. Потому что пропаганда и реальность разные вещи и ранее я описывал почему и как.

Аналогично и проект Итаниум в Интел тоже развивался примерно над тем же самым материалом. Конечно они пошли своим путём.

Потом они даже не посадили владельцев Transmeta потому что отношения межу всеми Пяти фигурантами этой истории были благожелательные.

Ну а потом патенты истекли.

Так что нет не трансмета и не МЦСТ придумали первыми эмулировать x86 поверх другой архитектуры. Это сдеала компания AMD и кстати там в команде было много людей из ГДРовского Robotronic.

K5 оказался ну так - терпимо сегмент держал.
Crusoe оказалс - хлам. Просто потому что продавать бету сделанную на коленце в МЦСТ это западло. Конечно скорость трансляции команд была хреновая.
Как осталась она хреновой и на Эльбрусе до сих пор. Чем был внутри Crusoe ? Эльбрусом он и был.

Потом настал момент истины для Apple вернулся Джобс и сразу после того iPod начал продаваться так что возродил из руин Apple, но вот дочка Джобса Лиза для чебы пользовалась ноутбуком на Интел но не от Apple он буквально отпидарасил в нецензурной форме по этому поводу своё окружение ( да Тиму нравится анал но в буквальном, а не переносном смысле) и после скандала Apple приняли решение переходить на Intel, а софт весь под макос был на PowerPC. И он просто сказал - что бы весь софт работал . Так появился проект Rosetta тем более что в это время были популярны софтовые эмуряторы игровых приставок. Часть народу купили из разботчика эмулятора Соньки. Часть ещё где то настреляли. В итоге розету выкатили - она транслировала набор комманд из PowerPC на x86 . Работала она честно говоря не очень. Поэтому её поддержку после 10.7 убрали. Потеря скорости была 20-30% от аналогов перекомпилированных под x86. Но паралельно развивались виртуальне машины. Виртуальный гипервизор появился как расширение сначала к Интел потом дальше везде. Появились разные методы виртувализации - 10 лет вируальные машины обкатывались и достигли такого совершенства что трансляция комманд из одной системы в другу стала быстрой на столько что занимает сейчас на некоторых комбинациях всего 0,05% тактов, но обычно 1% но максимум 5% в пике. Т.е. виртуализирование на лету стало таким что те ресурсы что оно отбирает сопоставимы с кривостью рук программистов.
Так появился Rosetta 2. И при таких накладнх потерях стало понятно что совершенно не важно какой архитектуры будет камень внутри ARM или Intel но если он будет ARM то заплатив ARM ничтожные гроши за систему комманд можно наварится.

Так в 2016 году и был задуман M1. Тем более что ARM ядра от Apple после конфликта с Samsung развились очень даже хорошо.

После этого адьос.

Аналочно тогда они отказались от Imagination PowerVR что бы сосредоточится на разработке своих ядер в сотрудничестве с ARM и nVidia.

PowerVR в принципе неплохой наследник Kyro. Но .... он был нужен только в Kirin но на них положили санкции а ARM предложила им передачу технологий через продажу ARM China - Сон Чёни хитрый корейский подонок.

А итоге PVR конечно ставят ещё в некоторые чипы. Но после того как Huawei получили исходники Mali ядер и разрабатывают на их основе свои ядра. а MediaTek превратилось с серий Dimension в прослойку Huawei. Перспективы PVR туманны.

Apple же тем временем используя сотрудничество с другими фирмами разработали своё видеоядро. Что ооказалось дешевле чем кого либо покупать. И ядро получилось хорошее. произвоительность на уровне RX560 настольной. И это только первый их чип.

По какой технологии он делается ?

Официально это 5 нм. ну понятно .. реально TSMC N5 первого поколения. ITRS это ITRS 9 это та самая технология ради котрой весь ULV процесс и создлавался. Это самый выгодный техпроцесс из всех нынешних и будущих ULV.

И да TSMC во многом заружены и контрактом Apple в том числе. Однако к дефициту видеокарт это не относится, так как TSMC делает чипы памяти на ArF оборудовании.

Конечно этот контракт в максимальном приоритете - потому что он решает для Apple многое.

Пока цифров продаж показывают что всё Apple удалось. Более того именно из-за успеха Apple в странах первого мира продажи топовых Tiger Lake будут провальными. И только продажи в странах третьего мира типа РФ начальных процесоров TL спасёт Intel от убытков.

Дебют успешен. А что он меняет ?

А вот что - кросплатформенность стала реальностью и теперь любая фирма может выйти на рынок. Потому что IP ARM как и система команд в отличии от х86 не огорожена порогом вхождения и патентами. Дуополии Intel-AMD пришёл конец.

Теперь любой может купить у ARM права, и не дорого, и сделать свой процессор. Это снизит стоимость VIA Technology. Конечно КНР ради суверености технологий будет развивать Zaoxin они уже это полным ходом делают в Китае , али через пару лет начнёт всё это продавать.
Но VIA технологии передала. Centaur теперь же больше не весомый актив как ранее. более того в их ядрах вообще отпал смысл. Достаточно вычислительных способностей и качественный виртуальный гипервизор и всё.

Более того Risc-V абсолютно бесплатный и открытый. Можно сделать и на нём что то. Тем более что его система команд активно поддерживается огромным сообществом среди которого есть и разрабочики VMware. так что ....

OpenCPU становится реальностью.

Так же в китае постепенно развивается Jingha с её видеокартами - сейчас это пока JZ7201. Так же AMD продала часть своих технологий видеочипов Китаю. Бабло решает.

Между AMD и китайским правительством действует джентельменское соглашение - Китай производит то что купил у АМД только для себя . Но на алиэкспрессе камешки эти вполне себе уже лежат. С китайской системой шитфрования. Конечно какой нибудь представитель страны первого мира их не купит. Но страны третьего мира типа РФ - вполне.

Вообще сейчас самое необходиое для ИТ это либо открытие хотя бы в лицензируемом виде технологии CUDA - но это пока кто нибдь через антимонопольный суд в США не заставит. Либо создание полного его аналога. OpenCL под это не подходит по определению с самого начала. Конечно при помощи прослойки что то подобное можно реализовать именно так работает OpenCL с CUDA ядрами на nVidia. Но опять таки OpenCL это не аналог CUDA. особенно это видно на примере прорисовки взвеси частиц в солнечном свете. GRID реальный OpenCL не может, динамизировать тоже не может, Warp-Matrix не работает. Он просто лупится на конверы фиксированным массивом. В итоге эффективность использования .....

Кстати тест технологии Sony по бесшовности показал что экономия необходимой памяти типа ОЗУ уменьшается на 30%. А Видеопамяти на 15%.

Т.е. вот откуда то что не смотря на то что железо на seriesX лучше реально PS работает лучше. Конечно на пристпвка область ОЗУ не такая большая как на компах тем неменее она есть правда если на компе на win10 для игры нужно 16Gb оперативки, то на приставке из-за отсутвия полной многозадачности и висящео в памяти массивного ядра ОС с драверами нужно всего 3Gb да да 3Gb. Остальные 13 уходят на видео. То например на series X понадобится 4,2 под ОЗУ и остальное 11,8 уйдёт на видео. А на S это будет 4,2 ОЗУ и только 3,8 под видео. Почему разрешение только 1080p.

Но это ещё не всё Сониевские 13 эквивалентны 15,2 гигам от Майкрософт.

Аналогично размеры дистрибутивов на дисках. Сони их слегка пакует очень быстрым алгоритмом в результате уменьшает их размер от 15 до 35%. В среднем 24% Таким образом и диск Сони 825 Гб это эквивалент 1085 гигов на series X из-за распаковки время загрузки замедляется на 8% однако скорость встроенного SSD сама по себе выше чем SeriesX и поэтому игры загружаются одинаково быстро.

Вообще в этом суть японского подхода - когда то очень давно , в другой жизни я слушал лекцию одного японского профессора - и когда все говорил об ужасах инфляции он сказал ничего страшного. Когда всё вокруг обесценивается важно лишь то что обесценивается медленее чем другие активы, также важна ликвидности и скорость роста поступлений. Если она выше чем скорость падения , то ничего страшного. А пример он приводил человеческую жизнь. Мы рождаемся и сразу начинаем приближаться к смерти - но то сколько мы проживём зависит от того как быстро мы растрачиваем свои ресурсы. Хотя смерть в конце неизбежна. Но пока мы живём мы живы.

Как тратить память и вычислительные ресурсы это тоже очень важно.

Частота процессора очень важно. особенно когда количество потоков близко к предельному. 8 или 16 ядер ? конечно если без HT то 16 но если HT то это уже речь о 16 потоках на 8 ядрах, 16 потоках на 16 ядрах и 32 потоках на 16 ядрах.

Если у вас нет многозадачной ОС то лучше 16 потоков на 8 ядрах , так как 16 потоков на 16 ядрах увеличит TDP в 1,9 раза, а разогнав процессор можно получить тот же итог при TDP 1,1

TЕсли у вас есть такая ОС то тут уже 20 потоков на 10 ядрах или 20 потоков на 20 ядрах и ответ понятен - 20 потоков на 10 ядрах, но если такого процессора нет то 32 потока на 16 ядрах лучше чем 16 потоков на 8 ядрах.

Но 16 ядер это предел. А реально иногда по TDP лучше если бы был купить 10 ядерный 20 поточный процессор чем 16 ядерный 32 поточный.
10 ядерные наврядли будут а вот 12 ядерные уже есть и они порой показывают себя лучше чем 16 ядерные из того же семейства за счёт более лучшего не экстремального а бюджетного разгона . Собственно почему Ryzen 9 3900X в США так популярен. В концк 19 и в течении 20 года он показывал самые лучшие результаты лучше даже чем у 16 ядерных собратьев. За счёт частоты. а стоил 500 баксов а не тысячи как сопоставимые.

Это вот уже текущей пример когда при той же системе охлаждения 12 ядер в реальных задачах работают лучше чем 16.

Конечно на кромке технологий TDP уже не будет так сильно отличаться у 12 и 16 ядерных версий, и тогда 16 станет лучше. Просто потому что HT это не полноценные ядра. А предел распаралеливания на многозадачной ОС 20. А 32 HT потока эквивалентны примерно 22 ядрам. Т.е. с небольшим запасом на сверхпиковые задачи.

Вот почему я сразу говорил что 16 ядер это конец развития X86 потому что по TDP 32 HT будет всегда лучше чем 20 без HT, и чип меньше и дешевле. Не важно чип или чиплет - размер имеет значение - чем меньше тем лучше.

Ну а потом несомнено ARM и Risc-V с виртуальной x86.
В теории x86 можно повесить даже поверх MIAOW правда проект сдох. Да архитектура слишком не стандартная да VLIW но беда VLIW состоит в том что нормального гипервизора по верх них кто делать не будет . Не перспективная архитектура. Времена когда транзисторы эконмири прошли. Суперскаляры лучше. ARM тем что под него много софта много устройств.как говорят экоситема развитая. Risc-V тем что он бесплатен и за ним мастодонты. MIPS на этом фоне не туда и не сюда. Покойся с миром. SPARC тоже то ещё извращение но оно хотя бы изначально рассчитан на скорость но и то у Оракла он не особо то и идёт. Хотя ещё в 2013 у них такие надежды а него были.

Просто ARM ничем не уступает MIPS и SPARC и во всем их превосходит. А Risc-V бесплатен и открыт но не уступает им.

Profile

techwork: (Default)
techwork

July 2025

S M T W T F S
   1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 2223242526
2728293031  

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 22nd, 2025 02:50 am
Powered by Dreamwidth Studios