Перспективы производства памяти с высокой пропускной способностью в Китае
Память с высокой пропускной способностью (High Bandwidth Memory – HBM) остается ключевым фактором, сдерживающим развитие Китая в производстве передовых чипов для искусственного интеллекта (ИИ). Принципы закона Мура остаются актуальными и в XXI столетии, однако развитие технологий чипов памяти отстает от прогресса логических чипов. Один из способов, позволяющих минимизировать простой вычислительных мощностей в ожидании данных от микросхем памяти, заключается в использовании HBM. Ее архитектура предусматривает размещение нескольких микросхем друг над другом для увеличения пропускной способности.
По мере совершенствования чипов HBM остается критически важным компонентом масштабирования. Хотя китайский разработчик CXMT стремится сократить технологическое отставание, три гиганта – SK Hynix, Samsung и Micron – по-прежнему опережают HBM2 от CXMT более чем на два поколения. Если экспортный контроль существенно не изменится, развитие HBM в Китае будет и дальше сдерживаться нехваткой современного оборудования.
Внедрение стандартов HBM3E и HBM4 в отрасли стало бы колоссальным достижением для Китая. По состоянию на конец 2025 года передовые чипы искусственного интеллекта использовали HBM3E, а следующее поколение графических процессоров Nvidia Rubin будет работать на HBM4. Если CXMT сможет запустить производство HBM4, это позволит решить ключевую задачу создания продвинутых графических процессоров. Даже если разработка займет несколько лет, конкурентоспособные чипы искусственного интеллекта, вероятно, превзойдут современные стандарты и смогут справиться с огромными нагрузками.
Создание HBM – сложная задача. Показатели производительности продукта зависят от характеристик чипов DRAM, из которых состоит HBM, базового чипа, который маршрутизирует входящие и выходящие сигналы стека памяти, а также технологии сборки. В каждом из этих трех компонентов существуют узкие места, которые препятствуют прогрессу CXMT в разных поколениях HBM.

В индустрии памяти используется собственная терминология для обозначения размеров узлов (буквы вместо нанометров): 1x, 1y, 1z, 1α, 1β, 1γ. Samsung и SK Hynix применяют обозначения с английскими буквами 1a, 1b и 1c. Например, переход от поколения 1β к поколению 1γ позволил увеличить производительность на 15% и снизить энергопотребление на 20%. В 2025 году отставание CXMT (1z) от ведущих производителей памяти (1γ) составляло три поколения. Однако даже на базе узлов 1z можно производить DRAM для HBM вплоть до HBM3. Чтобы соответствовать стандартам 1α и выше, CXMT необходимо уменьшить ячейки DRAM, что требует использования передовых инструментов литографии, травления и осаждения.
Два самых сложных этапа производства DRAM включают формирование контакта битовой линии (BLC) и контакта узла хранения (SNC). Контакт битовой линии представляет собой физическое соединение между периферийными транзисторами и конденсаторами. По мере развития узлов DRAM требования к плотности шаблона и критическим размерам технологических процессов ужесточаются, поэтому требуется большая точность, которая может быть обеспечена за счет EUV-литографии.
Однако компания Micron с помощью таких технологий, как Self-Aligned Quadruple Patterning (SAQP), продолжала использовать DUV вплоть до узла 1β. Китайская компания SMIC освоила аналогичные технологии для расширения DUV в 7-нм чипе Huawei. CXMT, вероятно, может расширить использование DUV вплоть до 1β. После этого переход на 1γ-процесс и далее станет крайне затруднительным без доступа к оборудованию EUV, которое подлежит экспортному контролю.
Производство современных узлов без EUV сопровождается высоким процентом брака. Использование EUV увеличивает себестоимость, но позволяет повысить выход годных изделий для современных узлов на 3-5% и сократить количество этапов технологического процесса на 20-30%. Без EUV прогресс CXMT в области DRAM может остановится на узле 1γ. Это означает, что Китаю будет сложно достичь уровня HBM4E только за счет DRAM.
Производство чипов с высокой плотностью размещения элементов, в ходе которого создается множество узких, но глубоких отверстий для конденсаторов, требует точного травления. При этом задействуются современные инструменты с соотношением высоты к диаметру на уровне 40:1 или 60:1. США ввели экспортный контроль на современное оборудование для травления, включая анизотропные травители для конденсаторов, однако Китай наладил производство аналогов (в частности, Accura NZ и Accura LX от Naura и Primo nanova от AMEC). Технические характеристики китайской продукции не публикуются в открытом доступе, хотя Primo nanova продвигается для узлов 1x.

В области разработки оборудования для травления конденсаторов отставание Китая можно считать незначительным. Он занимает 10% мирового рынка сухого травления и обеспечивает примерно 15% своих потребностей. Быстрый рост отрасли в стране также показывает, что препятствия можно преодолеть. Помимо травления, для производства DRAM требуются современные инструменты осаждения. Китай уже может производить необходимое оборудование и материалы (доля оценивается в 5-10% и продолжает расти).
Еще одним этапом производства DRAM для HBM является формирование отверстий в кремнии (TSV). Вертикальные соединения позволяют взаимодействовать кристаллам DRAM, которые расположены друг над другом. Без TSV концепция HBM и других современных технологий была бы нежизнеспособной. В ходе изготовления TSV важнейшим процессом является точное травление кристаллов DRAM для последующего нанесения материала, причем переходные отверстия соединяют все пластины. Критические размеры TSV находятся в диапазоне 3-5 мкм при глубине менее 100 мкм. Кристаллы DRAM постепенно становятся тоньше, а глубина уменьшается. Китай располагает оборудованием, которое удовлетворяет этим требованиям. К примеру, AMEC TSV300E может использовать технологический процесс в пределах одного микрометра с глубиной в несколько сотен микрометров. Naura PSE V300, вероятно, обеспечивает аналогичную производительность.
Еще одним сложным процессом в производстве DRAM является внедрение металлического затвора с высокой проводимостью (HKMG). Учитывая, что уменьшение размеров ячеек DRAM для повышения производительности становится все более затруднительным, HKMG служит еще одним способом повышения быстродействия устройств. Периферийные транзисторы на кристалле DRAM обычно совершенствуются за счет уменьшения толщины изолятора затвора и расстояния между истоком и стоком. Когда толщина изолятора достигает предела и возникают утечки, HKMG используется для их минимизации.
HKMG заменяет традиционные материалы затворов в периферийных транзисторах, ускоряя поток электронов и предотвращая утечки мощности. Отчасти благодаря внедрению HKMG, SK Hynix удалось добиться повышения скорости на 33% при снижении энергопотребления на 21%. Внедрение HKMG в процессы DRAM затруднено, отчасти из-за одновременной обработки периферии и массива на одной пластине. Количество тепла, которое могут выдерживать структуры массива, ограничено, поэтому стандартные техпроцессы HKMG для логических узлов не могут применяться для DRAM. Хотя CXMT в настоящее время испытывает трудности с HKMG, эта проблема не выглядит непреодолимой. Узким местом, по-видимому, является совершенствование технологических процессов, а не отсутствие доступа к оборудованию.
Кристаллы HBM DRAM располагаются поверх базового кристалла, который маршрутизирует входящие и исходящие сигналы (ввод/вывод) стека памяти. Независимо от мощности кристаллов памяти, мощность базового кристалла определяет верхний предел пропускной способности памяти для HBM. По мере развития узлов HBM увеличивалось количество выводов на базовом кристалле, а также скорость передачи данных.
Переход на более совершенные узлы DRAM для базового кристалла позволяет удовлетворить эти требования. Начиная с поколения HBM4, сопутствующие расходы существенно выросли, поэтому многие производители памяти сотрудничают с TSMC для выпуска следующих поколений базовых узлов. Усовершенствованная архитектура логических узлов в базовых кристаллах может стать недоступной для CXMT. Без EUV-литографии SMIC с трудом удалось преодолеть порог 7 нм, не допустив катастрофического снижения выхода годных изделий.

CXMT может повторить путь Micron и продолжить использовать 1β DRAM в качестве кристалла. Однако это решение будет иметь существенные недостатки. Например, Micron с HBM4, где базовый кристалл был изготовлен по технологии памяти, не смогла конкурировать с SK Hynix и Samsung. Если продукция Micron может обеспечить показатель JEDEC на уровне 8-9 Гбит/с, то SK Hynix и Samsung смогли достичь пропускной способности выше 10 Гбит/с на вывод с помощью кристаллов логических узлов.
Учитывая, что узлы памяти не в полной мере подходят для базового кристалла после HBM4, Micron заключила партнерское соглашение с TSMC для производства на усовершенствованном логическом узле. Для CXMT это может означать, что использование кристаллов 1β DRAM для HBM4 приведет к ухудшению характеристик готовой продукции, поскольку создание HBM4E без прорыва SMIC в области логических узлов является сложной задачей.
Хотя производители памяти изготавливают самые современные базовые кристаллы для HBM4 по технологии не выше 5 нм, они также предлагают альтернативы с более дешевыми 12-нм кристаллами. Однако с точки зрения производительности памяти и энергопотребления более востребованными для задач ИИ среди таких клиентов, как Nvidia, являются 5-нм кристаллы. Без доступа к передовым технологиям CXMT будет испытывать трудности с созданием конкурентоспособных HBM4 и HBM4E. Теоретически существует возможность наладить сотрудничество с TSMC в рамках производства своих кристаллов, поскольку они могут не попасть под санкции, однако геополитическая напряженность является весомым сдерживающим фактором.
Сборка стека HBM и способ «связывания» кристаллов DRAM друг с другом имеет решающее значение, причем экспортный контроль не ограничивает продажу специализированного оборудования. Узким местом является высокая плотность размещения кристаллов, ухудшающая отвод тепла. Кроме того, для обеспечения возможности дальнейшего склеивания кристаллов важно минимизировать зазоры между ними. HBM эволюционировал от 4 до 16 кристаллов в стеке, поэтому склеивание стало ключевым фактором.
Двумя основными технологиями являются термокомпрессионное склеивание (TC-NCF), используемое компаниями Samsung и Micron, и массовое оплавление припоя (MR-MUF), используемое SK Hynix. SK Hynix внедрила MR-MUF еще на заре производства HBM2E, что в итоге дало компании дополнительное конкурентное преимущество. MR-MUF предполагает одновременный нагрев и соединение всех кристаллов, установленных друг на друга, а не по одному, как в TC-NCF. С точки зрения получаемых результатов одним из перспективных методов для MR-MUF является применение эпоксидного формовочного компаунда (EMC) для заполнения зазора между кристаллами.
MR-MUF обеспечивает требуемую производительность и рассеивание тепла, что немаловажно как для масштабирования производства HBM, так и для управления тепловыделением. Используя MR-MUF, SK Hynix может устанавливать больше кристаллов друг на друга. Сбои HBM являются основной причиной отказов микросхем ИИ, поэтому технология MR-MUF обеспечивает реальное конкурентное преимущество.

Следуя по стопам SK Hynix, CXMT внедряет MR-MUF для своих HBM3 и последующих процессоров. Однако чтобы воспользоваться всеми преимуществами MR-MUF, необходимо решить несколько технологических проблем, связанных с уменьшением толщины кристалла и поставками материалов. Конкуренция может помешать CXMT приобрести EMC для MR-MUF. SK Hynix заключила эксклюзивное соглашение с японским поставщиком NAMICS. Особый материал разрабатывался совместно с NAMICS на протяжении многих лет и должен подходить для технологического процесса каждой компании. Даже если CXMT будет сотрудничать с китайским поставщиком EMC (например, с компанией Huahai Chengke), могут потребоваться годы совместной работы для достижения приемлемого результата.
Принимая во внимание трудоемкость всех этапов, начиная от налаживания производства DRAM и заканчивая сращиванием кристаллов с помощью MR-MUF, эксперты предполагают, что уровень годной продукции HBM3 от CXMT не будет превышать 40% к концу 2026 года. В любом случае ставка на MR-MUF может оказаться удачным выбором стратегии. Преимущества этого варианта очевидны, а процесс связывания, по-видимому, является лишь краткосрочным препятствием.
Китайские производители микросхем предпочитают не раскрывать карты, и CXMT не является исключением. Конфиденциальность деятельности компании можно объяснить как спецификой отрасли, так и требованиями национальной безопасности. В целом CXMT уверенно развивает производство HBM, но на каждом его этапе могут появляться препоны, которые могут повлиять на качество. К примеру, отсутствие EUV для производства DRAM и продвинутой логики для базовых кристаллов может привести к отставанию от конкурентов.
HBM считается оптимальным вариантом для использования в микросхемах памяти ИИ. Альтернативы, такие как гибридная упаковка, высокоскоростная флэш-память (HBF), унифицированный менеджер кэша (UCM), вычисления в памяти (CIM), сегнетоэлектрическая оперативная память (FeRAM) и магнитная оперативная память (MRAM), имеют свои недостатки и пока еще не достигли стадии массового внедрения. Однако они предоставляют Китаю возможность наладить независимое производство. Если администрация США когда-либо отменит экспортный контроль, Китай сможет ускорить разработку HBM.
По материалам chinatalk.media