Сравнение больших языковых моделей (LLM) искусственного интеллекта (ИИ), созданных в Китае и США, позволяет сделать вывод о том, что китайские разработки не только не уступают, но и по ряду показателей превосходят западные аналоги.

Прибыль при низких ценах

В начале мая 2024 года в Китае появилась усовершенствованная LLM под названием DeepSeek-V2. Она продемонстрировала отличный потенциал и приблизилась к высоким международным стандартам, которые используются для оценки технологий ИИ. Представители отрасли были удивлены экономической эффективностью модели, которая требует всего один юань (0,14 доллара США) на миллион входных токенов и два юаня на миллион выходных токенов. Для сравнения, у GPT-4 эти цифры примерно в 100 раз выше. Даже бюджетная китайская модель ИИ Moonshot AI не может считаться конкурентом новой разработки, поскольку стоит более чем в 20 раз дороже.

Огромная разница в ценах вынуждает многих китайских поставщиков продуктов ИИ обращаться к DeepSeek. Некоторые медиа-платформы высказывали предположение о том, что сервис будет придерживаться стратегии субсидирования, стремясь конкурировать за долю рынка. Однако представители команды разработчиков ответили, что можно продолжать получать прибыль даже при такой тарификации, поскольку себестоимость обработки одного миллиона токенов составляет 0,50 юаня.

Не менее интересным является тот факт, что DeepSeek, принадлежащая инвестиционной компании High-Flyer Capital Management, имеет открытый исходный код, то есть любой желающий может создать на ее основе свою собственную модель ИИ. Если говорить о факторах, позволивших снизить затраты, то в первую очередь стоит упомянуть об инновациях, касающихся структуры, и значительной оптимизации архитектуры LLM.

Ценовая война

21 мая 2024 года можно считать датой начала ценовой войны между китайскими интернет-гигантами. Компания Alibaba Cloud первой объявила о значительном снижении цен на свои LLM, что спровоцировало следующие волны удешевления тарифов. Необходимо отметить, что на фоне ожесточенной ценовой войны стратегия Alibaba Cloud по снижению тарифов резко отличается от стратегии других поставщиков, которые в основном провели корректировку цен на небольшие языковые модели.

Alibaba Cloud одномоментно снизила цену на девять своих LLM, а ее флагманская модель Qwen-Long, по возможностям сравнимая со всемирно известной GPT-4, стала примером смелой маркетинговой стратегии. Так, стоимость интерфейса прикладного программирования (API) Qwen-Long была уменьшена с 0,02 до 0,0005 юаня за 1000 токенов. Таким образом, 2 миллиона токенов можно купить всего за 1 юань, что эквивалентно объему текста в пяти экземплярах словаря Синьхуа. Эта цена примерно равна тарифу DeepSeek, объявленному в начале мая.

Согласно информации, взятой с официального сайта Qwen-Long, производительность модели с точки зрения функциональности близка к GPT-4. Она способна поддерживать длинный интерактивный диалог объемом до 10 миллионов токенов и легко обрабатывать документы объемом около 15 миллионов слов или 15 тысяч страниц. Следовательно, по этим показателям Qwen-Long превосходит многие аналоги. Несмотря на снижение стоимости использования API, к которому прибегли разработчики GPT-4o (OpenAI) и Gemini 1.5 Pro (Google), флагманская модель Alibaba Cloud по-прежнему имеет рыночное преимущество с точки зрения соотношения производительности и затрат.

Преимущества китайских разработчиков

Не секрет, что китайским компаниям, занимающимся разработками в сфере ИИ, удается создавать аналоги западных продуктов за одну десятую часть от их стоимости. Дело в том, что в Китае насчитывается около восьми миллионов инженеров-программистов (в США – вдвое меньше), заинтересованных в оптимизации цен на свои разработки. Кроме этого, для ускорения развития перспективного направления Китай привлекает почти в 10 раз больше талантов, чем США. Выпускники китайских вузов, выбирающих профессию программиста, могут рассчитывать на одни из самых высоких зарплат на рынке. Таким образом, отрасль получает постоянный приток талантливых и мотивированных специалистов.

Структура занятости и дефицит кадров позволяют большинству американских программистов сохранять за собой рабочее место вплоть до выхода на пенсию. В Китае имеется достаточный кадровый резерв, поэтому средний возраст местных программистов составляет 25-35 лет. Кроме этого, они нередко работают сверхурочно, поэтому реальная нагрузка на одного сотрудника может в два раза или даже больше превышать интенсивность занятости в Соединенных Штатах.

Особенностью китайского рынка является ограниченность возможностей для ведения бизнеса, связанного с LLM, чего не скажешь о США. Таким образом, в отличие от своих американских коллег, ведущие китайские программисты не спешат присоединяться к стартапам, а остаются в Alibaba или на крупных платформах, имеющих финансовую поддержку. Учитывая ограниченность индустрии микросхем, наблюдается тенденция к снижению стоимости обучения магистров ИИ в китайских вузах. Численность талантов, работающих в китайских платформах ИИ, и оптимизация рентабельности компаний дают возможность говорить о преимуществе Китая перед западными конкурентами на этом рынке.

По материалам thinkchina.sg