БЕЛ Ł РУС

Настоящая стоимость DeepSeek, китайского чат-бота, который обрушил фондовый рынок США, оказалась совсем не такой

2.02.2025 / 15:3

Nashaniva.com

Утверждения разработчиков китайской нейросети DeepSeek, что ее создание заняло всего два месяца и обошлось в 6 миллионов долларов, значительно обрушили акции всех крупных западных технологических компаний. Но эта стоимость «китайского убийцы ChatGPT» оказалась значительно заниженной.

Иконки приложений DeepSeek и ChatGPT на экране смартфона. Фото: Andy Wong / AP

Китайский чат-бот DeepSeek, который перевернул мир искусственного интеллекта, стал предметом детального анализа в новом докладе независимой исследовательской компании SemiAnalysis.

В отчете оспариваются утверждения разработчиков DeepSeek о стоимости создания и обучения их модели V3, а также рассчитываются реальные затраты на разработку подобного ИИ на основе как официальных данных от китайской компании, так и общедоступной информации об актуальных ценах эксплуатации аналогичных ИИ-моделей западных компаний, пишет научный портал Interesting Engineering.

«DeepSeek представила свою ИИ-модель V3 на бесплатной основе и с открытым исходным кодом, заявив, что на ее создание и обучение ушло всего два месяца и менее чем $6 млн. Но эта цифра в основном учитывает только затраты на подготовку GPU (графических процессоров), но не берет во внимание инвестиции в исследования и разработки, создание и поддержку остальной инфраструктуры и другие критические затраты.

Фактические затраты DeepSeek значительно больше. По нашим данным, общие капитальные затраты китайской компании на серверы достигают впечатляющих $1,3 миллиарда. Большая часть этих средств направлена на эксплуатацию и обслуживание широких GPU-кластеров, которые являются основой вычислительной мощности нейросети», — отмечается в докладе SemiAnalysis.

Это дороже, чем стоимость создания и обучения ChatGPT, которая составляет около $1 миллиарда. Главное отличие от китайской DeepSeek в том, что ChatGPT для эксплуатации и обслуживания собственных серверов использует дата-центры и другую инфраструктуру компаний Microsoft, Oracle и SoftBank (но преимущественно Microsoft), тогда как китайская компания строит и обеспечивает свою собственную инфраструктуру, дополнительно сталкиваясь с последствиями технологических санкций Запада против Китая.

DeepSeek, согласно отчету SemiAnalysis, имеет доступ примерно к 50 тысячам графических процессоров поколения Hopper от компании Nvidia, среди которых есть мощные процессоры версий H100 и H800, а также H20специальной версии от Nvidia для китайского рынка, разработанной в ответ на ограничения со стороны США на технологический экспорт.

Для сравнения, ChatGPT-4 (который был выпущен в 2023 году) использовал от 20 до 25 тысяч еще менее совершенных процессоров A100 (также Nvidia), но теперь компания OpenAI приближается к показателю в 100 тысяч процессоров Nvidia GB200 (лучшие из всех вышеупомянутых).

При этом, как отмечает SemiAnalysis, китайский DeepSeek, несмотря на большую стоимость содержания инфраструктуры, демонстрирует сопоставимую с последними версиями ChatGPT точность ответов и способности к размышлениям. А владение собственными серверами может дать DeepSeek преимущество в стабильности работы ее модели и большую гибкость в сокращении затрат в будущем.

Читайте также:

Что думает нашумевший китайский чат-бот о режиме Лукашенко

Лянь Вэньфэн — таинственный основатель DeepSeek, который перевернул мир искусственного интеллекта

«Врата в мир белорусского контента». Команда айтишников создала белорусскоязычную ИИ-колонку

Комментарии к статье