Но это все еще дешевле конкурентов.
Громкий китайский стартап DeepSeek заявлял о создании конкурентоспособной ИИ-модели с минимальными затратами: якобы на обучение мощной нейросети DeepSeek V3 потратили всего $6 миллионов, а использовали всего 2048 графических процессоров.
Однако аналитики из SemiAnalysis выяснили, что DeepSeek управляет крупной вычислительной инфраструктурой, включающей около 50 000 GPU Nvidia Hopper. В их число входят 10 000 единиц H800, 10 000 более мощных H100 и дополнительные партии H20. Эти ресурсы распределены между несколькими центрами обработки и используются для обучения ИИ, исследований и финансового моделирования.
Общий объем капиталовложений компании в серверы составляет около $1,6 млрд, а операционные расходы оцениваются в $944 млн.
DeepSeek – дочерний проект китайского хедж-фонда High-Flyer, который с 2023 года выделил стартап в отдельное направление, сосредоточенное на ИИ-технологиях. В отличие от большинства стартапов, которые арендуют мощности у облачных провайдеров, у компании есть собственные дата-центры, что дает полный контроль над оптимизацией ИИ-моделей и позволяет быстрее внедрять инновации. DeepSeek остается самофинансируемой организацией – это тоже положительно влияет на гибкость и скорость принятия решений.
При этом зарплаты некоторых исследователей в DeepSeek превышают $1,3 миллиона в год, что привлекает талантливых специалистов из ведущих университетов Китая (в компанию не берут специалистов из-за границы).
Уже лишь поэтому недавнее заявление DeepSeek, которая якобы обучила свою последнюю модель всего за $6 миллионов, кажется сказкой. Эта цифра относится лишь к стоимости затрат на GPU для предварительного обучения и не учитывает расходы на исследования, доработку модели, обработку данных или общие расходы на инфраструктуру.
DeepSeek потратила более $500 миллионов на разработку ИИ с момента основания. Но в отличие от более крупных компаний с бюрократией, компактная структура DeepSeek позволяет ей активно (и эффективно) внедрять инновации в области ИИ.
Пример DeepSeek показывает, что хорошо финансируемая независимая компания в сфере ИИ может тягаться с лидерами отрасли. Однако эксперты подчеркивают, что успех компании по большей части основан на многомиллиардных инвестициях, технических прорывах и сильной команде, а заявления о «революционном бюджете», затраченном на ИИ-модель, несколько преувеличены.
Но затраты конкурентов все равно заметно выше. Сравнить хотя бы стоимость обучения моделей: у DeepSeek на R1 ушло $5 млн, а ChatGPT4o стоила $100 млн.
Китайский ИИ перевернул IT-индустрию! Вот все, что нужно знать о DeepSeek