Дослідники вирахували витрати DeepSeek на навчання AI

У своєму останньому звіті незалежна дослідницька компанія SemiAnalysis висвітлила діяльність компанії DeepSeek, яка останнім часом стала надзвичайно популярним гравцем у сегменті AI. Фахівці SemiAnalysis поставили під сумнів деякі з поширених наративів щодо витрат DeepSeek та вирішили перевірити ці дані та заразом порівняти отримані показники з конкуруючими технологіями на ринку.

Щоб дізнатись останні новини, слідкуйте за нашим каналом Google News онлайн або через застосунок.

Одне з найпоширеніших і найдивовижніших тверджень полягає в тому, що витрати на навчання DeepSeek V3 становлять близько $6 млн. Проте звіт SemiAnalysis деконструює цю цифру, оскільки вона, вочевидь, не враховує кілька важливих факторів.

DeepSeek

Оцінка в $6 млн в першу чергу враховує витрати на попереднє навчання GPU, але нехтує значними інвестиціями в дослідження і розробки, інфраструктуру та іншими важливими витратами, які несе компанія. У звіті підкреслюється, що загальні капітальні витрати DeepSeek на сервери складають вражаючі $1,3 млрд.

Значна частина цих фінансових зобов’язань спрямована на експлуатацію та обслуговування великих кластерів графічних процесорів, які є основою обчислювальної потужності компанії. Зазначається, що DeepSeek має доступ до приблизно 50 тис. графічних процесорів Hopper. Це, звісно, не означає наявності 50 тис. H100. Натомість інвентаризація графічних процесорів складається з різних моделей, включаючи H800, H100 та спеціальні H20, які NVIDIA випускає у відповідь на експортні обмеження в США.

DeepSeek

Таке детальне розуміння інвентаризації обладнання підкреслює стратегічні рішення щодо вибору постачальників та операційної ефективності в DeepSeek. Крім того, компанія, на відміну від деяких великих лабораторій AI, має власні центри обробки даних і використовує оптимізовану модель, що сприяє її гнучкості та ефективності. В умовах зростаючої конкуренції на ринку ця здатність швидко адаптуватися стає суттєвою перевагою.

Аналіз показує, що з погляду продуктивності модель R1 від DeepSeek демонструє порівнянну здатність до міркувань з моделлю o1 від OpenAI. Але вона не є беззаперечним лідером за всіма показниками продуктивності.

DeepSeek

Хоча цінова стратегія DeepSeek привернула увагу та отримала схвальні відгуки, фахівці зазначили, що Gemini Flash 2.0 від Google виявляється ще більш економічним, коли доступ до нього здійснюється через API-сервіси. Це ставить компанію на перехрестя, де баланс між продуктивністю і вартістю є ключем до його майбутнього успіху.

Експерти припускають, що інновації, які з’явилися в DeepSeek, швидше за все, будуть швидко прийняті західними лабораторіями AI, які прагнуть залишатися конкурентоспроможними. Але у SemiAnalysis говорять про зовнішні виклики – зокрема, аналітики припускають, що операційні витрати можуть впасти ще в п’ять разів до кінця року завдяки здатності DeepSeek швидко адаптуватися порівняно зі своїми більшими та більш бюрократизованими колегами.

Читайте також:

Джерелоinterestingengineering

Підписатися

0 Comments

Найновіше

Найстаріші Найбільше голосів

Зворотній зв'язок в режимі реального часу

Переглянути всі коментарі

Інші статті

Дослідники розвінчали міф щодо витрат DeepSeek на навчання AI

Останні коментарі