DeepSeek: що треба знати про китайський штучний інтелект, який загрожує перевернути ринок

Марія Ципльонкова

Маркетолог, автор статей

Появу DeepSeek називають «потужним землетрусом у сфері штучного інтелекту». Оголошення вартості його створення, в десятки разів меншої за розробку ChatGPT, обвалило ринки і зробило китайський застосунок найпопулярнішим в США.

DeepSeek

Але перший шок швидко минув. Подробиці, що випливають зараз, ставлять під питання правдивість заяв китайського стартапу. Про те, хто створив DeepSeek та чи може це змінити ринок штучного інтелекту, розповідаємо в статті.

Чому всі говорять про DeepSeek?

20 січня китайський стартап DeepSeek представив модель штучного інтелекту, а за тиждень — заявив про те, що її створення обійшлося всього в 5,6 мільйони доларів (створення ChatGPT — в понад 100 мільйонів) завдяки використанню менш потужних мікросхем.

Безкоштовний китайський чат-бот з відкритим вихідним кодом виглядає та працює дуже схоже на ChatGPT. За даними розробників, за потужністю він не поступається моделі o1 від OpenAI, випущеній наприкінці минулого року.

Ці дані шокували американський ринок штучного інтелекту, побудований на мільярдних інвестиціях у передові технології. Виглядало так, що бульбашка надто роздута, і насправді можна побудувати дешевий, але ефективний аналог ChatGPT. За один день DeepSeek став найпопулярнішим застосунком в AppStore в Сполучених Штатах.

«Це потужний землетрус у секторі штучного інтелекту, — вважає керівник відділу технологічних досліджень інвестиційної групи D.A. Davidson Гіл Лурія. — Усі дивляться на це і кажуть: «Ми не думали, що це можливо. І оскільки це можливо, ми повинні переосмислити все, що планували».

Переосмислення стало неприємним процесом для американських технологічних гігантів, чиї акції одразу ж впали в ціні. Особливо постраждала Nvidia — основний постачальник потужних графічних процесорів для навчання ШІ. За один день компанія, що боролася з Apple за статус найдорожчої в світі, втратила майже 600 мільярдів доларів вартості — рекорд в історії США.

Чому навчання DeepSeek коштувало в десятки разів менше, ніж ChatGPT (і чи насправді це так)?

За словами розробників DeepSeek, для його створення не знадобилися ні десятки мільйонів інвестицій, ні найсучасніші технології. Адже Китай, мовляв, не мав доступу до потужних версій мікросхем Nvidia з вересня 2022 року, коли США заборонили їхній експорт. Наразі є кілька версій того, що недоговорється в офіційних прес-релізах китайських розробників.

Навчання на даних OpenAI. За інформацією джерел Bloomberg, наприкінці 2024 року в Microsoft виявили, що великі обсяги даних були викрадені через облікові записи розробників OpenAI, які, на думку компанії, пов’язані з DeepSeek. Також в OpenAI повідомили Financial Times, що мають докази використання китайськими розробниками дистиляції, тобто навчання моделей штучного інтелекту на даних більш потужних систем (втім, як відмічає The Verge, ситуація досить іронічна, адже OpenAI сам «зробив величезний стрибок із своєю моделлю GPT, висмоктавши весь письмовий інтернет без згоди»).
Використання потужних мікросхем. В DeepSeek стверджують, що використали лише 2 тисячі чіпів Nvidia H800, отриманих до введення обмежень на експорт США (OpenAI каже, що для створення GPT-4 використано 25 тисяч потужніших мікросхем H100). Генеральний директор Scale AI Александр Ван вважає, що насправді DeepSeek використав 50 тисяч чіпів Nvidia H100, але замовчує це.
Неправдиві дані про витрати. Аналітики Bernstein підкреслили в дослідницькій записці, що загальні витрати DeepSeek на навчання моделі невідомі, але вони набагато перевищують 5,6 мільйони доларів, про які заявив стартап. Окрім того, витрати на навчання попередніх моделей взагалі не розголошуються.

Хто стоїть за DeepSeek?

Засновник DeepSeek — 40-річний підприємець Лян Веньфен. Він закінчив Чжецзянський університет за спеціальністю «інженер інформації та комунікацій», а у 2015 році став співзасновником хедж-фонду High-Flyer, який використовує штучний інтелект для аналізу фінансових даних та прийняття інвестиційних рішень.

Засновник DeepSeek Лян Веньфен

Першу модель ШІ компанія створила у 2016 році і відтоді розвивалася в цій сфері. За даними Financial Times, Лян почав накопичувати тисячі графічних процесорів Nvidia для тоді ще не названого проєкту ШІ у 2021 році — перед тим, як США обмежили їхній експорт.

У 2023 році Лян Веньфен заснував DeepSeek. Вже за рік компанія випустила свою першу велику мовну модель ШІ. Тоді в інтерв’ю підприємець казав, що сектор штучного інтелекту Китаю

«не може вічно залишатися послідовником. Часто ми говоримо, що між китайським і американським штучним інтелектом стоять один чи два роки, але справжня різниця полягає між оригінальністю та наслідуванням. Якщо це не зміниться, Китай завжди буде послідовником».

Втім, як і з багатьма китайськими онлайн-продуктами, виникають питання до безпеки та достовірності даних:

Інформація, яку видає ШІ, має відповідати лінії китайської компартії. Користувачі вже переконалися, що DeepSeek цензурує багато чутливих тем, зокрема, війну в Україні та різанину на площі Тяньаньмень.
Команда Wiz Research, яка взялася оцінити безпеку сервісу, за кілька хвилин знайшла пов’язану з DeepSeek загальнодоступну базу даних ClickHouse, що розкривала конфіденційну інформацію користувачів.
Згідно політики конфіденційності, DeepSeek зберігає дані користувачів на китайських сервісах і за запитом зобовʼязаний ділитися ними з місцевими спецслужбами. Тому сотні американських та європейських компаній, особливо таких, що повʼязані з державними органами, вже заблокували DeepSeek.

«Найбільше занепокоєння викликає потенційний витік даних моделі ШІ до уряду Китаю», — каже технічний директор Armis Надір Ізраель.

Чи може DeepSeek змінити стратегію розвитку штучного інтелекту?

Китайський стартап представив найновішу модель DeepSeek в день інавгурації Дональда Трампа, що навряд чи було випадковістю. Президент США, який виступає за розвиток штучного інтелекту, заявляв про інвестиції в приватний сектор у розмірі пів трильйона доларів, щоб побудувати більше центрів обробки даних і зберегти Сполучені Штати попереду Китаю в гонці ШІ. Ажіотаж навколо DeepSeek він назвав «дзвінком для пробудження» для американських компаній, які повинні зосередитися на «змаганні за перемогу».

Можливо, це змагання вимагатиме інших шляхів, ніж ті, якими йде технологічний бізнес в США. DeepSeek — принаймні, поки що — підірвав переконання, що єдиними способами розвитку штучного інтелекту є мільярдні бюджети, найсучасніші чіпи та гігантські центри обробки даних. Так, Meta повідомила, що цього року витратить на розробку ШІ понад 65 мільярдів доларів. Генеральний директор OpenAI Сем Альтман, минулого року заявляв, що індустрії штучного інтелекту знадобляться інвестиції в трильйони доларів.

Тепер в галузі замислюються, чи не є ці цифри перебільшеними. Один із провідних світових технологічних інвесторів Марк Андріссен назвав DeepSeek «одним із найдивовижніших і вражаючих проривів», які він коли-небудь бачив. А аналітики Stifel написали:

«Надзвичайна ефективність системи DeepSeek до та після навчання (якщо вона відповідає дійсності) ставить питання про те, чи можуть глобальні гіперскейлери (центри обробки даних. — Авт.) та уряди, які інвестували та продовжують інвестувати значні капіталовкладення в інфраструктуру ШІ, зупинитися, щоби розглянути інноваційні методології, які виявлені завдяки дослідженням DeepSeek».

Втім, поки топ-компанії та інвестори не роблять різких рухів.

Керівник Meta Марк Цукерберг, презентуючи фінансовий звіт за четвертий квартал, обгрунтовував мільярдні витрати на графічні процесори:

«Я продовжую думати, що значні інвестиції в капітальні витрати та інфраструктуру з часом стануть стратегічною перевагою». (Мається на увазі перехід від навчання ШІ до підвищення якості взаємодії з ним.) Те, чого DeepSeek вдалося досягти за відносно невеликі гроші, «тільки зміцнило наше переконання, що це те, на чому потрібно зосередитися», підкреслив Цукерберг.

Open AI як некомерційна організація не подає фінансові звіти, але продовжує залучати нові кошти. Поки всі обговорювали DeepSeek, OpenAI почав перемовини про новий раунд фінансування, результати якого можуть підвищити його оцінку до колосальних 340 мільярдів доларів (поточна оцінка — 157 мільярдів). Найбльшим інвестором, окрім Microsoft, має стати SoftBank, який збирається вкласти в OpenAI до 25 мільярдів доларів.