Що таке DeepSeek і чому він руйнує сектор штучного інтелекту (ШІ)?

admin 03 Feb. 2025 - 09:02

Ще 2-3 роки тому у наукових колах точилися дискусії щодо виявлення у працях типу "курсові", "дипломні", "дисертації" елементів штучного інтелекту (ШІ) з метою обходження плагіату, при цьому часто зміст тексту інтегрований з ШІ носив незрозумілий зміст. Сьогодні ж ШІ настільки модернізувався, що на основі його якісних властивостей, в цій галузі, певним чином, конкурують Сполучені Штати Америки та Китай.

Запуск китайським стартапом DeepSeek своїх останніх моделей штучного інтелекту, які, за його словами, є такими ж або кращими, ніж провідні моделі в Сполучених Штатах за незначну вартість, доволы несподіваний сюрприз для технологій в західному світі.

Компанія привернула увагу в глобальних колах штучного інтелекту після того, як минулого місяця написала в статті, що для навчання DeepSeek-V3 потрібно менше ніж 6 мільйонів доларів обчислювальної потужності чіпів Nvidia H800.

Assistant (AI)від DeepSeek на основі DeepSeek-V3 випередив конкурента ChatGPT і став найпопулярнішою безкоштовною програмою, доступною в Apple App Store у Сполучених Штатах.

Це викликало сумніви щодо мотивів рішення деяких американських технологічних компаній для інвестицій мільярдів доларів у штучний інтелект, на основі чого акції кількох великих технологічних гравців, на чолі з Nvidia, доволі зменшились у своїй вартості.

Нижче наведено деякі факти про компанію, яка струсить сектор штучного інтелекту в усьому світі.

ЧОМУ DEEPSEEK ВИКЛИКАЄ ЗАНЕПОКОЄННЯ?

Випуск OpenAI ChatGPT наприкінці 2022 року заінтересував для інвестицій у технологічний сектор доволі багато компаній.

Однак, станом на січень 2025 року якість і економічна ефективність DeepSeek перевернули цю історію з ніг на голову. Дві моделі, які були засипані похвалою керівників Кремнієвої долини та інженерів американських технологічних компаній, DeepSeek-V3 і DeepSeek-R1, відповідають найдосконалішим моделям OpenAI і Meta, заявив китайський стартап.

Вони також дешевші у використанні. DeepSeek-R1, випущений минулого тижня, у 20-50 разів дешевший у використанні, ніж модель OpenAI o1, залежно від завдання, згідно з публікацією в офіційному обліковому записі DeepSeek WeChat.

Але дехто публічно висловив скептицизм щодо історії успіху DeepSeek.

Генеральний директор Scale AI Александр Ван заявив під час інтерв’ю CNBC у четвер, не надавши доказів, що DeepSeek має 50 000 чіпів Nvidia H100, які, за його словами, не будуть розголошені, оскільки це порушить експортний контроль Вашингтона, який забороняє продавати такі передові чіпи штучного інтелекту китайській компанії. DeepSeek не відразу відповів на запит.

У понеділок аналітики Bernstein підкреслили в дослідницькій записці, що загальні витрати DeepSeek на навчання моделі V3 невідомі, але вони набагато перевищують 5,58 мільйона доларів, які стартап заявив, що витратили на обчислювальну потужність. Аналітики також повідомили, що витрати на навчання не менш відомої моделі R1 не розголошуються.

ХТО ЗА DEEPSEEK?

DeepSeek – це стартап із Ханчжоу, контрольним акціонером якого є Лян Веньфен, співзасновник кількісного хедж-фонду High-Flyer, згідно з корпоративними документами Китаю.

У березні 2023 року фонд Ляна оголосив у своєму офіційному обліковому записі WeChat, що він «починає знову», виходячи за межі торгівлі, щоб зосередити ресурси на створенні «нової незалежної дослідницької групи для вивчення суті AGI» (загального штучного інтелекту). DeepSeek було створено пізніше того ж року.

Розробники ChatGPT OpenAI визначають AGI як автономні системи, які перевершують людей у більшості економічно цінних завдань.

Невідомо, скільки High-Flyer інвестував у DeepSeek. Офіс High-Flyer розташований у тій самій будівлі, що й DeepSeek, і вона також володіє патентами, пов’язаними з кластерами чіпів, які використовуються для навчання моделей штучного інтелекту, згідно з китайськими корпоративними документами.

У липні 2022 року підрозділ High-Flyer повідомив у своєму офіційному обліковому записі WeChat, що володіє та керує кластером із 10 000 мікросхем A100.

ЯК ПЕКІН оцінює DEEPSEEK?

Успіх DeepSeek вже був помічений у вищих політичних колах Китаю. 20 січня, у день, коли DeepSeek-R1 було опубліковано, засновник Лян відвідав закритий симпозіум для бізнесменів та експертів, організований прем’єр-міністром Китаю Лі Цяном, повідомляє державне інформаційне агентство Сіньхуа.

Присутність Ляна на зустрічі потенційно є ознакою того, що успіх DeepSeek може бути важливим для політичних цілей Пекіна щодо подолання експортного контролю Вашингтона та досягнення самодостатності в таких стратегічних галузях, як ШІ.

Подібний симпозіум минулого року відвідав генеральний директор Baidu Робін Лі.

Такий перелік даних є важливим моментом щодо зміни парадигм участі AI, DeepSeek у наукових дослідженнях та написанні дисертацій з різних напрямів.

Привітання

Ви є тут

Що таке DeepSeek і чому він руйнує сектор штучного інтелекту (ШІ)?