Китайський ШІ-бот DeepSeek обігнав ChatGPT і загрожує зробити революцію в галузі штучного інтелекту

Нова модель DeepSeek-R1 залежно від завдання вимагає в 20-50 разів менше витрат, ніж модель o1 від OpenAI

фото DR

Китайський стартап DeepSeek представив новий бот зі штучним інтелектом, який потребує в рази менше витрат, і при цьому багато в чому перевершує провідні американські розробки.

Джерело. Про це пише Reuters.

На компанію звернула увагу світова спільнота у сфері штучного інтелекту після публікації дослідження, де було розкрито витрати на навчання DeepSeek-V3: вартість використаних обчислювальних потужностей на базі чіпів Nvidia H800 становила менше $6 млн.

DeepSeek у понеділок обігнав свого конкурента ChatGPT і зайняв перший рядок за кількістю завантажень серед безкоштовних програм у магазині App Store Apple у Сполучених Штатах.

Це поставило під сумнів обґрунтованість рішень деяких американських технологічних компаній інвестувати мільярди доларів у штучний інтелект.

На тлі цих новин акції низки великих технологічних гравців, включаючи Nvidia, впали.

Після того як OpenAI вивела на ринок чат-бот ChatGPT наприкінці 2022 року, китайські технологічні компанії почали наввипередки розробляти власних роботів з використанням штучного інтелекту.

Випуск першого китайського аналога ChatGPT, створеного гігантом пошукових систем Baidu, викликав масове розчарування у Китаї через низьку якість.

Проте DeepSeek має значно кращі перспективи: за даними китайського стартапу, дві моделі – DeepSeek-V3 і DeepSeek-R1, які отримали високу оцінку як від керівників Кремнієвої долини, так і від інженерів американських технологічних компаній, не поступаються передовим моделям від OpenAI і Meta .

Використання цих моделей також економічно вигідніше. Представлена минулого тижня модель DeepSeek-R1 залежно від завдання вимагає в 20-50 разів менше витрат, ніж модель o1 від OpenAI.

При цьому DeepSeek вже зіткнулася зі звинуваченнями з боку американських конкурентів.

Генеральний директор Scale AI Александр Ван сказав в інтерв'ю CNBC, що DeepSeek має 50 000 чіпів американської Nvidia – H100, проте не надав доказів. На його думку, компанія приховує цей факт, оскільки він свідчив би про порушення встановленої Вашингтоном заборони на продаж подібних передових чіпів для штучного інтелекту китайським компаніям.

Аналітики Bernstein в понеділок наголосили, що загальні витрати на навчання моделі V3 компанії DeepSeek невідомі, але насправді значно перевищують $5,58 млн, про які повідомив стартап.

DeepSeek – це стартап, що базується в Ханчжоу, контрольним акціонером якого, згідно з китайськими корпоративними документами, є Лян Веньфен, один із співзасновників хедж-фонду High-Flyer.

Успіх DeepSeek вже помітили у найвищих політичних колах Китаю. За інформацією державного інформаційного агентства Сіньхуа, 20 січня, у день публічного запуску DeepSeek-R1, засновник компанії Лян Веньфен брав участь у закритому симпозіумі для підприємців під головуванням прем'єр-міністра Китаю Лі Цяна.

Присутність Ляна на цьому заході може вказувати на те, що успіх DeepSeek відіграє важливу роль у політиці КНР, спрямованій на подолання експортних обмежень Вашингтона та досягнення незалежності у стратегічних галузях, включаючи штучний інтелект.

Бекграунд. Як повідомлялося, OpenAI представила першого автоматизованого ШІ-агента – він здатний самостійно відвідувати різні вебсторінки й виконувати завдання.

Стежте за актуальними новинами бізнесу та економіки у нашому Telegram-каналі Mind.ua та стрічці Google NEWS