DeepSeek презентував ШІ-модель нового покоління, яка працює швидше та дешевше за аналоги

DeepSeek презентував ШІ-модель нового покоління, яка працює швидше та дешевше за аналоги

Китайська нейромережа V4 навчилася мислити на рівні лідерів ринку при значно менших витратах на експлуатацію

DeepSeek презентував ШІ-модель нового покоління, яка працює швидше та дешевше за аналоги
McAfee

Розробник DeepSeek представив нове покоління своєї мовної моделі у двох варіаціях – бюджетній V4 Flash та просунутій V4 Pro.

Про це йдеться на сайті «Інтерфакс-Україна» з посиланням на DeepSeek.

Остання налічує 1,6 трлн параметрів і, за заявами компанії, не поступається найкращим закритим аналогам у програмуванні та логічному мисленні.

Ключовою особливістю новинки стала архітектура гібридної уваги, яка дозволяє опрацьовувати надвеликі обсяги даних обсягом до 1 млн токенів.

Головною перевагою V4 є суттєво нижча вартість експлуатації порівняно з конкурентами. Подальше здешевлення інференсу очікується у другому півріччі після переходу на обчислювальні потужності китайських чипів Huawei Ascend 950.

На тлі цих планів акції провідних виробників мікросхем SMIC та Hua Hong продемонстрували стрімке зростання на біржах.

Зараз стартап перебуває на стадії залучення інвестицій від технологічних гігантів Tencent та Alibaba.

Бекграунд. Раніше Mind повідомляв, що виробники ШІ Cohere та Aleph Alpha оголосили про злиття вартістю $20 млрд. Канадський і німецький розробники об'єднуються для конкуренції з американськими техногігантами.

У випадку, якщо ви знайшли помилку, виділіть її мишкою і натисніть Ctrl + Enter, щоб повідомити про це редакцію. Або надішліть, будь-ласка, на пошту [email protected]
Проєкт використовує файли cookie сервісів Mind. Це необхідно для його нормальної роботи та аналізу трафіку.ДетальнішеДобре, зрозуміло