«Український ChatGPT» для держструктур і бізнесу: скільки коштуватиме його розробка та на яких даних його навчатимуть

Що закладено в концепт національної LLM і до чого тут Марк Цукерберг

Олександр Борняков
Фото з особистого архіву

Минулого тижня Мінцифри презентувало запуск AI Center of Excellence – «першого в Європі центру для комплексної інтеграції ШІ в державу». Центр функціонуватиме як внутрішній підрозділ міністерства та розроблятиме й впроваджуватиме штучний інтелект у GovTech-проєкти, оборону, медицину, освіту та бізнес.

Одне із завдань на перший рік роботи – «розробити національну мовну модель LLM для державних сервісів». Заступник міністра цифрової трансформації Олександр Борняков у бліцінтерв’ю Mind відкрив деякі деталі.

– Ви оголосили про амбітне завдання – створення власної мовної моделі. Це має бути аналог ChatGPT, Gemini тощо?

– Насправді, не зовсім. ChatGPT – це інший рівень. Українська LLM може бути надбудовою над наявною системою, наприклад той же ChatGPT. Наразі розглядаємо, як спробувати побудувати вітчизняну модель на базі Llama від Meta.

Тобто українська LLM може використовувати ядро іншої мовної моделі. Втім на відміну від ChatGPT та інших ця модель має бути сфокусована на українських даних. Тож мова не про створення нової LLM з нуля, а про донавчання моделі, щоб дані, які до неї потрапляють, були українськими.

– Донавчатимете на даних держреєстрів?

– Швидше за все, насамперед це будуть загальнодоступні дані. Втім якщо ми будемо інтегрувати LLM у публічні сервіси, наприклад, у «Дію», то модель матиме певний доступ до деяких даних із реєстрів. Не думаю, що це буде реал-тайм доступ.

– Має бути дозвіл від власників цих даних: українських фізичних та юридичних осіб?

– Не думаю, що на цьому етапі ми готові надати доступ штучному інтелекту саме до зміни реєстрів, навіть до їх читання. Але певне вивантаження даних із реєстрів і потім навчання на цих даних можна робити, щоб ШІ ефективніше відповідав, консультував тощо.

Але до цього в нас є багато іншої роботи. Наприклад, аналіз законодавства за допомогою штучного інтелекту, який не передбачає доступу до реєстрів. Є купа ініціатив.

– З Meta вже є домовленості?

– У Meta дозволили використання Llama для оборонних цілей. Загалом же Llama – безоплатна open-source модель. Використовуй, скільки хочеш. Втім у Meta зацікавлені у співпраці, тож надали нам ресурси – консультантів, розробників, щоб допомогти розробити наші проєкти саме на базі Llama.

– Тобто на Мінцифри працюватимуть фахівці Цукерберга?

– Так. Допомагатимуть.

– Розробка та навчання з нуля Llama, ChatGPT тощо коштує мільярди доларів. А скільки коштуватиме донавчання української моделі?

– Точно не мільярди.

Поясню на прикладі Photoshop. Це програмне забезпечення, розробка й оновлення якого коштує дорого. Втім користувач може прийти та створити свої фільтри тощо. У нашому випадку йдеться про те саме. Творці Photoshop витратили мільярди, а користувачі прийшли уже на готове.

– Донавчання – небезплатна праця фахівців. Скільки це може коштувати?

– Наразі не можу сказати. Може бути і сценарій за прикладом Linux, який підтримується за рахунок ком'юніті. Тобто в нашому випадку, можливо, доєднаються спеціалісти та допомагатимуть із навчанням моделі. Це може взагалі нічого не коштуватиме.

– Тобто над розробкою української LLM будуть працювати не лише спеціалісти ШІ-центру Мінцифри?

– Я б сказав, що фахівці центру координуватимуть роботу, втім вони зможуть залучати й зовнішні ресурси. Будемо домовлятися з іншими компаніями, як із Meta. Є донори, уряди, яким цікаво долучитися.

– Наразі ШІ-центр функціонує на кошти донорів чи поки фінансується з держбюджету?

– Наскільки знаю, з держбюджету нічого не витрачається. А донори, як правило, надають ресурс. І це не гроші.

Нам ніхто не приносить мішки грошей. Співпраця побудована інакше: ми кажемо, що нам потрібні, наприклад, розробники – партнери їх надають. Скільки коштує їхня праця – не знаю.

– Чим буде корисною власна ШІ-модель для України?

– Вона буде доступною для всіх. Її зможе використовувати не лише держава, а й бізнеси. Як великі, так і маленькі компанії. Наприклад, інтернет-магазини для побудови власних сервісів тощо.

– Можлива монетизація з боку держави?

– Не думаю, що будемо брати гроші за користування. Такий сценарій навряд чи розглядатиметься.

Стежте за актуальними новинами бізнесу та економіки у нашому Telegram-каналі Mind.ua та стрічці Google NEWS