Лабораторія OpenAI презентувала нову версію популярного у світі ChatGPT – GPT-4. Що нового вміє робити АІ, розбирався Mind.
Очікування. За тиждень до презентації технічний директор Microsoft (інвестора OpenAI) в Німеччині Андреас Браун натякнув: нова версія зробить просто неймовірний прорив. Менеджер заявив, що GPT-4 стане мультимодальною. Тобто зможе перетворювати текст у відео, зображення, аудіо. Та навпаки – із аудіо «робити» текст.
У Microsoft навели приклад: кол-центр матиме змогу використовувати GPT-4 для переведення телефонних розмов між співробітниками та клієнтами в текст, що заощадить величезну кількість часу та зусиль, які раніше були б витрачені на узагальнення цих дзвінків після їх завершення.
Також для зручності користувачів планувалося запустили мобільний застосунок із GPT-4.
Реальність. «GPT-4 – найдосконаліша система OpenAI, яка створює безпечніші та корисніші відповіді», – із таким заголовком вийшов реліз нової версії на сайті OpenAI. Втім перевірити це наразі можуть не всі юзери: GPT-4 поки доступна лише для користувачів платного пакета ChatGPT Plus.
Тож що нового в GPT-4? За словами розробників, у нейромережі декілька вдосконалень. А саме:
GPT-4 став більш креативним і придатним для співпраці. Він може генерувати, редагувати та виконувати з користувачами творчі та технічні письмові завдання: створення пісень, написання сценаріїв або вивчення стилю письма користувача.
У GPT-4 розширені можливості аргументації.
GPT-4 перевершує ChatGPT, набираючи вищі приблизні процентилі серед учасників тестування.
У новій версії удосконалено знання мов, зокрема й української. «Дотримуючись дослідницького шляху GPT, GPT-2 і GPT-3, наш підхід до глибокого навчання використовує більше даних і обчислень для створення все більш складних і ефективних мовних моделей», – кажуть розробники.
GPT-4 безпечніший: має на 82% менше шансів надавати користувачу заборонений контент. «Щоб покращити роботу GPT-4, ми включили більше людських відгуків, у тому числі відгуків користувачів ChatGPT. Також працювали з понад 50 експертами», – пояснюють в OpenAI.
Найцікавіше у презентації – практичні кейси. В OpenAI розповідають, що почали співпрацювати з декількома компаніями – разом створюють інноваційні продукти з GPT-4. Та наводять приклади:
Morgan Stanley. Ця компанія підтримує бібліотеку контенту із сотнями тисяч сторінок даних та ідей: інвестиційні стратегії, дослідження ринку, коментарі аналітиків тощо. Цей величезний обсяг інформації розміщено на багатьох внутрішніх сайтах, здебільшого у форматі PDF, що вимагає від консультантів перегляду великої кількості інформації, аби знайти відповіді на конкретні запитання. Такий пошук може бути дуже трудомістким.
З минулого року Morgan Stanley почала досліджувати, як використовувати свій інтелектуальний капітал за допомогою пошуку GPT – спочатку GPT-3, а тепер GPT-4. «Модель забезпечить роботу внутрішнього чат-бота, який виконує комплексний пошук вмісту. По суті, є можливість миттєво отримати знання найобізнанішої людини в управлінні капіталом. Вважаємо, що це трансформаційна здатність нашої компанії», – говорить, керівник аналітики, даних та інновацій Morgan Stanley Джефф Макміллан.
GPT-4, як зазначає керівник його проекту, нарешті передав можливість розбирати всю цю інформацію в набагато більш зручний і дієвий формат.
Be My Eyes. Цей датський стартап з 2012 року створює технологію для допомоги незрячим та людям зі слабким зором. Продукт об’єднує їх із волонтерами, допомагає вирішувати різноманітні повсякденні завдання, як-от ідентифікація продукту чи навігація в аеропорту. У Be My Eyes вже 250 млн користувачів.
Так от зараз стартап розпочав розробку Virtual Volunteer на базі GPT-4 у застосунку Be My Eyes. «За той короткий час, що ми мали доступ, – побачили неперевершену продуктивність будь-якого інструменту розпізнавання об’єктів із зображенням у текст. У недалекому майбутньому спільнота сліпих і людей зі слабким зором використовуватиме ці інструменти не лише для цілого ряду потреб візуальної інтерпретації, але й для того, щоб мати більший ступінь незалежності у своєму житті», – розповідає гендиректор Be My Eyes Майкл Баклі.
Та пояснює: якщо надіслати зображення, скажімо, вмісту свого холодильника, – GPT-4 не лише розпізнає та назве, що там, але й екстраполює та аналізує, що можна приготувати з цими інгредієнтами. Варіанти використання практично необмежені.
Duolingo. Понад 50 млн учнів щомісяця використовують цей застосунок для навчання іноземної мови. Duolingo підтримує 40 мов у понад 100 курсах. Компанія почала юзати GPT-4, щоб удосконалити продукт двома новими функціями: запуску рольової гри «AI-партнер для спілкування» та пояснень, коли користувач робить помилку. «Ми хочемо, щоб функції на основі штучного інтелекту були глибоко інтегровані в застосунок і використовували гейміфікований аспект, який подобається нашим учням», – каже головний менеджер із продуктів Duolingo Едвін Бодж.