Big Data в ритейлі: впоратися з великим обсягом даних і продовжувати розвиток
Про практику та перспективи використання новітніх технологій
Ритейл в умовах війни, як і будь-який інший бізнес, стикається з новими випробуваннями та викликами. Попри це ринок тримається і продовжує працювати. Одним із викликів для ритейлу, як до війни, так і зараз, лишається необхідність оперувати великим даними. Зараз одним із найефективніших методів оперування великими даними є інструменти Big Data. Що представляє собою індустрія обробки великих обсягів інформації у сфері ритейлу зараз і як вона може вплинути на бізнес у майбутньому, розповів Mind голова BigData практик у Східній та Центральній Європі GlobalLogic Олександр Федірка.
Згідно з дослідженням GE Capital Retail Bank, приблизно 81% усіх покупців починає свої споживацькі мандри онлайн – у пошуках інформації про продукт. Відповідно зростає і ринок реклами: за прогнозами, витрати на просування продуктів у мережі з боку світових ритейлерів досягнуть $133,06 млрд уже 2024 року.
Тобто бізнес уже зараз змушений оперувати значними обсягами даних для ефективного маркетингу, правильного позиціонування продукту, розширення асортименту й збуту, а також прогнозування продажів і майбутніх споживацьких трендів. Враховуючи, що, за прогнозами ООН, 2050 року кількість населення планети становитиме 9,7 млрд людей (а з ним збільшиться і база споживачів), навантаження на ритейлерів у контексті обробки даних зросте ще більше.
Big Data – технологічне підґрунтя та ритейл
Засоби обробки великих даних почали шукати досить давно, і першими набули поширення такі методи оптимізації при масштабуванні бізнесу, як розділення трансакційних операцій (OLTP) та аналітичних операцій (OLAP). Ці техніки були реалізовувані великими постачальниками програмних рішень, – IBM, Oracle і Microsoft.
Проте проблематика Big Data завжди базувалася на принципі 3V – Volume, Velocity, Variety, тобто на обсязі даних, їх форматі та швидкості, з якою їх можна оновити, обробити або передати. І найбільшу з них проблему – масштабування даних – до певного моменту не могли розв'язати.
Усе змінилося разом із релізом першого продукту з відкритим кодом – екосистеми Hadoop. Цей інструмент зародився в Yahoo, і результатом його використання став той розвиток і похідне ПЗ, яке ми маємо зараз.
Саме дочірній ритейл-сервіс Yahoo Shopping (агрегатор пропозицій і знижок) почав використовував Hadoop. Адже складати таргетовані рекомендації для клієнтів і переводити траєрів у баєрів (tryers and buyers – категорії покупців, що вперше та постійно купують товар) у великих обсягах досить ресурсозатратно. Для цього необхідно виконувати алгоритми на спеціалізованому залізі та застосовувати вертикальне масштабування, тобто збільшувати потужності умовного ПК. Такий метод надто дорогий і має свої обмеження.
Проте нові можливості відкриваються при застосуванні горизонтального масштабування. Цей підхід дозволяє збільшувати ресурси завдяки об'єднанню в мережі доступних комп'ютерів, тим самим розширяти обчислювальні потужності із зростанням бізнесу. Саме для цього Yahoo і створили Hadoop.
Читайте також: Допомога ритейлу: рішення для збільшення прибутку в онлайн-2023
Big Data – у світі та Україні
Сучасний ритейл представляє собою набір сервісів. З боку бізнесу це фінанси, маркетинг, продажі, логістику тощо. А з технологічного погляду – перелік задач, які вирішуються різними інструментами. У цьому контексті Big Data надає ефективні інструменти для вирішення специфічного кола завдань.
Проаналізуємо діяльність сучасних великих ритейл-платформ і маркетплейсів – Amazon, Rozetka, Prom.ua. Усі вони давно не використовують єдиного типу бази даних, а створюють різні види сховищ під конкретні завдання.
За допомогою методів Big Data та Data Science ритейлери можуть сегментувати користувачів. Проте рекламодавцям уже не цікава сегментація за такими широкими критеріями, як стать, вікова категорія, середній дохід родини. Вони все частіше воліють таргетуватися за більш вузькими критеріями – поведінкою користувача на сайті, його звичками, уже купленими товарами, реакцією на рекламу та пристроями, що він використовує. Ба більше: деякі ритейлери навіть складають сегменти покупців за швидкістю пересування пальця по екрану смартфону.
Наукові підходи допомогають реалізовувати і сценарії MTA – multi touch attribution. Вони дозволяють поєднати інформацію щодо покупок користувача офлайн та дані про перегляд реклами онлайн.
Адже попри те, що всі покази реклами анонімізовані, у кожного користувача в інтернеті є цифровий відбиток – digital fingerprint.
Завдяки цій інформації можна знайти непрямий зв'язок між трансакцією на касі та цифровою ідентичністю, а також відстежувати, як показ реклами онлайн вплинув на рішення клієнта щодо покупки товару.
Сценарій, описаний вище, став можливим завдяки купівлі даних. Ритейл-мережі зазвичай роблять це на AdExchange-платформах – тих, хто показує рекламу. Таку інформацію можна знайти на платформах на кшталт Beeswax і Liveramp. Інший приклад – британська компанія Experian, яка оперує даними й заробляє на продажу неперсоніфікованої інформації. Тож тренд створити платформу на основі своїх даних та організувати інформацію як сервіс (DaaS, Data as a Service) набирає обертів.
Читайте також: Війна за дані: турбуємося про безпеку
Big Data в Україні
Малий та середній бізнес в Україні зазвичай використовує класичні конструктори магазинів, які зберігають дані в одній із двох найпопулярніших безкоштовних баз – MySQL або Postgres. Ці інструменти вже давно присутні на ринку і зазвичай не належать до Big Data, але за своє існування вони стали більш гнучкими й непогано адаптувалися до великих обсягів даних. Водночас необхідність обробки десятків гігабайтів інформації за їх допомогою може бути проблематичною.
На відміну від них найбільші ритейл-гравці в Україні – Rozetka, Hotline, Prom.ua, OLX – оперують значно більшими обсягами даних. Вони використовують методи Big Data, які досить відрізняються від закордонних, адже український ринок не дотягує до США, Азії або ЄС за обсягами обороту.
Проте завдяки меншій зарегульованості ринку зберігання й обробки даних, нашим ритейлерам набагато простіше реалізувати різні бізнес-сценарії.
Крім того, міжнародна інтеграція посприяє переходу нашого ринку ритейлу на стандарти ЄС при використанні Big Data.
Проблема збереження приватності даних
Витоки приватності даних трапляються регулярно – як серед великих гравців, так і в малому/середньому бізнесі. Законодавча база все більш детально вказує, як саме з ними поводитись і що взагалі вважати приватними даними.
Проте ритейлери враховують, що найчастіше джерелом витоку є людина, і тому використовують техніки для анонімізації інформації.
Big Data використовується в різних сегментах ритейлу
Ритейл-клієнти GlobalLogic часто надають запит на побудову єдиної платформи даних для різних брендів. Кожен із них базується на власному наборі технологічних рішень і баченні клієнта. Водночас така платформа має базуватися на сценарії Customer 360, тобто надавати компанії інформацію щодо покупок клієнта серед усіх брендів у портфоліо. Такий сценарій дозволяє скласти більш детальний портрет кінцевого споживача.
Для компанії, яка виробляє і продає smart-девайси, що інтегруються з хмарними сервісами, необхідна інша система. Особливо, коли інформація щодо продажів ведеться окремо в спеціалізованих CRM по типу Salesforce. Інструменти Big Data допоможуть об'єднати ці дані з інформацією з девайсів користувача. Також це допоможе краще оцінити його досвід користування вже придбаними продуктами й ефективніше продавати додаткові сервіси.
Також за допомоги технологій Big Data та наукового підходу Data Science/Machine Learning можна розв'язати класичну проблему ритейлу – прогнозування попиту. За таких умов, чим більше в наявності вхідних даних, тим точнішим буде прогноз.
З технологією Big Data стала можливою і обробка інформації в режимі реального часу. Це корисно при необхідності моментально згенерувати дані або інсайти за будь-якими подіями.
Як уже згадувалося, дані про швидкість руху пальця по телефону можна використати для реалізації показу реклами в предективному стилі (рекламодавці ще називають його programmatic).
Наприклад, якщо за рухом пальця ми розуміємо, що екран розбитий, можна показати користувачу рекламу ремонтного сервісу. Це можна зробити навіть до того моменту, як він почав шукати в інтернеті конкретні сервіси.
Окремо наголошу, що використання Big Data-рішень для обробки та інтеграції інформації може бути лише підготовкою до реалізації більш цікавих сценаріїв із використанням технік Data Science / Machine Learning. Скажімо таких, як сегментація, непряме об'єднання даних (fuzzy joining), рекомендаційні рушії, передбачення та прогнозування.
Читайте також: Big Data: як ритейлу втримати споживача
Big Data – це дорого, але є перспективи
Так, ці методи розв'язують проблему обробки даних при вертикальному масштабуванні, але нові сценарії потребують усе більше потужностей. Не кожен ритейлер може собі дозволити Big Data: сума TCO (Total Cost of Ownership) включає не лише вартість обчислювальних потужностей, а й витрати на спеціалістів, потенційні міграції тощо.
Оптимізувати витрати допомагають хмарні технології – AWS від Amazon, Azure від Microsoft, GCP від Google. Спочатку може здатися, що вони надто дорогі, однак при зростанні бізнесу, особливо малого або середнього, це найкраще співвідношення ціни та якості.
Big Data допомагає оптимізувати будь-який етап у циклу продажів, чи то маркетинг, клієнтський досвід або логістика.
У майбутньому ритейлери намагатимуться оптимізовувати TCO Big Data й постійно переглядатимуть стратегію build vs buy. Тобто вибирати – будувати платформу з нуля своїми силами або купувати продукт чи підписку на інструменти, які вже існують.
Автори матеріалів OpenMind, як правило, зовнішні експерти та дописувачі, що готують матеріал на замовлення редакції. Але їхня точка зору може не збігатися з точкою зору редакції Mind.
Водночас редакція несе відповідальність за достовірність та відповідність викладеної думки реальності, зокрема, здійснює факт-чекінг наведених тверджень та первинну перевірку автора.
Mind також ретельно вибирає теми та колонки, що можуть бути опубліковані в розділі OpenMind, та опрацьовує їх згідно зі стандартами редакції.