Дані з Twitter можуть стати відмінним матеріалом для навчання систем штучного інтелекту. Наприклад, американська мережа швидкого харчування Chick-fil-A недавно почала використовувати інформацію з постів у Твіттері, щоб виявити випадки отруєння в ресторанах мережі. Раніше в цьому році вчені Об’єднаного дослідницького центру (Joint Research Center) спільно зі Службою науки та інформації при Європейській комісії описали прототип системи, яка аналізувала дані про повені в реальному часі на підставі публікацій в Twitter.

Недавнє дослідження у сфері міської логістики (Unsupervised Machine Learning to Analyse City Logistics), очолюване командою фахівців Mines ParisTech показало, що аналіз твітів за допомогою алгоритмів машинного навчання дозволяє відстежувати основні тенденції в логістичній галузі міста. Особливо це стосується зон з низькими рівнями викидів і міських розподільчих центрів.

На думку експертів, основна роль логістики полягає в тому, щоб зробити товари і послуги доступними для споживача і ефективними для підприємства з точки зору витрат на обслуговування. Однак розробка ефективної стратегії дій вимагає діагностики галузі та аналізу. Щоб проаналізувати кожну логістичну ділянку, потрібно багато часу, при цьому необхідно враховувати безліч змінних (кількість транспорту на відрізку шляху в різний час доби, загальну ситуацію на дорогах, наявність машин для доставки і т.д.). Тут на допомогу логістам приходить машинне навчання: програма аналізує змінні, а потім групує дані так, щоб фахівці могли зрозуміти, який маршрут буде економічно вигідним, найбільш безпечним та інше.

Далі штучний інтелект шукає у соціальній мережі фрази за ключовими словами, наприклад, «міська логістика», «логістика останньої милі», «доставка», «транспорт», «міський транспорт», «перевезення» та інші. Зібрані твіти фільтруються системою, видаляється небажаний контент, в тому числі посилання на сторонні ресурси, сторонні символи, а також дубльовані записи, що не несуть корисної інформації.

Слова в останніх блоках тексту лематизуються – групуються так, щоб їх можна було аналізувати, як єдиний елемент, і об’єднуються в карту ознак. Потім фахівці проводять аналіз витягнутих даних за допомогою набору інструментів Natural Language Toolkit (NLTK) і програми для обробки символьних і статистичних даних на природній мові. Показник популярності кожного блоку даних розраховується за допомогою Valence Aware Dictionary і аналізатора настроїв VADER. Так, на основі 111 265 твітів, опублікованих в період між 2007 і 2018 роками, що містять ключові терміни міської логістики, експерти виявили, що найчастіше вживані фрази були пов’язані з працевлаштуванням, а не із запитом на послуги («комерційні водійські права», «робота»,«CDL»). Крім іншого, Канзас-Сіті – ключовий транзитний пункт для торгівлі в США – увійшов до п’ятірки найактивніших регіонів за обсягом діяльності, пов’язаної з перевезеннями.

Також, на думку перевізників, важливі виявити неозвучені проблеми або так звані «мертві зони» галузі. В даний час в США в достатній мірі розкриті питання безпеки дорожнього руху, витрат палива, транспортної структури в містах; в меншій мірі вирішена проблематика екологічних транспортних засобів, раціональних витрат ресурсів або навчання безпечному руху.

У методу аналізу твітів є свої мінуси: він не враховує рівень активності аккаунта і охоплення аудиторії. Незважаючи на недоліки, експерти Joint Research Center вважають Twitter простором можливостей для міських логістичних компаній через величезну популярність платформи.

Автор: Олена Семенчук


Читайте також:

Gatik AI та Walmart запускають унікальний сервіс доставки у сегменті «середній милі»

Роботизація автоматизованих процесів в логістиці: як AI впливає на галузь

Коментарi