У сучасній цифровій економіці немає більш цінного активу, ніж дані. З’явився навіть усталений вираз для big data – «нова нафту». Сьогодні дані цінуються так високо, оскільки вони важливі для створення рішень для машинного навчання і штучного інтелекту. Навчання «розумних» систем (від призначених для користувача рекомендацій Netflix до самоврядних автомобілів Google) вимагає величезних масивів інформації. В результаті великі компанії борються за найякісніші дані, щоб сформувати «найрозумніший» ШІ. Навіть IBM та General Electric прагнуть заслужити репутацію «компаній даних», а фонд Vision SoftBank – найбільший і найвпливовіший інвестор в технології, не приховує, що big data – основний його інтерес і мотивація при пошуку і підтримки стартапів.

Але прогрес не стоїть на місці, і в світі технологій з’являються способи розробки поліпшених форм ШІ, які не потребують величезних масивів даних. Ці технології, на думку експертів, змінять розуміння поняття штучного інтелекту і, можливо, завдадуть серйозної шкоди раніше розробленим технологічним рішенням.

Синтетичні дані
Сьогодні для навчання моделей deep learning практикуючим фахівцям необхідно зібрати тисячі, мільйони чи навіть мільярди точок даних. Потім вони повинні прикріпити ярлики до кожної точки даних. Це дорогий і, як правило, ручний процес. І що, якби дослідникам не потрібно було ретельно збирати і маркувати дані з реального світу, а замість цього вони створили б точний набір даних з нуля?

Провідні технологічні компанії – від Nvidia до стартапів, таких як Applied Intuition – розробляють методи створення високоякісних даних, повністю цифрових, практично без витрат. Ці штучно створені набори даних адаптуються до потреб дослідників і містять мільярди альтернативних сценаріїв. Оскільки синтетичні дані наближені до реальних, вони демократизують ШІ, підриваючи конкурентну перевагу власних даних. Якщо компанія може швидко згенерувати мільярди байт реалістичних даних про водіння за допомогою моделювання, наскільки цінними є кілька мільйонів миль реальних даних про водіння? У світі, в якому data можна отримати за запитом, конкурентна динаміка галузі буде змінюватися. І оскільки в найближчі роки AI стане ще розумнішим, йому буде потрібно меншу кількість інформації для подальшого навчання.

Поетапне навчання
На відміну від сучасного ШІ, людям не потрібно вивчати тисячі прикладів, щоб зрозуміти нову концепцію. Наприклад, дитина може запам’ятати поняття «жираф» всього по одній картинці в книзі, але навіть найкращим системам глибокого навчання потрібні сотні або тисячі прикладів.

Щоб машинний інтелект дійсно наблизився до людського за своїми можливостями, він повинен вміти вчитися і міркувати так, як це роблять люди. Цей процес інженери називають «few-short learning» (дослівно «навчання в кілька пострілів» або ж поетапне). Прогрес у методиці був досягнутий в сфері комп’ютерного зору, коли вчені відкрили навчання в режимі «нульового пострілу» (з використанням тільки однієї, нульової точки даних).

У міру переходу методу малих даних з наукового в комерційне застосування зміниться і спосіб навчання І, отже, важливість big data в цілому знизиться.

Навчання з підкріпленням
Останній метод ШІ, що дозволяє домогтися значних успіхів без необхідності використовувати реальні дані – це навчання з підкріпленням. При такому вигляді навчання ШІ дізнається нове шляхом самонавчання, методом проб і помилок: системі дозволяють вільно експериментувати з різними діями в будь-якому середовищі, і вона поступово оптимізує свою поведінку, отримуючи відгуки про те, які дії правильні, а які ні. Одним з яскравих прикладів прогресу цього виду навчання став виграш AlphaGo Zero в го у людини. Система вивчила гру краще, ніж будь-хто з людей або машин і навіть перемогла версію AlphaGo в поєдинку.

Навчання з підкріпленням використовується в робототехніці, хімічної інженерії, рекламі і т.д. Замість того, щоб вимагати величезних раніше створених наборів даних, ШІ генерує свої власні дані, навчаючись в процесі дії.

Автор: Марина Шост


Читайте також:

Сінгапурський проект Apache SINGA: платформа глибокого навчання і аналізу великих даних

У Дубаї відкрився аналітичний центр кібербезпеки

Коментарi