Штучний інтелект сьогодні знаходиться під пильною увагою громадськості, провідних бізнес-лідерів і урядових структур у всьому світі.  Ми живемо в епоху інноваційних технологій, які визначають майбутнє. Але що відбувається за ширмою полеміки – у світових лабораторіях і науково-дослідних центрах, які насправді встановлюють курс розвитку AI на наступне десятиріччя? Провідні експерти галузі вивчили останні розробки технологів, визначили ключові тенденції і пояснили, чому вони важливі.

1.  Теорія глибокого навчання: демістифікація роботи нейронних мереж (CNN)

Що це таке?

CNN (convolutional neural network) – глибокі нейронні мережі, теорія застосування яких з’явилася ще в 50-х роках, проте ніхто не розумів, як реалізувати повноцінно машинне навчання, і люди почали здаватися.  Втім, бажані результати все ж були досягнуті. CNN працюють, накопичуючи безліч функцій на кожному рівні. Починаючи з пошуку країв, потім фігур, а потім фактичних об’єктів. Однак, раніше інформація про просторові відносини всіх функцій губилася, і це змушувало вчених застосовувати нові теорії та схеми роботи з цифровим масивом.  Нині ж глибокі нейронні мережі демонструють свою здатність «вчитися», отримуючи інформацію не тільки із зображень, але і з текстових та аудіо даних. З кожним роком штучний інтелект стає розумнішим, так як нові технології дозволяють застосовувати методи глибокого машинного навчання. В результаті сьогодні нейронні мережі можуть не просто аналізувати і систематизувати інформацію, але й забувати або стискати дані, які менш важливі для певних цілей, і виводити на перше місце ті, які найбільш важливі для отримання цілісного результату.

Чому це важливо?

Точне розуміння того, як працює глибоке навчання, сприяє його більш широкому розвитку і застосуванню.  Наприклад, може зробити більш очевидним оптимальний вибір дизайну і архітектури мережі, забезпечуючи при цьому велику прозорість для систем підвищеної надійності або керуючих додатків. У найближчому майбутньому очікується більше результатів від дослідження даної теорії в рамках її застосування до інших типів глибоких нейронних мереж і її розробки в цілому.

2.  Капсульні мережі (CN): імітація показників візуальної обробки мозку

Що це таке?

CN (Capsule Networks) – відносно новий тип глибоких нейронних мереж, які обробляють візуальну інформацію практично так само, як мозок, що означає можливість підтримувати ієрархічні відносини. Нова архітектура забезпечує поліпшену точність у кожному наступному наборі даних. Цей набір був ретельно розроблений, щоб стати повноцінним завданням розпізнавання форми. Якщо говорити детальніше, то в цьому підході використовуються невеликі групи нейронів – капсули, які складають шари для ідентифікації об’єктів на відео або зображеннях.  Коли кілька капсул в одному шарі приймають однакове рішення, вони активують іншу капсулу, що знаходиться на більш високому рівні. Цей процес триває до тих пір, поки мережа не зможе зробити висновок про те, що вона бачить. Кожна з цих капсул створена таким чином, що вона виявляє в зображенні певні ознаки і розпізнає його в різних сценаріях. Йдеться про здатність розпізнавати об’єкти в цілому, навіть якщо вони перевернуті або показані під іншим кутом.

Чому це важливо?

CN зменшив кількість помилок стандартних CNN на 45%. Завдяки новому підходу його мережам потрібно менше даних для розпізнавання об’єктів у нових ситуаціях. В опублікованих звітах видно, що капсульні мережі не відстають від звичайних, коли справа доходить до ідентифікації, наприклад, рукописних символів. Також вони роблять менше помилок при спробі розпізнати раніше побачені об’єкти під різними кутами. Безумовно, поки що рано говорити про те, чи зможуть такі системи стати альтернативою традиційним нейронним мережам, але можна очікувати, що поціновувачі машинного навчання реалізують цей підхід на практиці і знайдуть відповідь на це питання.

3.  Глибоке навчання з підкріпленням (DRL): взаємодія з навколишнім середовищем для вирішення бізнес-завдань

Що це таке?

DRL (Deep reinforcement learning) – тип нейронних мереж, які навчаються, взаємодіючи з навколишнім середовищем за допомогою спостережень, дій і винагород. Навчання глибокому підкріпленню використовувалося для вивчення ігрових стратегій, таких як Atari і Go, включаючи відому програму AlphaGo, яка перемогла людину.

Чому це важливо?

DRL, по суті, є найбільш універсальним з усіх методів навчання, тому його можна використовувати в більшості бізнес-додатків. Він вимагає менше даних, ніж інші методи для навчання своїх моделей.  Крім того, його можна навчити за допомогою моделювання, що повністю виключає необхідність маркування даних. Це велика перевага, так що, ймовірно, ми побачимо нові бізнес-додатки, які об’єднують DRL і агентне моделювання, вже в поточному році.

4.  Генеруючі змагальні мережі (GAN): комбінування нейронних мереж для стимулювання навчання і полегшення обчислювального навантаження

Що це таке?

GAN (generative adversarial network) – тип системи глибокого навчання, яка не потребує «вчителя».  Вона реалізується у вигляді двох конкуруючих між собою нейронних мереж. Одна мережа – генератор – створює підроблені дані, які виглядають точно так само, як реальний набір даних.  Друга мережа – дискримінатор – обробляє справжні і вже згенеровані дані. Згодом кожна мережа поліпшується, дозволяючи парі вивчати весь дистрибутив цього набору даних.

Чому це важливо?

GAN відкривають великий діапазон можливостей для вирішення задач із навчання без вчителя, в яких помічені дані не існують або занадто дорогі для отримання. Вони також зменшують навантаження, необхідне для реалізації глибокої нейронної мережі.  Очікується побачити більше бізнес-додатків, таких як виявлення кібератак, з використанням GAN.

5.  Навчання на неповних (LD) і доповнених даних: вирішення задач із маркованими даними

Що це таке?

Одна з проблем машинного навчання – доступність великих обсягів маркованих даних, необхідних для системи, яка вчиться. Два методи можуть допомогти вирішити цю проблему: синтезування нових даних(1) і перенесення моделі, підготовленої для одного завдання або області, – в іншу(2).  Такі методи, як передача навчання (передача знань, отриманих з одного завдання/області в іншу) або одноразове навчання (перенесення навчання, що відбувається лише з одним або без відповідних прикладів) – і є техніка так званого LD (Lean Data), навчання на неповних даних. Так само синтез нових даних за допомогою моделювання або інтерполяції допомагає отримати більше даних, тим самим доповнюючи існуючі дані для поліпшення навчання.

Чому це важливо?

Використовуючи ці методи, ми можемо вирішувати найрізноманітніші проблеми, особливо ті, які не мають цілісних вхідних даних. Передбачається, що вже незабаром ми побачимо більше варіантів неповних і доповнених даних, а також різні типи навчання, які застосовуються для вирішення широкого спектру бізнес-завдань.

6.  Вірогідне програмування: «мови» для полегшення розробки моделі

Що це таке?

Йдеться про високорівневу мову програмування, яка істотно полегшує розробку ймовірних моделей, після чого автоматично «вирішує» ці моделі. Ймовірні мови програмування дозволяють повторно використовувати бібліотеки моделей, підтримувати інтерактивне моделювання і формальну перевірку, а також забезпечувати рівень абстракції, необхідний для створення спільного та ефективного виведення в універсальних класах моделей.

Чому це важливо?

Ймовірні мови програмування мають можливість враховувати невизначену і неповну інформацію, що зазвичай поширена в бізнес-області. У перспективі ми побачимо більш широке впровадження цих мов. Очікується, що вони також будуть застосовуватися до глибокого навчання.

7.  Моделі гібридного навчання: поєднання підходів до невизначеності моделі

Що це таке?

Різні типи глибоких нейронних мереж, таких як GAN або DRL, показали великі перспективи з точки зору їх продуктивності і широкого застосування до різних типів даних.  Однак, моделі глибокого навчання не моделюють невизначеність, як це роблять «баєсовські» і ймовірні підходи. Моделі гібридного навчання поєднують у собі два підходи – для того, щоб використовувати сильні сторони кожного з них. Деякими прикладами гібридних моделей є «баєсовське» глибоке навчання, «баєсовські» GAN і «баєсовські» умовні GAN.

Чому це важливо?

Моделі гібридного навчання дозволяють розширити різноманітність бізнес-задач, включаючи глибоке навчання з невизначеністю. Це може допомогти нам досягти кращої продуктивності і розуміння моделей, що, в свою чергу, буде сприяти більш масштабному їх  впровадженню. Очікується, що більш глибокі методи навчання отримають «баєсовські» еквіваленти, а комбінація ймовірних мов програмування почне включати глибоке навчання.

8.  Автоматичне машинне навчання (AutoML): створення моделі без програмування

Що це таке?

Machine Learning for Automated Algorithm Design (AutoML) – може автоматизувати робочий процес із розробки моделей, що навчаються. При цьому використовується ряд різних методів статистичного і глибокого навчання, так як на початку цей процес дуже складний і вимагає спостереження збоку експертів (підготовка даних, вибір функцій, вибір моделі або техніки, навчання та налаштування).

Чому це важливо?

AutoML є частиною того, що розглядається як демократизація інструментів AI, дозволяючи бізнес-користувачам розробляти моделі машинного навчання без глибокого програмування. Це також прискорить час, що витрачається вченими для створення моделей. У наступному році очікується побачити більше комерційних пакетів AutoML і інтеграцію AutoML на значно більших платформах машинного навчання.

9.  Цифровий двійник: віртуальні репліки за межами промислових додатків

Що це таке?

Цифровой двійник – це віртуальна модель, що використовується для полегшення детального аналізу і моніторингу фізичних або психологічних систем.  Концепція цифрового двійника виникла у світі виробництва, де широко використовувалася для аналізу і моніторингу таких речей, як вітряні ферми або комплексні промислові системи. Тепер, використовуючи моделювання на основі агентів (обчислювальні моделі для моделювання дій і взаємодії автономних агентів) і динаміку системи (комп’ютерний підхід до аналізу і моделювання ліній поведінки), цифрові близнюки застосовуються до нефізичних об’єктів і процесів, включаючи прогнозування поведінки споживача або покупця.

Чому це важливо?

Цифрові близнюки можуть сприяти розвитку і більш широкому впровадженню Інтернету речей (IoT), забезпечуючи спосіб прогностичної діагностики та підтримки систем IoT. У майбутньому очікується більш широке використання цифрових двійників як у фізичних системах, так і в моделюванні споживчого вибору.

10.  Зрозумілий штучний інтелект (AI): залучення методу «чорної скриньки»

Що це таке?

Сьогодні існує безліч алгоритмів машинного навчання, які фактично можуть відчувати, мислити і діяти за допомогою різних додатків. Проте, до цього дня деякі з цих алгоритмів вважаються фактично «чорними скриньками», проливаючи занадто мало світла на те, як вони досягли таких результатів.  Зрозумілий AI – це черговий крок назустріч новим методам машинного навчання, які створюють більш зрозумілі моделі, зберігаючи при цьому точність прогнозування.

Чому це важливо?

AI – зрозумілий, доказовий і прозорий – буде мати вирішальне значення для встановлення довіри до цієї технології і сприятиме ширшому впровадженню методів машинного навчання.  Підприємства будуть застосовувати зрозумілий AI в якості вимоги або передової практики, перш ніж приступати до широкомасштабного розгортання технологій штучного інтелекту, в той час як уряди зможуть зробити зрозумілий AI нормативною вимогою в майбутньому.

 

Всі права захищено. Жодна частина статті не може бути використана в інтернеті для приватного або публічного використання без обов’язкового активного гіперпосилання на сайт everest.ua.