Искусственный интеллект сегодня находится под пристальным вниманием общественности, ведущих бизнес-лидеров и правительственных структур во всем мире. Мы живем в эпоху инновационных технологий, которые определяют будущее. Но что же происходит за ширмой полемики – в мировых лабораториях и научно-исследовательских центрах, которые на самом деле устанавливают курс развития AI на последующее десятилетие? Ведущие эксперты отрасли изучили последние разработки технологов, определили ключевые тенденции и объяснили, почему они важны.

1. Теория глубокого обучения: демистификация работы нейронных сетей (CNN)

Что это такое?

CNN (convolutional neural network) – глубокие нейронные сети, теория применения которых появилась еще в 50-х годах, однако никто не понимал, как реализовать полноценно машинное обучение, и люди начали сдаваться. Впрочем, желаемые результаты все же были достигнуты. CNN работают, накапливая множество функций на каждом уровне, – начиная с поиска краев, затем фигур, а затем фактических объектов. Однако, ранее информация о пространственных отношениях всех функций терялась, и это заставляло ученых применять новые теории и схемы работы с цифровым массивом. Нынче же глубокие нейронные сети демонстрируют свою способность учиться, получая информацию не только из изображений, но и из текстовых и аудио данных. С каждым годом искусственный интеллект становится умнее, так как новые технологии позволяют применять методы глубокого машинного обучения. В результате сегодня нейронные сети могут не просто анализировать и систематизировать информацию, но и забывать или сжимать данные, которые менее важны для определенных целей, и выводить на первое место те, которые наиболее важны для получения целостного результата.

Почему это важно?

Точное понимание того, как работает глубокое обучение, способствует его более широкому развитию и применению. Например, может сделать более очевидным оптимальный выбор дизайна и архитектуры сети, обеспечивая при этом большую прозрачность для систем повышенной надежности или управляющих приложений. В ближайшем будущем ожидается больше результатов от исследования данной теории в рамках ее применения к другим типам глубоких нейронных сетей и ее разработке в целом.

2. Капсульные сети (CN): имитация показателей визуальной обработки мозга

Что это такое?

CN (Capsule Networks) – относительно новый тип глубоких нейронных сетей, которые обрабатывают визуальную информацию практически так же, как мозг, что означает возможность поддерживать иерархические отношения. Новая архитектура обеспечивает улучшенную точность в каждом следующем наборе данных. Этот набор был тщательно разработан, чтобы стать полноценной задачей распознавания формы. Если говорить детальнее, то в этом подходе используются небольшие группы нейронов – капсулы, которые составляют слои для идентификации объектов на видео или изображениях. Когда несколько капсул в одном слое принимают одинаковое решение, они активируют другую капсулу, находящуюся на более высоком уровне. Этот процесс продолжается до тех пор, пока сеть не сможет сделать вывод о том, что она видит. Каждая из этих капсул создана таким образом, что она обнаруживает в изображении определенный признак и распознает его в разных сценариях. Речь идет о способности распознавать объекты, даже если они перевернуты или показаны под другим углом.

Почему это важно?

CN уменьшил количество ошибок стандартных CNN на 45%. Благодаря новому подходу его сетям требуется меньше данных для распознавания объектов в новых ситуациях. В публикуемых отчетах видно, что капсульные сети не отстают от обычных, когда дело доходит до идентификации, к примеру, рукописных символов. Также они делают меньше ошибок при попытке распознать ранее увиденные объекты под разными углами. Безусловно, пока что рано говорить о том, смогут ли такие системы стать альтернативой традиционным нейронным сетям, но можно ожидать, что любители машинного обучения реализуют этот подход на практике и найдут ответ на этот вопрос.

3. Глубокое обучение с подкреплением (DRL): взаимодействие с окружающей средой для решения бизнес-задач

Что это такое?

DRL (Deep reinforcement learning) – тип нейронных сетей, которые учатся, взаимодействуя с окружающей средой посредством наблюдений, действий и вознаграждений. Обучение глубокому подкреплению использовалось для изучения игровых стратегий, таких как Atari и Go, включая известную программу AlphaGo, которая победила человека.

Почему это важно?

DRL, по сути, является наиболее универсальным из всех методов обучения, поэтому его можно использовать в большинстве бизнес-приложений. Он требует меньше данных, чем другие методы для обучения своих моделей. Кроме того, его можно обучить с помощью моделирования, что полностью исключает необходимость маркировки данных. Это большое преимущество, так что, вероятно, мы увидим новые бизнес-приложения, которые объединяют DRL и агентное моделирование, уже в текущем году.

4. Генерирующие состязательные сети (GAN): комбинирование нейронных сетей для стимулирования обучения и облегчения вычислительной нагрузки

Что это такое?

GAN (generative adversarial network) — тип системы глубокого обучения, которая не нуждается в «учителе». Она реализуется в виде двух конкурирующих между собой нейронных сетей. Одна сеть – генератор – создает поддельные данные, которые выглядят точно так же, как реальный набор данных. Вторая сеть – дискриминатор – обрабатывает подлинные и уже сгенерированные данные. Со временем каждая сеть улучшается, позволяя паре изучать весь дистрибутив этого набора данных.

Почему это важно?

GAN открывают большой диапазон возможностей для решения задач обучения без учителя, где помеченные данные не существуют или слишком дороги для получения. Они также уменьшают нагрузку, необходимую для реализации глубокой нейронной сети. Ожидается увидеть больше бизнес-приложений, таких как обнаружение кибератак с использованием GAN.

5. Обучение на неполных (LD) и дополненных данных: решение задач с маркированными данными

Что это такое?

Одна из проблем машинного обучения – доступность больших объемов маркированных данных, необходимых для системы, которая учится. Два метода могут помочь решить эту проблему: синтезирование новых данных(1) и перенос модели, подготовленной для одной задачи или области, – в другую(2). Такие методы, как передача обучения (передача знаний, полученных из одной задачи/области в другую) или одноразовое обучение (перенос обучения, происходящий лишь с одним или без соответствующих примеров) – и есть техника так называемого LD (Lean Data), обучения на неполных данных. Точно так же синтез новых данных посредством моделирования или интерполяции помогает получить больше данных, тем самым дополняя существующие данные для улучшения обучения.

Почему это важно?

Используя эти методы, мы можем решать самые разнообразные проблемы, особенно те, которые не имеют цельных входных данных. Предполагается, что уже вскоре мы увидим больше вариантов неполных и дополненных данных, а также различные типы обучения, применяемые для решения широкого спектра бизнес-задач.

6. Вероятностное программирование: «языки» для облегчения разработки модели

Что это такое?

Речь идет о высокоуровневом языке программирования, который существенно облегчает разработку вероятностных моделей, после чего автоматически «решает» эти модели. Вероятностные языки программирования позволяют повторно использовать библиотеки моделей, поддерживать интерактивное моделирование и формальную проверку, а также обеспечивать уровень абстракции, необходимый для создания общего и эффективного вывода в универсальных классах моделей.

Почему это важно?

Вероятностные языки программирования имеют возможность учитывать неопределенную и неполную информацию, которая распространена в бизнес-области. В перспективе мы увидим более широкое внедрение этих языков. Ожидается, что они также будут применяться к глубокому обучению.

7. Модели гибридного обучения: объединение подходов к неопределенности модели

Что это такое?

Различные типы глубоких нейронных сетей, таких как GAN или DRL, показали большие перспективы с точки зрения их производительности и широкого применения с различными типами данных. Однако модели глубокого обучения не моделируют неопределенность, как это делают «байесовские» и вероятностные подходы. Модели гибридного обучения сочетают в себе два подхода, чтобы использовать сильные стороны каждого из них. Некоторыми примерами гибридных моделей являются «байесовское» глубокое обучение, «байесовские» GAN и «байесовские» условные GAN.

Почему это важно?

Модели гибридного обучения позволяют расширить разнообразие бизнес-задач, включая глубокое обучение с неопределенностью. Это может помочь нам достичь лучшей производительности и объяснимости моделей, что, в свою очередь, будет способствовать более широкому их внедрению. Ожидается, что более глубокие методы обучения получат «байесовские» эквиваленты, а комбинация вероятностных языков программирования начнет включать глубокое обучение.

8. Автоматическое машинное обучение (AutoML): создание модели без программирования

Что это такое?

Machine Learning for Automated Algorithm Design (AutoML) – может автоматизировать рабочий процесс по разработке обучающихся моделей, используя ряд различных методов статистического и глубокого обучения, так как этот процесс изначально очень трудоемкий и требует наблюдения экспертов (подготовка данных, выбор функций, выбор модели или техники, обучение и настройка).

Почему это важно?

AutoML является частью того, что рассматривается как демократизация инструментов AI, позволяя бизнес-пользователям разрабатывать модели машинного обучения без глубокого программирования. Это также ускорит время, затрачиваемое учеными для создания моделей. В грядущем году ожидается увидеть больше коммерческих пакетов AutoML и интеграцию AutoML на более крупных платформах машинного обучения.

9. Цифровой двойник: виртуальные реплики за пределами промышленных приложений

Что это такое?

Цифровой двойник – это виртуальная модель, используемая для облегчения детального анализа и мониторинга физических или психологических систем. Концепция цифрового двойника возникла в мире производства, где широко использовалась для анализа и мониторинга таких вещей, как ветряные фермы или комплексные промышленные системы. Теперь, используя моделирование на основе агентов (вычислительные модели для моделирования действий и взаимодействия автономных агентов) и динамику системы (компьютерный подход к анализу и моделированию линий поведения), цифровые близнецы применяются к нефизическим объектам и процессам, включая прогнозирование поведения потребителя или покупателя.

Почему это важно?

Цифровые близнецы могут способствовать развитию и более широкому внедрению Интернета вещей (IoT), обеспечивая способ прогностической диагностики и поддержки систем IoT. В будущем ожидается более широкое использования цифровых двойников как в физических системах, так и в моделировании потребительского выбора.

10. Объяснимый искусственный интеллект (AI): задействование метода «черного ящика»

Что это такое?

Сегодня существует множество алгоритмов машинного обучения, которые фактически могут осязать, мыслить и действовать посредством различных приложений. Тем не менее, по сей день многие из этих алгоритмов считаются «черными ящиками», проливая слишком мало света на то, как они достигли подобных результатов. Объяснимый AI – это очередной шаг навстречу новым методам машинного обучения, которые создают более объяснимые модели, сохраняя при этом точность прогнозирования.

Почему это важно?

AI – объяснимый, доказуемый и прозрачный – будет иметь решающее значение для установления доверия к этой технологии и будет способствовать более широкому внедрению методов машинного обучения. Предприятия будут применять объяснимый AI в качестве требования или передовой практики, прежде чем приступать к широкомасштабному развертыванию технологий искусственного интеллекта, в то время как правительства смогут сделать объяснимый AI нормативным требованием в будущем.

 

Все права защищены. Ни одна часть статьи не может быть использована в интернете для частного или публичного использования без обязательного активной гиперссылки на сайт everest.ua.

 

Читайте также:

Дискуссии на тему AI в концепции «черного ящика» больше не актуальны

Тенденции AI в 2019 году: предметом повышенного внимания и потребления будет углубленное машинное обучение

Комментарии