Команда исследователей из Национального университета Сингапура (NUS) сделала ещё один шаг по формированию имиджа страны и присвоению государству масштабной роли в развитии технологии искусственного интеллекта и больших данных. Проект NUS с открытым исходным кодом – Apache SINGA – завершил прохождение стадии Apache Incubator в октябре 2019 года. В настоящее время он является первым проектом верхнего уровня (TLP, top level project) в Юго-Восточной Азии в рамках деятельности Apache Software Foundation. Это крупнейшее в мире сообщество по разработке программного обеспечения с открытым исходным кодом.

Теперь проект Apache SINGA входит в число ведущих инструментов с открытым исходным кодом, наравне с Apache HTTP Server и Apache Kafka. Последний предоставляет услугу анализа больших данных таким крупным компаниям, как Airbnb, LinkedIn, Netflix, PayPal, Spotify и многие другие. HTTP-сервер Apache является самым популярным веб-сервером в мире, и в настоящее время обслуживает 29% всех активных веб-сайтов в Интернете.

Компания Apache SINGA, возглавляемая профессором Оои Бенг Чином (Ooi Beng Chin), была создана Группой по исследованию систем баз данных (Database System Research Group) из Школы вычислительной техники при Национальном университете Сингапура (NUS) совместно с Университетом Чжэцзян и NetEase в 2014 году. Прототип системы был представлен в Apache Incubator в марте 2015 года, а первый официальный релиз был сделан в октябре того же года. С тех пор исследователи NUS получают поддержку от Национального исследовательского фонда Сингапура, Министерства образования и Агентства по науке, технологиям и исследованиям.

Профессор Оои подчеркнул, что в 2012 году был зафиксирован скачок спроса на платформы для глубокого обучения и анализ больших данных, но на общемировом рынке тогда не было эффективных рабочих платформ. Сегодня Apache SINGA является одной из самых влиятельных интеллектуальных платформ, которые оказывают воздействие на технологию глубокого обучения. Такое же значение Apache HTTP Servers ранее оказал на развитие серверов веб-сайтов.

Глубокое обучение – подмножество машинного обучения, в котором нейросеть используется для распознавания больших объемов данных. В то время как машинное обучение обычно требует от людей предоставления уже структурированных данных, глубокое обучение само по себе может упорядочивать необработанные данные. Например, при идентификации изображения кошки машинное обучение потребует участия человека, чтобы определить, что у кошки есть такие особенности, как усы, острые уши и лапы. Глубокое обучение сразу проанализирует несколько изображений кошек с помощью различных алгоритмов, чтобы определить все функции самостоятельно, имитируя деятельность мозга. Единственное важное неудобство глубокого обучения состоит в том, что для него требуется астрономический объем данных, который, в свою очередь, требует больших вычислительных мощностей.

Типичная централизованная система потребует наличия суперкомпьютера для обработки всей этой информации, и это неудобно для большинства организаций. Системный подход Apache SINGA устраняет потребность в одном суперкомпьютере и распределяет рабочую нагрузку на большое количество обычных компьютеров.
В настоящее время решение работает в таких секторах, как здравоохранение, банковское дело, финансы, разработка программного обеспечения и кибербезопасность.

Автор: Марина Шост


Читайте также:

В Дубае открылся аналитический центр кибербезопасности

Как Big Data меняют мир управления инвестициями

Комментарии