Термин «большие данные» часто воспринимается, как информация, которой владеют технологические компании. Но в современном мире информация находится практически повсюду. Компания Nesta и PEC (Центр политики и фактов в творческой индустрии) провели исследование на тему того, как с помощью изучения больших объемов неконфиденциальных данных можно проанализировать гендерную представленность в творческих видах деятельности.

Гендерная принадлежность ранее измерялась с помощью опроса сотрудников компаний. Но большинство опросов не проводилось так долго, как это было бы необходимо. Ведь потребуется несколько лет, прежде чем можно будет сказать, как изменился гендерный состав сотрудников компании. Кроме того, опросы часто не выходят за рамки подсчета числа женщин и мужчин, а значит, не могут показать, насколько выдающейся была та или иная группа в разных видах творчества, и как именно она повлияла на определённую форму искусства.

Эксперты PEC изучили сообщения средств массовой информации о женщинах в творческих отраслях, в частности, более полумиллиона статей газеты The Guardian, опубликованных в период с 2000 по 2018 год (разделы «Кино», «Книги», «Игры», «Мода»). Оказалось, что за последние пять лет количество упоминаний о женщина в прессе значительно возросло. С 2000 по 2013 год менее одной трети гендерных местоимений в статьях относились к женщинам. Но в 2014 году ситуация изменилась и к 2018 году количество упоминаний достигло 40%. А вот гендерная структура работников креативной индустрии Великобритании в последние годы не изменилась.

Система ИИ также изучила слова, связанные с местоимениями «он» и «она», чтобы понять, как в СМИ изображают работников творческих профессий. Оказалось, что с женщинами чаще связывали такие слова, как «смех», «крик», «хихиканье» и «ворчание», а также невербальные реакции, такие как «улыбка», «усмешка» или «кивок». Эти слова использовались нечасто, но всегда чаще по отношению к женщинам, чем к мужчинам.

Слова, относящиеся к творческим достижениям и лидерской деятельности, чаще характеризовали мужчин (например, «он выполнил», «он создал», «он направил»). Таким образом, гендерный дисбаланс в творческих профессиях всё еще присутствует. В другом исследовании PEC использовал набор больших данных Британского института кинематографии (BFI), который содержал рецензию на каждый полнометражный фильм, попавший в прокат. После того, как BFI определил пол людей по их именам, исследователи поняли, что гендерный микс на экране не сильно изменился со времени окончания Второй мировой войны – в 2017 году женщины по-прежнему составляли всего 30% от общего актёрского состава и 34% членов съемочных групп. Экранные персонажи также подверглись анализу. Например, с 2005 года только 16% «врачей» играли женщины. В реальности женщины составляют 46% от общего количества докторов в Великобритании.

Исследователи из Google в сотрудничестве с Институтом Джины Дэвис, занимающимся исследованиями гендерных вопросов, использовали технологию распознавания лиц и речи, чтобы показать, что в сотне самых кассовых фильмах в США каждый год с 2014 по 2016 год женщинам отводилось 36% в кадре и 35% времени в диалогах.

По мнению учёных, работа искусственного интеллекта со свободными большими данными – это современный метод классификации и статистики, развитию которого следует уделить больше внимания.

Автор: Марина Шост


Читайте также:

Как обработка больших данных при помощи ИИ помогает строительным компаниям

В Лондоне создали Sandbox – проект тестирования и защиты личных данных стартапов

Комментарии