Термін «великі дані» часто сприймається, як інформація, якою володіють технологічні компанії. Але в сучасному світі інформація знаходиться практично всюди. Компанія Nesta і PEC (Центр політики та фактів у творчій індустрії) провели дослідження на тему того, як за допомогою вивчення великих обсягів неконфіденційну даних можна проаналізувати гендерну представленість в творчих видах діяльності.

Гендерна приналежність раніше вимірювалася за допомогою опитування співробітників компаній. Але більшість опитувань не проводилися так довго, як це було б необхідно. Адже потрібно кілька років, перш ніж можна буде сказати, як змінився гендерний склад співробітників компанії. Крім того, опитування часто не виходять за рамки підрахунку числа жінок і чоловіків, а значить, не можуть показати, наскільки видатною була та чи інша група в різних видах творчості, і як саме вона вплинула на певну форму мистецтва.

Експерти PEC вивчили повідомлення засобів масової інформації про жінок в творчих галузях, зокрема, понад півмільйона статей газети The Guardian, опублікованих в період з 2000 до 2018 року (розділи «Кіно», «Книги», «Ігри», «Мода»). Виявилося, що за останні п’ять років кількість згадок про жінок в пресі значно зросла. З 2000 до 2013 року менше однієї третини гендерних займенників в статтях відносилися до жінок. Але в 2014 році ситуація змінилася і до 2018 року кількість згадок досягло 40%. А ось гендерна структура працівників креативної індустрії Великобританії в останні роки не змінилася.

Система ШІ також вивчила слова, пов’язані з займенниками «він» і «вона», щоб зрозуміти, як в ЗМІ зображують працівників творчих професій. Виявилося, що з жінками частіше пов’язували такі слова, як «сміх», «крик», «хихикання» і «бурчання», а також невербальні реакції, такі як «посмішка», «усмішка» або «кивок». Ці слова використовувалися нечасто, але завжди частіше по відношенню до жінок, ніж до чоловіків.

Слова, які стосуються творчих досягнень та лідерської діяльності, частіше характеризували чоловіків (наприклад, «він виконав», «він створив», «він направив»). Таким чином, гендерний дисбаланс в творчих професіях все ще присутній. В іншому дослідженні PEC використовував набір великих даних Британського інституту кінематографії (BFI), який містив рецензію на кожен повнометражний фільм, який потрапив в прокат. Після того, як BFI визначив стать людей за їхніми іменами, дослідники зрозуміли, що гендерний мікс на екрані не сильно змінився з часу закінчення Другої світової війни – у 2017 році жінки як і раніше складали всього 30% від загального акторського складу і 34% членів знімальних груп. Екранні персонажі також піддалися аналізу. Наприклад, з 2005 року тільки 16% «лікарів» грали жінки. В реальності жінки складають 46% від загальної кількості докторів в Великобританії.

Дослідники з Google у співпраці з Інститутом Джини Девіс, які займаються дослідженнями гендерних питань, використовували технологію розпізнавання осіб і мови, щоб показати, що в сотні найкасовіших фільмах в США щороку з 2014 по 2016 рік жінкам відводилося 36% в кадрі і 35% часу в діалогах.

На думку вчених, робота штучного інтелекту з вільними великими даними – це сучасний метод класифікації та статистики, розвитку якого слід приділити більше уваги.

Автор: Марина Шост


Читайте також:

Як обробка великих даних за допомогою ШІ допомагає будівельним компаніям

У Лондоні створили Sandbox – проект тестування і захисту особистих даних стартапів

Коментарi