Аналитическая платформа позволяет пользователям получать прямой доступ к необработанным, сложным данным по запросу и в режиме self-service управлять ими. Trifacta показывает более точные результаты за меньшее время, даёт возможность использовать больше данных в аналитических исследованиях и экспериментах, что приводит к результатам высокой точности
Фармаконадзор стал критическим этапом в программах клинической разработки после того, как на многие «лекарства-блокбастеры» (совокупный объем продаж таких препаратов в год превышает 1 млрд. долл.) были наложены миллиардные штрафы, а их реализация была прекращена. Правила контроля безопасности лекарственных средств стали строгими, а компании-производители уделяют огромное внимание своему статусу и репутации.
Среды больших данных, сочетающие в себе инструменты Hadoop, а также решения для обработки данных, такие как Trifacta и различные аналитические инструменты, позволяют организациям, производящим фармацевтические препараты, добавлять новый уровень к традиционному анализу безопасности. Это позволяет компаниям сокращать время на выявление нежелательных побочных эффектов от применения лекарств, соблюдать нормативные требования и снижать затраты.
Например, для анализа побочных эффектов (AE) аналитик может взять определенные наборы данных из озера данных Hadoop, получить к ним доступ, преобразовать и смешать их вместе, используя аналитическую платформу Trifacta для отслеживания/ прогнозирования побочных эффектов от конкретного лекарственного средства. Данные берутся из самых разных источников, например:
• базы данных агентств здравоохранения, такие как отчеты FDA о побочных эффектах или отчеты Uppsala Monitoring Centre;
• данные исследований (структурированные и неструктурированные);
• социальные сети (например, Twitter, Facebook).
В качестве примера можно использовать наборы данных FAERS (данные, которые FDA собирает, согласовывает и публикует в сети), для преодоления ряда препятствий. Общие проблемы обработки данных включают в себя:
Социальные сети, например, Twitter, также помогли идентифицировать неблагоприятные последствия приема препаратов. Тысячи записей, связанных с приемом лекарств, потенциально могут помочь выявить серьёзные и неизвестные побочные эффекты. Объединение набора данных FAERS с потоком в социальных сетях, таких как Twitter или Facebook, потребует значительного объема работы и времени для преобразования и использования комбинированных данных.
Используя Trifacta для выявления ранних предупреждений о проблемах после употребления препаратов, фармацевтическая компания в конечном итоге может получить реальную выгоду для бизнеса, а также качественные данные. Если обрабатывать такую информацию вручную, процесс может занять несколько месяцев.
Trifacta выполняет тот же объем работы за считанные часы. Платформа предоставляет аналитическим командам новый подход к решению задач обработки данных за счет новейших методов машинного обучения, визуализации, взаимодействия человека с этими инструментами. Таким образом, IT-команда, аналитики, бизнес-аналитики и специалисты по data science повышают продуктивность обработки данных, управляют результатами своей работы более эффективно.
Аналитическая платформа позволяет пользователям получать прямой доступ к необработанным, сложным данным по запросу и в режиме self-service управлять ими. Trifacta показывает более точные результаты за меньшее время, даёт возможность использовать больше данных в аналитических исследованиях и экспериментах, что приводит к результатам высокой точности. Также с помощью Trifacta аналитики могут проводить интерактивные исследования. Платформа предоставляет пользователю автоматическое визуальное представление данных на основе предполагаемого типа данных каждого атрибута данных. Например, географические элементы представлены в виде карт, а ориентированные на время элементы представлены в соответствии с общими иерархиями, такими как день, месяц, год и т. д. Каждый профиль является полностью интерактивным, поэтому пользователь может просто выбрать определенные элементы профиля, чтобы предложить варианты преобразования.
Каждое взаимодействие в Trifacta ведет к прогнозу – система оценивает данные, с которыми работает пользователь, а также конкретное взаимодействие, примененное к данным, чтобы затем рекомендовать ранжированный список преобразований.