X-AI Insight: искусственный интеллект для аналитики твитов о войне

X-AI Insight: искусственный интеллект для аналитики твитов о войне

X-AI Insight: искусственный интеллект для аналитики твитов о войне
Software
AI/GenAI
Ключевые результаты
100%:
автоматическая очистка и фильтрация контента в X/Twitter
GDPR:
полный комплаенс для западных платформ и защита анонимности пользователей
Резюме
Реализовали ИИ-систему для классификации настроений и тем постов в соцсети X
Industry:
Education
Location:
Ukraine
Status:
Завершен
Timeline:
2 месяца
Использованные услуги
Клиент
Независимая аналитическая компания, мониторящая общественное мнение о войне по тематике войны Украине

Наш клиент изучает настроения иностранной аудитории по поводу войны в Украине, используя в качестве одного из главных источников соцсеть X (бывший Twitter). Аналитикам нужен был инструмент для автоматического сбора и классификации десятков тысяч твитов о войне, связанных с темами вторжения, военных преступлений, беженцев, санкций, расширения НАТО и т. д.

Ведение такой аналитики вручную было слишком трудоемким и не позволяло принимать оперативные решения. Кастомное AI-решение для классификации твитов X должно было решить эти проблемы.

Предыдущая версия
Новая версия
Цели и задачи
Построить AI-платформу для автоматического сбора, очистки, тематической и эмоциональной классификации твитов на тему войны: в реальном времени, с удобной визуализацией.
01/
Автоматизировать сбор, анализ и фильтрацию англоязычных твитов о войне в Украине для мониторинга общественного мнения;
02/
Настроить NLP-инструмент для соцсетей о конфликтах, научить ИИ классифицировать контент по тематике и эмоциональной окраске;
03/
Предоставить команде исследователей удобный дашборд с визуализацией данных в реальном времени;
04/
Обеспечить соответствие платформы GDPR через анонимизацию данных и безопасную обработку информации.
vertical image 1
Рабочий процесс
Реализовали BERT/DeBERTa‑анализ твитов на тему конфликта, построили конвейер обработки данных и дашборд для визуализации
Проблема

Клиент обратился к нам в поисках возможностей ИИ, поскольку "ручная" аналитика соцсетей не позволяла делать своевременные и точные выводы о восприятии войны англоязычной аудиторией — а это крайне важно в условиях информационной войны. AI-анализ твитов о войне в Украине должен был сделать возможным мониторинг динамики общественных настроений в реальном времени, обеспечить объективность и прозрачность оценок, а также снизить нагрузку на фахівців.

Подход

Команда обработала запрос клиента, продумала архитектуру системы, подобрала подходящие NLP-модели для анализа тональности твитов X и технологии для реализации пайплайна/визуализации. Организация работ велась по методологии Scrum — с короткими спринтами и регулярными демо для заказчика.

ТОП - 3 трудностей с проектом
  • Точное определение тональности сообщений

Система должна была эффективно определять тон сообщений (положительный, отрицательный, нейтральный), с учетом контекста сообщения и типичных для социальных сетей лексических искажений. Современные NLP-модели не могут предоставлять столь глубокий анализ “из коробки”, без дополнительного обучения и тонкой настройки.

  • Требования защиты данных и комплаенса

Чтобы работать на западных платформах без юридических, финансовых и репутационных рисков, продукт должен был соответствовать строгим требованиям Общего регламента защиты данных ЕС (GDPR). Это диктовало для проекта жесткие ограничения в части архитектуры, логики сбора, хранения и обработки данных.

  • Реализация дружественного UX/UI и доступной визуализации

Эффективный мониторинг войны в Twitter с помощью AI требовал не только совершенных алгоритмов, но и качественного интерфейса, который предоставит результаты сложной аналитики в доступном и удобном для работы формате. Команда должна была реализовать веб-интерфейс, который будет обновляться в реальном времени.

Решение
  • Архитектура модели и подход к обучению

Для точной и мгновенной классификации постов мы применили две трансформерные модели: BART-large-MNLI (для классификации тем) и DeBERTa-v3 (для анализа настроений). Обе модели обучены на выборке из более чем трех тысяч англоязычных твитов, которые маркировались вручную. Сообщения собирались по наиболее релевантным для клиента хэштегам, в частности: #ukrainewar, #standwithukraine, #donbas, #nato, #invasion, #refugees, #putin, #zelensky и т. д.

  • Обработка и подготовка данных

Чтобы искусственному интеллекту было что анализировать, мы наладили сбор данных с помощью Twitter API и масштабируемого пула аккаунтов. На этапе предварительного отбора система фильтрует нерелевантные сообщения по ряду критериев: спам, активность ботов, дубликаты (как эвристически, так и с использованием Pandas). Сообщения также очищаются от всех мультимедийных вложений и внешних ссылок.

  • Настройка пайплайна и тренировка

Для ML-классификации текста в Twitter был реализован пайплайн на Python с использованием библиотек трансформеров HuggingFace, Pandas и Scikit-learn. Особое внимание при настройке разработчики уделили метрикам Accuracy, F1-score, Precision и Recall, которые проверялись на валидационных и тестовых выборках. Также применялась перекрестная валидация и дальнейший анализ ошибок на независимых данных.

  • Безопасное выведение и визуализация данных

Для проведения классификации твитов система сохраняет только текст сообщений и анонимизированные хэшем User ID — продукт сохраняет анонимность пользователя и полностью соответствует требованиям GDPR. Языковой DeBERTa/BERT-анализ твитов о войне осуществляется в пайплайне практически мгновенно. Результат выводится на универсальный веб-дашборд для анализа тональности твитов: он позволяет отслеживать распределение сообщений по тематике и тону, динамику настроений в разрезе дней/недель, всплески активности и т. д.

Команда проекта
Result
Автоматизированный AI-мониторинг политических твитов: точный и эффективный

Новое кастомное ИИ-решение для геополитической классификации в Twitter серьезно изменило повседневную работу наших партнеров. Оно автоматизировало трудоемкий ежедневный сбор и анализ десятков тысяч твитов, значительно сократив время обработки данных и уменьшив нагрузку на аналитиков.

Благодаря своей гибкой архитектуре платформа AI-мониторинга войны в соцсетях бесшовно интегрировалась с внутренними аналитическими системами клиента. Специалисты могут без проблем открыть дашборд на смартфоне и наблюдать за изменением трендов в реальном времени. Доступные open‑source NLP‑инструменты для Twitter в правильных руках обеспечивают практически стопроцентную точность анализа контента. Это делает платформу пригодной для задач информационной войны, которая требует мгновенной реакции и релевантных данных.

Results Reddit YouTube

Возможности продукта не ограничиваются соцсетью X/Twitter. При необходимости его можно с минимальными усилиями приспособить к любым другим площадкам: Reddit, Telegram, YouTube и т. д. Подобные возможности могут оказаться бесценными для редакторских коллективов, OSINT-аналитиков, СМИ, аналитических центров и т. д.

Высококачественный enterprise AI-анализ данных из социальных сетей — это лишь один из возможных сценариев внедрения технологии. Возможности ИИ на этом пути практически безграничны, так что мы вместе с нашими клиентами делаем лишь первые шаги в будущее.

Использованные технологии
Software
AI/GenAI
Если вы намерены действовать, мы готовы помочь!
Трансформируем ваш бизнес!
Получите детальное и понятное коммерческое предложение
Трансформируем
ваш бизнес!
Phone
Прикрепить файл
Нажимая на кнопку “Отправить”, вы даете согласие на обработку личных данных. Подробнее
г. Киев, ул. Андрея Верхогляда, 2а, оф. 440 (секция 2, этаж 23)
0 800 755 007
Бесплатно по Украине
@Написать
Пишите, договоримся!