Наш клієнт досліджує настрої іноземної аудиторії щодо війни в Україні, використовуючи в якості одного з головних джерел соцмережу X (колишній Twitter). Аналітикам потрібен був інструмент для автоматичного збору та класифікації десятків тисяч твітів щодо війни, пов’язаних з темами вторгнення, воєнних злочинів, біженців, санкцій, розширення НАТО тощо.
Здійснення такої аналітики вручну було занадто трудомістким і не дозволяло ухвалювати оперативні рішення. Кастомне AI‑рішення для класифікації твітів X мало розв'язати ці проблеми.



Клієнт звернувся до нас у пошуках можливостей ШІ, оскільки “ручна” аналітика соцмереж не дозволяла робити своєчасні та точні висновки щодо сприйняття війни англомовною аудиторією – а це вкрай важливо в умовах інформаційної війни. AI‑аналіз твітів про війну в Україні мав зробити можливим моніторинг динаміки суспільних настроїв в реальному часі, забезпечити об’єктивність і прозорість оцінок, а також знизити навантаження на специалистов.
Команда опрацювала запит клієнта, продумала архітектуру системи, підібрала відповідні NLP-моделі для аналізу тональності твітів X та технології для реалізації пайплайну/візуалізації. Організація робіт велась за методологією Scrum - з короткими спринтами та регулярними демо для замовника.
- Точне визначення тональності повідомлень
Система мала ефективно визначати тон дописів (позитивний, негативний, нейтральний), беручи до уваги контекст повідомлення та типові для соцмереж лексичні спотворення. Сучасні NLP-моделі не можуть надавати настільки глибокого аналізу “з коробки”, без додаткового навчання ти тонкого налаштування.
- Вимоги захисту даних та комплаєнсу
Аби працювати на західних платформах без юридичних, фінансових та репутаційних ризиків, продукт мав відповідати суворим вимогам Загального регламенту захисту даних ЄС (GDPR). Це диктувало для проєкту жорсткі обмеження в частині архітектури, логіки збору, збереження та обробки даних.
- Реалізація дружнього UX/UI та доступної візуалізації
Ефективний моніторинг війни в Twitter за допомогою AI вимагав не лише довершених алгоритмів, але і якісного інтерфейсу, що надасть результати складної аналітики у доступному та зручному для роботі форматі. Команда мала реалізувати веб-інтерфейс, що буде оновлюватись у реальному часі.
- Архітектура моделі та підхід до навчання
Для точної та миттєвої класифікації дописів ми застосували дві трансформні моделі: BART-large-MNLI (для класифікації тем) та DeBERTa-v3 (для аналізу настроїв). Обидві моделі натреновані на вибірці з понад трьох тисяч англомовних твітів, що маркувались вручну. Дописи збиралися за найбільш релевантними для клієнта хештегами, зокрема: #ukrainewar, #standwithukraine, #donbas, #nato, #invasion, #refugees, #putin, #zelensky тощо.
- Обробка та підготовка даних
Аби штучному інтелекту було що аналізувати, ми налагодили збір даних за допомогою Twitter API та масштабованого пулу акаунтів. На етапі попереднього відбору система фільтрує нерелевантні повідомлення за низкою критеріїв: спам, активність ботів, дублікати (як евристично, так і з використанням Pandas). Дописи також очищуються від усіх мультимедійних вкладень та зовнішніх посилань.
- Налаштування пайплайну та тренування
Для ML‑класифікації тексту в Twitter був реалізований пайплайн на Python з використанням бібліотек трансформерів HuggingFace, Pandas та Scikit-learn. Особливу увагу при налаштуванні розробники приділили метрикам Accuracy, F1-score, Precision та Recall, які перевірялись на валідаційних та тестових вибірках. Також застосовувалась перехресна валідація та подальший аналіз помилок на незалежних даних.
- Безпечне виведення та візуалізація даних
Для проведення класифікації твітів система зберігає лише текст дописів та анонімізовані хешем User ID – продукт зберігає анонімність користувача та повністю відповідає вимогам GDPR. Мовний DeBERTa/BERT‑аналіз твітів про війну здійснюється у пайплайні практично миттєво. Результат виводиться на універсальний веб-дашборд для аналізу тональності твітів: він дає змогу відстежувати розподіл дописів за тематикою та тоном, динаміку настроїв у розрізі днів/тижнів, сплески активності тощо.
Нове кастомне ШІ-рішення для геополітичної класифікації в Twitter серйозно змінило повсякденну роботу наших партнерів. Воно автоматизувало трудомісткий щоденний збір та аналіз десятків тисяч твітів, значно скоротивши час обробки даних і зменшивши навантаження на аналітиків.
Завдяки своїй гнучкій архітектурі платформа AI‑моніторингу війни в соцмережах безшовно інтегрувалась з внутрішніми аналітичними системами клієнта. Фахівці можуть без проблем відкрити дашборд на смартфоні та спостерігати за зміною трендів в реальному часі. Доступні open‑source NLP‑інструменти для Twitter у правильних руках забезпечують практично стовідсоткову точність аналізу контенту. Це робить платформу придатною для завдань інформаційної війни, що вимагає миттєвої реакції та релевантних даних.
Можливості продукту не обмежуються соцмережею X/Twitter. За потреби його можна з мінімальними зусиллями пристосувати до будь-яких інших майданчиків: Reddit, Telegram, YouTube тощо. Подібні можливості можуть виявитись неоціненними для редакторських колективів, OSINT-аналітиків, ЗМІ, аналітичних центрів тощо.
Високоякісний enterprise AI‑аналіз даних з соцмереж – це лише один з можливих сценаріїв впровадження технології. Можливості ШІ на цьому шляху практично безмежні, тож ми разом з нашими клієнтами робимо лише перші кроки в майбутнє.

ваш бізнес!