ChatGPT: передова мовна модель, здатна підтримувати розмову та писати код

Євген

CBDO

5.0

14.02.2023

5849

Зміст:

Які функції є в ChatGPT?
Принцип роботи ChatGTP
Обмеження ChatGPT
Як це виникло
Замість висновку

ChatGPT останнім часом став справжньою зіркою соцмереж та новинних заголовків – цей чат-бот на основі штучного інтелекту здатний підтримувати бесіду та виконувати складну аргументацію – зовсім як жива людина. Крім того, він здатний писати тексти прийнятної якості й навіть генерувати код та верстати веб-сторінки.

Давайте обговоримо Ваш проєкт

Заповніть Ваші особисті дані.

Назву GPT можна розшифрувати як "попередньо навчений генеративний перетворювач" (Chat Generative Pre-trained Transformer). Третє покоління цієї мовної моделі було представлене розробниками OpenAI широкому загалу 30 листопада 2022 року. Вона призначена для надання відповідей, подібних до людських, на різні вхідні дані із застосуванням алгоритмів.

Дослідники штучного інтелекту знають про існування високоефективного мовного штучного інтелекту. Але у випадку з ChatGPT це вперше, коли такий потужний інструмент став доступним для широкого загалу через безплатний та зручний онлайн-інтерфейс.

Як висловився Варун Майя, CEO софтверної компанії Avalon Labs, ChatGPT дуже подібний до людини: "Він такий самий, як людина, за винятком того, що він абсолютно компетентний".

Нещодавно ChatGPT підкорив соцмережі вірусними відеороликами, де він пише вірші в стилі Шекспіра, розмірковує про філософські проблеми та виявляє дефекти в комп'ютерному коді.

Ці приклади варті уваги, адже вони настільки високого рівня, що схожі на твори людини. І при цьому ChatGPT - це навіть не найкращий ШІ; OpenAI, мабуть, розробляє досконалішу модель, яка стала доступною вже у 2023 році.

Це схоже на ранню еру Інтернету, ще в 1990-і роки, коли всі такі: Це прорив? Це не прорив…”, – продовжує Майя, CEO Avalon Labs, який займається створенням програмного забезпечення вже десять років. “Але тепер ясно, поза всяким сумнівом, це прорив. Це дуже інноваційно”.

Які функції є в ChatGPT?

Оскільки програмне забезпечення досі перебуває на етапі “інкубації”, наразі існує два типи користувачів: ті, хто використовує його функціонально (наприклад, дизайнер продукту, який використовував бота для створення повнофункціональної програми), й ті, хто використовує його для дозвілля (наприклад , для створення бота, що спілкується у стилі Шекспіра).

Ось деякі з його особливостей:

1. ChatGPT, який використовує мовну технологію GPT-3.5, був навчений на значній кількості текстових даних з кількох джерел.

2. ChatGPT бере участь у діалоговій взаємодії; цей стиль спілкування дозволяє боту:

Відповісти на будь-які додаткові запитання;
Визнавати свої помилки;
Заперечувати помилкові передумови;
Відхиляти невідповідні запити;
ChatGPT — споріднена модель InstructGPT, яку навчили дотримуватися вказівок для отримання інструкції та надавати вичерпну відповідь.

3. Але найважливіше – ChatGPT може генерувати складний код на Python та писати твори на задану тему на рівні студента університету, викликаючи побоювання, що ця технологія зможе рано чи пізно замінити собою такі професії, як журналісти чи програмісти.

4. Його база знань закінчується на 2021 році, ChatGPT часто дає неправильні відповіді, повторюється й не може відповісти на питання, що легко виправляється незначним перефразуванням питання.

Принцип роботи ChatGTP

Як і у випадку з InstructGPT, для навчання цієї моделі використовувалося навчання з підкріпленням на основі зворотного зв'язку з людиною (RLHF) з декількома незначними варіаціями у схемі збирання даних. Для навчання вихідної моделі використовувалося контрольоване налаштування, що дозволяє інструкторам штучного інтелекту бути одночасно як користувачами, так і помічниками ШІ під час спілкування. Інструктори мали доступ до прикладів письмових рекомендацій, щоб допомогти моделі у складанні відповідей.

Також знадобилися порівняльні дані, що містили щонайменше дві модельні відповіді, упорядковані за якістю, щоб побудувати модель винагороди для навчання з підкріпленням. Використовувалися взаємодії з чат-ботом, які виконували тренери з ШІ для отримання цих даних. Твердження, написане за таким зразком, обиралося випадковим чином, а в ньому обиралася низка потенційних висновків, й інструкторів штучного інтелекту просили їх оцінити. Проксимальна політика оптимізації може використовуватися для налаштування моделі з використанням таких моделей винагороди. Цикл цього методу повторювали багато разів.

Обмеження ChatGPT

З одного боку, ChatGPT дійсно здатний надавати відповіді, які виглядають дуже переконливо. Але з іншого боку, ця переконливість залежить від контексту.

Що входить до обмежень:

1. ChatGPT іноді дає відповіді, які виглядають обґрунтованими, але помилковими або нелогічними. Розв'язати цю проблему складно, оскільки:

наразі немає перевіреного джерела істини для RL-навчання;
модель стає обережною та відхиляє питання, на які може дати правильну відповідь;
контрольоване навчання призводить до того, що модель часто помиляється з відповідями, оскільки відповідь залежить від рівня знань саме моделі, а не демонстратора;

2. ChatGPT чутливий до повторних спроб відповісти на одне й те саме питання. Наприклад, якщо питання поставлене в один спосіб, модель може вдати, що не знає відповіді, але якщо питання поставлене в інший спосіб, модель може відповісти правильно.

3. Модель часто використовує непотрібні слова та фрази, наприклад, повторює, що це мовна модель, розроблена OpenAI. Ці проблеми викликані надмірною оптимізацією та похибками в навчальних даних (тренери віддають перевагу довшим відповідям, які здаються докладнішими).

4. В ідеальному сценарії модель має здійснювати уточнювальні запити у відповідь на незрозуміле введення даних користувачем.

5. Попри всю виконану роботу, аби змусити модель відхиляти невідповідні запити, іноді трапляються випадки, коли вона дає негативні інструкції або поводиться вороже. І хоча результати не завжди однозначні, використання API модерації дозволяє попереджати користувачів або навіть забороняти деякі категорії небезпечних матеріалів.

Як це виникло

У 2015 році Альтман, Маск та інші інвестори Кремнієвої долини створили OpenAI як некомерційну організацію, яка займається дослідженнями в галузі штучного інтелекту. Того ж 2015 року OpenAI змінив свій юридичний статус, ставши бізнесом з "обмеженим прибутком" - це означає, що він знижує прибутковість інвестицій після певного порога.

У 2018 році Маск залишив раду директорів через конфлікт інтересів, пов'язаний з OpenAI та дослідженнями автономного кермування, які виконувала Tesla. Проте він продовжує інвестувати й висловив ентузіазм з приводу дебюту ChatGPT. Він прокоментував це так: «ChatGPT страшно чудовий». ChatGPT – це вже не перший чат-бот зі штучним інтелектом. Багато компаній, й серед них Microsoft, експериментували з чат-ботами, але їм не щастило. Коли у 2016 році бот Microsoft Tay був вперше представлений широкому загалу, користувачі Twitter нібито протягом доби навчили його сексистським та расистським виразам, що врешті-решт призвело до його ліквідації.

Запуск у серпні BlenderBot 3 став першим кроком Meta в індустрії чат-ботів. За даними Mashable, цей бот, як і Тай, зазнав критики за поширення расової, антисемітської та неправдивої інформації. Зокрема, він зробив заяву, що Дональд Трамп переміг на президентських виборах 2020 року.

OpenAI застосувала Moderation API - систему модерації на основі штучного інтелекту, аби допомогти розробникам визначити, чи порушує мова політику компанії щодо контенту, спрямовану на бан шкідливих чи незаконних матеріалів. Це має запобігти сумнівним епізодам на кшталт попередніх. Але в OpenAI визнають, що їхня модерація досі стикається з проблемами й далека від ідеалу.

Замість висновку

Чи означає все це, що штучний інтелект керуватиме людством? Поки що ні, але Альтман з OpenAI переконаний, що ШІ не дуже й далекий від “людського” способу мислення. Однак для досягнення рівня оптимальної продуктивності моделі AI та ML потребуватимуть великої кількості “тренувань” та тонкого налаштування, яких можна досягти лише людськими зусиллями.

Рекомендуємо почитати

Технологічні тренди, що визначатимуть майбутнє

Наша стаття відкриє для вас передові технологічні інновації 2024 року!

Детальніше

Розробник також зазначив, що програмне забезпечення не завжди точно спрацьовує й може давати відповіді, які є або помилковими, або нелогічними, але здаються розумними чи заснованими на фактах, що може підтримувати розповсюдження неправдивої інформації.

Насамкінець слід підкреслити, що ChatGPT не може повністю зрозуміти нюанси усного та письмового мовлення людини. Його просто вчать вимовляти слова залежно від введення питання, проте йому бракує здатності повністю розуміти значення цих слів. Це означає, що порівняно з відповідями справжньої людини будь-які відповіді, які вона пропонує, ймовірно, будуть поверхневими та позбавленими глибини та розуміння.

Про автора

Євген

CBDO

Відповідає за розвиток нових ринків, стратегічні партнерства та формування проєктів на стику бізнесу й технологій. Вивів компанію на нові сегменти у США та Європі, збільшив середній чек і кількість стратегічних угод. Запустив 44+ рішень у логістиці, девелопменті, e-commerce та енергетиці. Вміє точно зчитувати потреби клієнтів і будувати ефективні моделі співпраці.

Більше статей від автора

Давайте обговоримо Ваш проєкт

Заповніть Ваші особисті дані.

Попередня стаття

Наступна стаття