Как генеративный ИИ меняет работу WEZOM

Леся
Леся
Head of QA Department
5.0
27.10.2023
1444
0
12 минут

Трудно поверить, но прошел уже почти год с момента революционной презентации ChatGPT для широкой общественности. За этот очень короткий срок различные модели генеративного ИИ изменили мир, запустив новую волну трансформации во многих отраслях. Естественно, именно сфера IT стала одним из главных полигонов для тестирования и внедрения генеративного ИИ, изменяя устоявшиеся практики и подходы к работе. 

Команда WEZOM не стала исключением. В течение этого года большие языковые модели и генеративный ИИ постепенно находили свое место в наших внутренних процессах и впервые применялись в совершенно новых проектах. Сейчас мы расскажем о нашем опыте подробнее.

Какие существуют инструменті генеративного ИИ

Следует напомнить, что генеративный ИИ – это лишь одна из областей развития искусственного интеллекта, посвященная алгоритмическому созданию нового контента на основании уже имеющихся данных. Типичный и заметный пример реализации генеративного ИИ – большие языковые модели (LLM), обучающиеся на огромных массивах текстов для поиска в них типичных корреляций и паттернов. Так языковая модель учится "понимать" естественный язык и приемлемо отвечать на вопросы или запросы человека. 

По этому принципу генеративный ИИ может создавать практически любой контент: текст, изображение, аудио и видеоматериалы, программный код и прочее. Сегодня инструменты генеративного ИИ вроде DALL-E и Midjourney могут генерировать изображения приличного качества по одному только текстовому описанию, а большие языковые модели типа GPT и PaLM – пишут стихи или сниппеты кода по запросу человека.

Это революционные возможности, быстро нашедшие применение в образовании, бизнесе, науке, медицине, дизайне, креативных индустриях и прочих сферах. Сегодня все лидеры BigTech либо уже применяют и предлагают широкой публике собственные продукты на базе генеративного ИИ, либо ускоренными темпами разрабатывают их. После релиза ChatGPT в ноябре прошлого года Microsoft быстро внедрила модель GPT в свой поисковик Bing, создав полноценный поисковый чат. Тем временем Google тестирует чат-бот Bard, основанный на собственной большой языковой модели PaLM 2. Стоит упомянуть и об Adobe, развивающей собственное семейство моделей генеративного ИИ Firefly для креативных продуктов и дизайна. Благодаря Firefly в Photoshop появились новые "магические" функции, вроде расширения содержания изображения по одному только текстовому описанию. 

Но лидером в этой области, безусловно, остается корпорация OpenAI, которая и запустила ChatGPT. Кроме него, она предлагает целый ряд инструментов генеративного ИИ под различные задачи. В частности:

  • универсальная большая языковая модель GPT-4;

  • инструмент для работы с программным кодом Codex;

  • средство распознавания голоса Whisper;

  • инструмент для генерации изображений на основе текстового описания DALL·E;

  • CLIP – средство, генерирующее для любого изображения текстовое описание;

  • интерфейсы для создания музыки MuseNet и Jukebox.

Большинство из этих инструментов доступно для использования через API, которые можно подключить на большинстве современных языков программирования. На сайте OpenAI можно без проблем найти список доступных библиотек и подробную документацию. Интеграция происходит очень просто. А у некоторых инструментов есть еще и онлайн-интерфейс.

Какие преимущества предоставляют инструменты генеративного ИИ

Средства генеративного ИИ открывают перед креативными командами целый ряд новых возможностей. Они автоматизируют рутину, ускоряют поиск информации и предоставляют новые возможности создания и редактирования любого контента: от рекламных продуктов до научных статей и программного кода.

Организации из разных отраслей обращаются к этой технологии, чтобы получить ряд преимуществ:

  • Ускорение и усиление креативных действий. Генеративный ИИ существенно усиливает работу над новыми продуктами, материалами, дизайном. Он не сделает всю работу за человека, но может по крайней мере предоставить ряд шаблонов, примеров реализации задач и идей для проработки специалистами. 

  • Автоматизация и повышение производительности. Средства генеративного ИИ могут существенно повысить эффективность специалистов, оказывая поддержку поиску и структурированию информации. Например, языковые модели полезны в структурировании и редактировании текстов, автогенерации кода, визуализации текстовых данных, создании саммари на основе больших материалов.

  • Новые возможности в коммуникации. Возможности генеративного ИИ в понимании природного языка и обработке контента делают его ценным инструментом налаживания коммуникации с сотрудниками или клиентами компании. На основе генеративного ИИ можно создавать продвинутые чаты и виртуальные ассистенты, синтезировать цифровых аватаров, реализовывать возможности распознавания голоса, создание субтитров к видео и прочее.

     

И это лишь возможности, лежащие на поверхности, при этом с развитием технологии преимущества использования ИИ будут только приумножаться. Сегодня генеративный ИИ может рассматриваться как сложный электронный секретарь, но завтра ему, вероятно, можно будет доверить и более сложные задачи. 

Какими инструментами генеративного ИИ пользуемся мы?

На первых порах ChatGPT воспринимался нашими специалистами как интересная игрушка, а не рабочий инструмент. Но со временем возможности инструментов на базе модели GPT стали слишком ценны, чтобы их игнорировать. Сегодня инструменты ИИ стали неотъемлемой частью рабочего процесса в наших командах. Приведем в пример несколько кейсов: 

  • Наши менеджеры по продажам применяют GPT в качестве доступного цифрового ассистента – для мгновенного получения информации о тех или иных технологиях и направлениях разработки. Это хорошая альтернатива "гуглу", которая позволяет менеджерам лучше информировать клиентов о технологиях и объяснять им технические детали. 

  • SEO-специалисты используют в работе с GPT так называемые "промты" – алгоритмы запросов чата, позволяющие получить более точный ответ в необходимом для специалистов формате. Это ускоряет работу по оптимизации контента под поиск и продвижение сайтов. 

  • Программисты используют GPT для получения образцов готовых решений в виде кода для сложных задач. Конечно, полученный код обычно приходится править, но ИИ может задать вектор и концепцию решения проблемы, экономящую множество ресурсов при разработке. Мы рассматриваем и перспективу внедрения специализированных ИИ-ассистентов для написания кода. Например, Copilot X, построенный на модели GPT-4, предоставляет специалисту умного чат-бота и встраивается непосредственно в IDE.

Одним из наиболее перспективных новшеств от OpenAI стали плагины. Это специализированные API, которые могут создавать пользователи под свои нужды. Благодаря плагину модель GPT получает определенную дополнительную информацию и функционал. Например, с ним модель ИИ можно научить оперировать данными в сети: искать и структурировать данные, а при необходимости даже совершать определенные действия типа заказа товаров или генерирования и отправки электронных писем. В настоящее время плагины работают только в платной версии GPT-4.

Но существуют и общедоступные инструменты. К примеру, чат-бот Bing, встроенный в браузер Edge от Microsoft, очень помогает в работе с контентом для блогов, генерируя ответы на запросы авторов и предоставляя ссылки на первоисточники информации.

Внедрение инструментов ИИ в диджитал-продукты открывает множество новых возможностей для бизнеса наших клиентов. Мы недавно рассказывали, как использование генеративного ИИ позволило автоматизировать клиентскую поддержку для наших партнеров – производителя климатической техники Cooper&Hunter. В этом кейсе мы индивидуально реализовали новую VOIP-платформу и использовали модель Whisper для распознавания голоса. Раньше пользователям компании для консультации на "горячей линии" нужно было диктовать серийный номер своей техники по телефону, а менеджерам - записывать его и искать в базе данных вручную. Это занимало кучу времени. Но теперь ИИ мгновенно преобразует услышанный номер в текст для автоматического поиска по базе данных. Следовательно, качество и скорость сервиса выросло многократно.

Рекомендуем почитать
Какие преимушества дает индивидуальный софт?

Инвестировать в собственные технологии гораздо выгоднее, чем в чужие продукты. Только индивидуальное решение сможет удовлетворить все уникальные потребности вашего бизнеса.

Узнайте больше о разработке ПО

В одном из проектов наши специалисты изучают возможность использования модели DALL·E для редактирования размеров и пропорций изображений, загружаемых в систему пользователями. ИИ должен обеспечить такое редактирование без изменения качества и нежелательной обрезки изображения. 

Заменит ли ИИ программистов?

Возможности ChatGPT в генерации кода на распространенных языках программирования (JavaSript, Python и прочие) в свое время наделали немало шума. Ведь код обычно является работающим, или по крайней мере жизнеспособным. Это запустило дискуссию по поводу того, способен ли генеративный ИИ оставить разработчиков без работы?

Наш ответ – нет, в среднесрочной перспективе это невозможно. Никогда не стоит забывать, что мы говорим о сложной технологии автогенерации, способной только подражать уже готовым решениям. Генеративный ИИ не имеет собственных суждений или ответственности. В целом он действует по принципу "угадай следующий символ", хотя и руководствуется жесткими алгоритмами.

В качестве примера генеративный ИИ может "бредить" и выдавать ложные решения, выглядящие вполне компетентно, если не рассматривать их подробно. Именно поэтому использование ChatGPT в прошлом году запретили на популярном форуме для разработчиков StackOverflow. 

С помощью средств генеративного ИИ можно генерировать действительно удачные сноппеты кода, упростить подготовку технической документации и даже провести рефакторинг. Но для этого подобные инструменты должны оказаться в руках опытного специалиста.

Не стоит также забывать, что использование кода создает новые риски для стабильности систем и кибербезопасности. Результат работы ИИ всегда должны контролировать и оценивать люди. 

Так что же в итоге?

Пока еще рано говорить, что ИИ привнес в нашу работу настоящую революцию. Но он уже запустил существенные подвижки в рабочих процессах, годами остававшихся неизменными.

Наш первый опыт внедрения моделей генеративного ИИ в продукты для клиентов выглядит очень перспективно. Мы смотрим в будущее с восхищением – инструменты вроде распознавания голоса, генерации контента и компьютерного зрения позволяют создавать продукты с невиданным ранее уровнем автоматизации. Кто знает, как мир изменится в ближайшие 10 лет, если технологии ИИ будут развиваться такими же быстрыми темпами?

Леся
Про автора
Леся
Head of QA Department
Опыт работы 7 года
Руководитель отдела контроля качества (QA) и автор статей, обладает большим опытом и глубокими знаниями в области тестирования программного обеспечения. Ее статьи — ценный источник знаний, связанных с передовыми методиками и практиками QA, написанные в доступной и понятной форме.
Больше статей от автора
Как вам статья?
5.0
Проголосовало: 1
Давайте обсудим Ваш проект
Нажимая на кнопку “Отправить”, вы даете согласие на обработку личных данных. Подробнее
Комментарии
(0)
Будьте первыми, кто оставит комментарий
wezom logo
Остались вопросы?
Оставьте ваши контактные данные. Наш менеджер свяжется и проконсультирует вас.
Подписывайтесь на рассылку Айтыжблог
blog subscriber decor image
Хотите получать интересные статьи?
Нажимая на кнопку “Отправить”, вы даете согласие на обработку личных данных. Подробнее
Следите за нами в социальных сетях
Этот сайт использует cookie-файлы для более комфортной работы пользователя. Продолжая просматривать сайт, Вы соглашаетесь на использование cookie.