Премиальное программное обеспечение и практические уроки
Как реализовать приложения ChatGPT? Искусственный интеллект — это только начало. Каковы дальнейшие направления развития ChatGPT?
ChatGPT发展方向 веб3 之所以很难落地,是因为很难找到web3落地应用的解决方案。而 ChatGPT 则不同,那些依托于 ChatGPT 强大语言模型的应用很快就会更新迭代,最终会到用户的手中使用,这可能就是 ChatGPT 聊天机器人爆火的原因。ChatGPT 具有随机性,不可预测性与创造力更是突出了 ChatGPT 的不同。
Направление развития ChatGPT, объединяющее идеи, которые люди не могут воплотить в жизнь
Если в ChatGPT есть что-то удивительное — и оно явно превосходит возможности людей, — так это то, как плавно он объединяет разрозненные идеи в единое целое. Я имею в виду такие вещи, как:
Это, пожалуй, самое поразительное умение ChatGPT. Это не просто отличный инструмент, это единственный инструмент (наряду с другими LM), способный на такое. Даже людям, включая экспертов, хорошо разбирающихся в таких понятиях, как пузырьковая сортировка и гангстерские фильмы, это не так-то просто.
Вот ещё один пример. Я попросил ChatGPT написать сонет на тему Шекспира, используя нечётные строки для утреннего кофе и чётные — для туканов, но сохраняя при этом связность и непрерывность. (Любопытно, что Шекспир умер в 1616 году, а туканы были впервые таксономически описаны в 1776 году, что делает это стихотворение исторически невозможным.) Вот результат после нескольких попыток (даже схема рифмовки — ABAB CDCD EFEF GG — почти идеальна):
ChatGPT был обучен на огромном объёме текстовых данных, поэтому ожидается, что он будет понимать широкий спектр тем, каждая из которых так или иначе представлена в миллиардах его параметров. В каком-то смысле наш мозг работает схожим образом. Извлечение воспоминаний мало чем отличается от использования подсказки, чтобы заставить LM вывести что-то конкретное (заметьте, я провожу параллели не по структуре или даже функциональности, а по принципу).
Однако человеческий мозг изначально не способен гармонично сочетать любые две-три темы. Возможности ChatGPT «неоднородны» (потому что ошибки в нём совершаются по-разному). То, как он объединяет стили письма разных людей, разные темы или идеи, которые ранее не встречались вместе, создавая уникальные, семантически связные произведения, впечатляет. На мой взгляд, это воплощает творческую природу LM. Людям же, даже самым опытным, было бы сложно последовательно создавать такие сочетания. Наш мозг не очень хорошо подходит для этой задачи, а ChatGPT — да.
Этот феномен — следствие особенностей представления концепций в латентном пространстве ChatGPT. Подсказки позволяют нам обращаться к нему способами, недоступными человеческой памяти (по крайней мере, по желанию — кто знает, что мы могли бы извлечь из сознания человека, если бы могли использовать подсказки так же, как в ChatGPT).
Направление развития ChatGPT, изменение создаваемого вами контента
Люди умеют глубоко анализировать идеи, и именно здесь ChatGPT испытывает трудности. Именно поэтому я никогда не рекомендую его для написания подобных эссе, будь то электронное письмо, твит или книга.
Но я готов использовать его для конвертации между этими форматами. Единственное преимущество, которое я обнаружил в ChatGPT, — это рутинная административная работа.
Его лингвистическая форма великолепна, но связность ужасна (не говоря уже о том, что его результаты не отличаются ни новизной, ни увлекательностью). Он полезен для редактирования уже существующих вещей, но ужасен для создания новых, требующих хотя бы малейшей связи с реальностью.
Когда я говорю «конвертация между форматами», первое, что приходит на ум, — это вот этот образ, который я считаю очень практичным и безопасным:
Если мы экстраполируем эту идею на все остальное, мы увидим, что ChatGPT отлично подходит для резюмирования статей в виде маркированных списков (что я рекомендую делать для статей, которые вы пишете), переписывания абзацев в стиле Grammarly (но не написания их с нуля) или настройки контента на разных платформах (например, превращения статьи Substack в публикацию в LinkedIn, а затем в ветку в Twitter).
Ключ здесь — полная информация. Когда вы пишете или создаёте что-то, вы знаете об этом всё. ChatGPT безвредно каким-либо образом изменять контент, потому что если идея или концепция не соответствует вашему первоначальному замыслу, вы это заметите. Это также хорошо работает, когда вы являетесь экспертом в данной теме (хотя в этом случае, если вы обнаружите ошибку, вы будете сомневаться, кто её допустил — ChatGPT или автор).
Если вы читаете статью и хотите, чтобы ChatGPT её пересказал, возможно, у вас получится, но чем дальше вы от содержания (или знаний), тем сложнее будет обнаружить ошибки. Лично я бы рассматривал такой подход только к тому, что написал сам (я пока не пробовал).
Направление развития ChatGPT, модель ИИ-арта
Вы заметили, что мои обложки в последнее время стали лучше? ChatGPT гораздо лучше меня исследует скрытое пространство Midjourney. Дело не в том, что он умеет создавать хорошие подсказки, а в том, что он отлично разбирается в закономерностях. Все чистые модели глубокого обучения обладают этой способностью (по сути, это всё, что они делают — распознают закономерности), а разработка подсказок — это, в первую очередь, закономерности.
Чтобы получить качественные подсказки Midjourney от ChatGPT (GPT-3 работает так же хорошо при другой «полной загрузке»…), я описываю задачу, добавляю несколько примеров (подсказки с изображениями я получаю из ленты сообщества Midjourney), а затем указываю нужную тему. Вот подсказка, которую я сейчас использую:
«Напишите хорошее задание для системы искусственного интеллекта, которая создаёт изображения из текста (Midjourney). Изображение — это обложка статьи на [тема по вашему выбору].
Вот три типичных подсказки:
- «Огромное небо, всевозможные сверкающие воспоминания, сплетённые в огромное северное сияние, словно светящиеся листья, белые, оранжевые, невероятно красивые, прекрасное космическое искажение, красивые сумерки, освещение, как в кино, прекрасные поля, высокая чёткость, высокое качество, сверхдетализация».
- «Рыцарь-кот на коленях, портрет, изысканные доспехи, замысловатый дизайн, серебро, шелк, кинематографическое освещение, 4k».
- «Сверхчёткая, отмеченная наградами подводная фотография природы: женщина верхом на морском коньке с мерцающими градиентами, подсветкой, глубиной резкости, морским дном, пышной растительностью, частицами, солнечными лучами, кораллами, золотыми рыбками, подводная модная фотография, женщина верхом на морском коньке, сверхчёткая, отмеченная наградами фотография».
Вы можете использовать разные слова или понятия. Просто напишите одну подсказку.
Давайте посмотрим на несколько изображений. Для наглядности я буду использовать название одного из моих любимых музыкальных альбомов в качестве темы (в качестве заполнителя «тема» можно использовать практически что угодно):
Красота, замешанная на безумии The Weeknd
«Хаотичный вихрь неистовых цветов и узоров сливается в прекрасную, сложную бабочку, символизирующую красоту, скрытую за ней: драматическое освещение, высокое разрешение, абстрактный экспрессионизм». — Раздел 4
Назад в Black Rolling Stones
«Чёрно-белая стилизованная иллюстрация, изображающая гитариста, стоящего перед стеной усилителей, на фоне клубов дыма, словно они играют на концерте в андеграундном клубе. Одежда и гитара музыканта должны быть элегантными и стильными, а усилитель — большим и внушительным, создавая ощущение необузданной мощи. Используйте сочетание линий и штриховки, чтобы создать изображение в стиле графического романа, и добавьте ярко-красный акцент на гитаре для усиления эффекта». — Раздел 4
Почувствуй Джеймса Янга
«Эта абстрактная картина передает ощущение «чувства чего-то» посредством сочетания теплых и холодных цветов, сильных мазков, а также органических и геометрических форм. Фокус находится в центре, где чувство наиболее сильно, а фон размыт и мечтателен. Высокое разрешение, яркая и заставляет задуматься». — Раздел 4
Возможности дизайна безграничны. Вам не придётся ломать голову в поисках подсказок. Если вы находитесь в режиме исследования, ChatGPT может предложить интересные идеи, которые вы сможете адаптировать под свои цели.
Направление развития ChatGPT, помощь в создании текстового поля
ChatGPT по своей природе непредсказуем. Нельзя знать, что выведет чат-бот, пока он не завершит работу. А поскольку он ещё и ненадёжен (он не изначально создан для правдивости — его просто подкрепляют, чтобы он был правдивым), это значит, что невозможно предсказать, когда он выдаст что-то безумное.
Аспирант Гарварда Карим Карр опубликовал несколько твитов, которые придали дискуссиям позитивный оттенок. Я с ним согласен:
В этом контексте «исследование идеи» означает, что она не обязательно должна быть истинной (поскольку она может не подчиняться законам, управляющим нашим миром) и не имеет ограничений (т. е. произойти может все что угодно).
Вот несколько примеров того, где я хотел бы использовать ChatGPT (пока нет): мозговой штурм тем статей, названий и даже планов, а также рекомендации вещей, которые попадают в категории, подлинность которых я могу оценить (например, список подарков на сумму X долларов или список книг для дальнейшего чтения (учитывая мою недавнюю историю)).
Другие также находят ChatGPT полезным для творческого вдохновения. Карикатурист Чаз Саттон использует его для создания забавных комиксов, которые затем рисует (ещё один популярный пост на Medium в этом месяце). Гай Парсонс, исследующий в Твиттере модели искусственного интеллекта в искусстве, использует его для написания синопсисов и описаний персонажей к фильмам ужасов, которые затем публикует в Midjourney. Дженнифер Лепп, пишущая электронную книгу для Kindle о «поджанре паранормальных детективов», использует его для «названий и сюжетов».
Другой вопрос: где провести грань между правильным и неправильным, когда речь идёт о предоставлении ChatGPT возможности творить. Если он придумает цепляющий заголовок, то его использование допустимо, но написание абзаца — нет? Каждый из нас сам решает, как использовать ИИ, и я буду делать это взвешенно и с полной прозрачностью (по крайней мере, до тех пор, пока мы не достигнем точки — если это вообще произойдёт — когда ChatGPT будет считаться вовлечённым в процесс по умолчанию, как Grammarly. Тогда я решу, хочу ли я продолжать его использовать).
Направление развития ChatGPT, дальнейшее изучение языковых моделей
Использование ChatGPT для понимания того, как он работает, является ключевым приложением, которое косвенно влияет на все остальные приложения — хотя я должен признать, что это не так уж интересно для обычного пользователя.
Так же, как модели ИИ-арта не ведут себя как камеры, ChatGPT не ведет себя как калькулятор. Одна из причин этого — присущая им «необъяснимость» больших моделей глубокого обучения. Нет руководства, которое бы точно объясняло пользователям, что делать. С ChatGPT мы можем лишь извлекать поведенческие выводы путём дедуктивного эмпиризма (мы наблюдаем примеры поведения и делаем выводы).
Использование ChatGPT для изучения его особенностей само по себе довольно уникальное применение — я не знаю ни одного другого потребительского продукта, который попадал бы в эту категорию (по необходимости, а не по собственному выбору). Метод работы заключается в проведении серии экспериментов для проверки возможностей модели и формировании мысленной модели того, где она работает хорошо, а где — нет (Гэри Маркус и другие составляют документацию по ошибкам ChatGPT).
Моё тестирование не было особенно тщательным, но оно послужило для меня отличным источником вдохновения, чтобы продемонстрировать вам ограничения LM. Я написал пост, используя GPT-3, раскрыв его лишь в конце, где поменял местами результаты GPT-3 и J1-Jumbo, чтобы посмотреть, куда пойдёт обсуждение без моего вмешательства. Кроме того, я написал пост в соавторстве с Лексом, подчёркивая его неспособность приводить аргументы, согласующиеся с моими.
Насколько мне известно, Райли Гудсайд, который проделал большую публичную работу в этой области, исследовал GPT-3, ChatGPT и, совсем недавно, Claude, пожалуй, больше, чем кто-либо за пределами OpenAI и Anthropic. Он был одним из первых, кто открыл способы обхода фильтров безопасности ChatGPT и предложил методы своевременного внедрения, которые, хотя и потенциально опасны, могут предоставить компаниям, работающим с моделями, информацию об устранении недостатков, которые иначе могли бы остаться незамеченными. Подобные тесты — одни из немногих, которые мы можем использовать для лучшего понимания того, что происходит внутри моделей генеративного ИИ.