В этой статье в основном рассказывается, как использовать Амазонка Сервис машинного обучения SageMaker Notebook, простой хостинг Стабильная диффузия WebUIРазверните лёгкое, готовое к использованию приложение AIGC для работы с изображениями одним щелчком мыши. Используя сервис «инфраструктура как код» Amazon CloudFormation, вы можете быстро развернуть базовую среду, модели ИИ и интерфейс Stable Diffusion WebUI, помогая пользователям развернуть приложение ИИ для преобразования текста в изображение или изображения в изображение за 15–20 минут. Это решение подходит как корпоративным клиентам, проводящим предварительные исследования и быструю проверку приложений AIGC для работы с изображениями, так и небольшим командам, быстро разрабатывающим лёгкие приложения ИИ.Чтобы быстро провести практический эксперимент, отсканируйте QR-код в конце этой статьи, чтобы зарегистрировать учетную запись Amazon Web Services, получить облачные ресурсы на сумму 200 долларов США бесплатно и открыть для себя бесконечное очарование рисования с помощью ИИ.Официальный сайт Amazon Web Services:https://www.amazonaws.cn
Официальный сайт Amazon Cloud Overseas:https://aws.amazon.com/cn/
В настоящее время это решение обеспечивает генерацию изображений на основе Stable Diffusion 1.5, основанную на DreamBooth Обучение и рассуждения на основе изображений; техническая поддержка скриптов и расширений пока не предоставляется. Читатели могут продолжить следить за функциональной итерацией последующих решений.
● Это решение использует CloudFormation для развёртывания в один клик. Всего несколькими щелчками мыши вы можете быстро развернуть среду веб-приложений AIGC, ориентированную на работу с изображениями, в своей учётной записи Amazon. Простой и удобный интерфейс позволяет пользователям быстро освоить такие сервисы ИИ, как преобразование текста в изображение и преобразование изображений в изображение. ● Базовый экземпляр блокнота Jupyter управляется экземпляром блокнота Amazon SageMaker, что избавляет от необходимости беспокоиться о создании базовой среды (например, хранилища и сетевых подключений) или обслуживании базовой инфраструктуры.● Решение использует полностью управляемую модель службы Stable Diffusion AI (облегченная версия 1.5, включая два интерфейса: Stable Diffusion WebUI и InvokeAI), имеет хороший опыт использования проекта с открытым исходным кодом и поддерживает установку подключаемых модулей в соответствии с вашими потребностями для расширения сценариев использования (например, ControlNet).
● Пользователи могут использовать собственные данные изображений для точной настройки модели, а полученную модель можно быстро развернуть в режиме онлайн на узле вывода с помощью автоматизированных инструментов конвейера, что упрощает масштабные вызовы вывода изображений.
● Это решение имеет полностью открытый исходный код, и пользователи могут настраивать и разрабатывать модели и расширения в SageMaker Notebook в соответствии с потребностями своего бизнеса.
3.1 Блокнот Amazon SageMakerЭкземпляры Amazon SageMaker Notebook — это вычислительные экземпляры машинного обучения (ML), на которых запускаются приложения Jupyter Notebook. SageMaker управляет созданием экземпляров и связанных ресурсов. Используйте блокноты Jupyter в своих экземплярах Notebook для подготовки и обработки данных, написания кода для обучения моделей, развертывания моделей на хостинге SageMaker, а также тестирования и проверки ваших моделей.3.2 Модель стабильной диффузииStable Diffusion — это модель преобразования текста в изображение, совместно разработанная CompVis, Stability AI и LAION. Она обучается на большом наборе моделей изображений и текста размером 512×512 пикселей из подмножества LAION-5B. Пользователи просто вводят фрагмент текста, и Stable Diffusion быстро преобразует его в изображение. Пользователи также могут вставлять изображения или видео и обрабатывать их вместе с текстом.3.3 Пользовательский интерфейс3.3.1 Пример использования Stable Diffusion WebUI+ЖеньшеньТестСтабильная диффузия WebUI Это браузерный интерфейс для Stable Diffusion. Он предлагает множество функций, таких как txt2img и img2img, а также множество дополнительных обновлений, включая улучшения слияния моделей и улучшения качества изображений. Регулируя различные параметры, вы можете создавать различные эффекты, позволяя пользователям настраивать свои творения в соответствии со своими потребностями и предпочтениями. Он не только поддерживает генерацию изображений и использование различных моделей для достижения желаемого эффекта, но и позволяет обучать собственные модели. Stable Diffusion WebUI:https://github.com/AUTOMATIC1111/stable-diffusion-webui
На примере преобразования текста в изображение пользователи могут использовать подсказки в интерфейсе «txt2img» для создания желаемого изображения. Шаги следующие:
● Нажмите «txt2img», чтобы войти в интерфейс преобразования текста в изображение.
● Введите слово-подсказку в поле ввода слова-подсказки.
● Нажмите кнопку «Сгенерировать», чтобы создать изображение.
1. Создайте пару китайских влюблённых в 1990-х годах размером 512×512, генерируйте по 4 изображения за раз: Подсказка: Пара молодых китайских влюблённых в куртках и джинсах сидит на крыше, на заднем плане Пекин 1990-х годов, и можно увидеть здание напротив.2. Создайте погрудную фигуру римского солдата с ромашками на заднем плане размером 512×512 и сгенерируйте 4 изображения одновременно. Подсказка: Погрудная фигура римского солдата с ромашками на заднем плане.3.3.2 Пример использования InvokeAI+InvokeAI InvokeAI — это реализация Stable Diffusion, генератора изображений и текста с открытым исходным кодом. Он предоставляет оптимизированный конвейер с различными новыми функциями и опциями, упрощающими процесс генерации изображений.https://github.com/invoke-ai/InvokeAI
Подсказка: руины храма, лес, лестницы, колонны
Подсказка: Пара молодых китайских влюблённых в куртках и джинсах сидит на крыше, на заднем плане Пекин 1990-х годов, и можно увидеть здание напротив.3.4 Развертывание решения3.4.1 Этапы развертывания решения1. Войдите в консоль и переключите регион на us-east-1 в правом верхнем углу страницы консоли.
2. Введите Cloudformation в поле поиска сервисов и нажмите Enter.3. Создайте стек — Используйте новые ресурсы (стандартно) — Загрузите файл шаблона. Шаблон можно скачать по следующей ссылке: https://xiekl.s3.cn-northwest-1.amazonaws.com.cn/sd-webui.yml4. Введите имя стека. Рекомендуемый тип экземпляра — g5.2xlarge. Размер тома диска по умолчанию — 100 ГБ. Выберите тип WebUI. Значение по умолчанию — auto, что соответствует версии Stable Diffusion WebUI. Выберите версию WebUI 0316 и нажмите «Далее».5. Оставьте настройки по умолчанию и нажмите «Далее».6. Подтвердите конфигурацию (сохраните настройки по умолчанию), отметьте «Я подтверждаю...», нажмите «Отправить» и подождите 15–20 минут, пока развертывание завершится.3.4.2 Использование Stable Diffusion WebUI для генерации документовкартина 1. После создания стека дождитесь запуска ресурсов (примерно 20 минут). Когда статус стека станет «CREATE_COMPLETE», нажмите «Экспорт». В поле «Значение» выберите URL-адрес, соответствующий «Ключу» параметра «URL-адрес веб-интерфейса».2. Войдите в интерфейс WebUI, введите «Подсказка» и нажмите «Сгенерировать», чтобы создать изображение.3.4.3 Использование веб-интерфейса Stable Diffusionруководитьтренироваться(микроМелодия Вот как можно обучить собственные изображения с помощью Stable Diffusion WebUI.
1. Сначала создайте модель и перейдите на страницу DreamBooth.2. После успешного создания все будет так, как показано на рисунке ниже.3. Задайте параметры обучения и перейдите на страницу выбора, как показано на рисунке.4. На странице ввода задайте настройки, оставьте основные параметры по умолчанию и щелкните стрелку справа.5. Нажмите стрелку справа от кнопки «Дополнительно», чтобы развернуть вкладки. Выберите fp16 для смешанной точности и xformers для параметра «Внимание к памяти». Остальные параметры оставьте по умолчанию, как показано ниже.6. Перейдите на вкладку «Концепции» и укажите каталог, где находятся ваши примеры изображений, в поле «Каталог набора данных». Мы подготовили примеры изображений в каталоге /data/images, но вы также можете разместить в этом каталоге свои собственные файлы изображений.7. Прокрутите вниз и введите «фото собаки zxw» в поле «Экземпляр» и «фото собаки» в поле «Класс». Оставьте остальные параметры по умолчанию.8. Нажмите кнопку «Поезд» в верхней части страницы.9. Наблюдайте за ходом обучения на вкладке «Выход» справа и дождитесь завершения обучения.10. После завершения обучения нажмите кнопку обновления, в списке моделей появится только что обученная модель. Выберите только что обученную модель.11. Нажмите txt2img, чтобы перейти на страницу изображения Винсента. Введите Prompt, включая префикс zwx, чтобы просмотреть результаты.12. Ниже описано, как использовать собственные изображения для обучения. В результатах Cloudfomation нажмите ссылку NotebookURL.13. Как показано на рисунке ниже, нажмите sd-webui, чтобы открыть папку data/images/. Щёлкните правой кнопкой мыши по каждому файлу и удалите его.14. Щелкните Загрузить Нажмите кнопку «Файлы», чтобы загрузить собственные изображения в качестве обучающего набора. После загрузки повторите описанные выше шаги для завершения процесса обучения.
В этой статье кратко описывается, как использовать SageMaker Notebook, сервис управляемых блокнотов, для развертывания веб-интерфейса Stable Diffusion одним щелчком мыши, легко создавая удобную и быструю среду верификации для изображений, созданных с помощью ИИ. Это решение автоматизирует развертывание всего за несколько щелчков мыши. Благодаря управляемому сервису вам не нужно беспокоиться о настройке и поддержке базовой инфраструктуры, при этом вы можете пользоваться всеми преимуществами проекта с открытым исходным кодом. Вы также можете настроить модель, используя собственные изображения, подготавливая её к использованию в специализированных приложениях AIGC.- https://docs.aws.amazon.com/sagemaker/latest/dg/nbi.html
- https://jupyter-contrib-nbextensions.readthedocs.io/en/latest/
- https://github.com/AbdBarho/stable-diffusion-webui-docker
- https://github.com/AUTOMATIC1111/stable-diffusion-webui
- https://github.com/invoke-ai/InvokeAI
Чтобы быстро принять участие в практическом эксперименте, отсканируйте QR-код ниже, чтобы зарегистрировать учетную запись Amazon Web Services, получить бесплатно облачные ресурсы на сумму 200 долларов США и открыть для себя бесконечное очарование рисования с использованием ИИ: