Неземные просторы: Визуальная симфония
Prompt: The edge of the world
Ответ на пост «Эрдамон»
Не нашел как добавить видео, не создавая пост.
На то, чтобы сделать адекватно звучащую песню - ушло 2 гугл почты) и 15 минут времени в основном потраченные на прослушивание всех вариантов (и исправление орфографических ошибок в тексте)
Вот ссылка на песню :)
https://suno.com/song/941f9c45-5deb-4898-a000-9fc68b28191c
Смотрим различные генераторы изображений, от платных до бесплатных
Пример
Всем привет! Искусственный интеллект (ИИ) изменил различные отрасли благодаря своей способности анализировать огромные объемы данных и узнавать закономерности. Одно из самых интригующих применений ИИ - создание изображений. Генерируемые ИИ изображения используются в рекламе, развлечениях и других отраслях для создания уникальных и реалистичных визуальных эффектов. В этой статье мы сравним и оценим производительность шести популярных инструментов для создания изображений с помощью ИИ: ArtGenerator, Leonardo, Fusion Brain, Stable Diffusion XL Pipeline, Dezgo, и Fooocus v2.
Первое, что мы должны сделать, - это определить, какие системы мы будем тестировать. В нашем тестовом наборе будут включены такие системы, как ArtGenerator, Leonardo, Fusion Brain, Dezgo, Stable Diffusion XL Pipeline, Fooocus v2.
В качестве примера будет идти запрос с жалобным взглядом кота в сапогах (из Шрека). Будем смотреть, как ИИ справляется с абстрактными запросами.
Кот с сапогами
Он основан на мощной и продвинутой платформе SDXL и предоставляет 3 бесплатные генерации максимум по 2 изображения за раз (когда-то было 15).
На главной странице можно посмотреть на изображения сгенерированные другими пользователями и их запросами:
Уххх
Один из вариантов генерации:
Это отечественный ИИ-генератор, основанный на Stable Diffusion, бесплатно даётся генерация 300 изображений. Так жесть возможность делать запрос с использованием своих изображений и фото:
Один из вариантов генерации:
Имеет бесплатный тариф и ежедневно пополняемые 150 монет (токенов) на генерации, цена запроса зависит от модели. Так жесть возможность делать запрос с использованием своих изображений и фото:
Но результат не очень:
Бесплатная платформа, основана на модели Kandinsky 2.1 от Сбера, интерфейс для запросов и результат выглядит так:
Возможности использовать своё изображение в качестве запроса нет, но есть можно генерировать видео по запросам и вот что получилось:
Это бесплатный AI инструмент на базе Stable Diffusion для генерации и редактирования изображений с помощью текстовых подсказок и исходных изображений:
Вот вариант:
Stable Diffusion XL Pipeline
Бесплатная модель, взятая из данного поста, возможно запустить как на своём компьютере, так и через Colab. Возможности использовать изображения в качестве запроса нет. Итог моих запросов вышел не очень:
Таким только детей пугать
Fooocus v2
Бесплатная, основана на знаменитой Stable Diffusion XL, возможно запустить на своём компьютере, так и через Colab, взята и данного поста. При запуске через Colab необходимо подождать пока всё с качается и установится, пока появится ссылка:
Если ссылка не появилась, значит все ядра CUDA заняты и нужно попробовать попозже
При переходе необходимо нажать на 2 галочки, чтобы появилась настройка для генерации:
Есть множество стилей для генерации:
Так же использовать своё изображение для запросов:
Вот ещё несколько вариантов:
Заключение
В итоге, мне больше всего понравился из платного ArtGeneration.me, из бесплатного Fooocus v2. С абстрактными запросами они плохо справляются, но с использованием своего изображения, результат получается весьма неплохим.