Модель Qwen-Image-2512 (https://huggingface.co/Qwen/Qwen-Image-2512) теперь имеет высокий реализм людей, благодаря чему сильно снижена "искусственность", а также улучшена детализация лиц и возрастных признаков. Доработана детализация природы, дающая более точную прорисовку ландшафтов, воды, шерсти животных и текстур. В модели улучшили текст, позволяя создавать точное отображение текста в изображениях, правильную вёрстку и мультимодальную композицию.
В результате, согласно слепой оценке, модель теперь сильнейшая среди открытых и конкурирует с закрытыми.
В модели Qwen-Image-Edit-2511 (https://huggingface.co/Qwen/Qwen-Image-Edit-2511) улучшена согласованность, дающая снижение "дрейфа" изображения. Доработали сохранение персонажей, позволяя редактирование портретов с сохранением идентичности. Модель теперь точнее обрабатывает групповые фото благодаря улучшенной работе с несколькими людьми на снимке. Внутрь модели встроили LoRA популярных стилей (например, улучшение освещения), и теперь все они доступны "из коробки". Усовершенствован промдизайн, давая теперь более качественную генерацию и модификацию промышленных изделий. Есть ещё геометрическое мышление, с помощью которого модель глубже понимает геометрию.
Модель Qwen-Image-Layered (https://huggingface.co/Qwen/Qwen-Image-Layered) создана для разложения изображений на отдельные RGBA-слои. Это позволяет редактировать каждый слой (перекрашивать, перемещать, заменять, менять размер) независимо и без потери качества. Модель поддерживает разное количество слоёв и их рекурсивную детализацию, обеспечивая точное и последовательное редактирование.
Хотите освоить создание аниме-иллюстраций с помощью нейросетей? Это пошаговое руководство и наши советы помогут вам раскрыть потенциал современных технологий и добиться впечатляющих результатов. Искусственный интеллект сегодня способен распознавать и воспроизводить разнообразные художественные стили, что открывает путь к созданию оригинальных работ при минимальных временных затратах. Даже если отсутствуют навыки рисования в стиле аниме, теперь можно получать красочные, стильные изображения, соответствующие актуальным тенденциям. Использование нейросетей для генерации иллюстраций значительно ускоряет рабочий процесс, а также вдохновляет ИИ-художников на творческие эксперименты, позволяя проявить индивидуальность и расширить границы креатива.
Создание аниме-иллюстраций с помощью нейросетей: пошаговое руководство и советы
Инструкция по созданию аниме-иллюстраций с помощью нейросетей
Для начала выберите подходящую нейросеть, которая поддерживает генерацию аниме-иллюстраций в нужном формате. После этого поэкспериментируйте с разными настройками и художественными направлениями — так проще найти свой уникальный стиль, который будет радовать и мотивировать к новым проектам. Добавляйте в промты собственные детали и креативные идеи: такие авторские элементы сделают каждую работу неповторимой. Еще одна рекомендация — регулярно просматривать примеры работ других художников, чтобы находить вдохновение и совершенствовать навыки создания иллюстраций с помощью нейросетей.
Расширение возможностей рисования аниме с искусственным интеллектом
Современные нейросети, например Qwen, впечатляют мощью генерации аниме-артов и наглядно демонстрируют, как искусственный интеллект влияет на цифровое творчество. Благодаря им стало возможно создавать необычные изображения, экспериментировать со стилями и воплощать дерзкие идеи.
Работа с нейросетью для создания аниме-иллюстраций начинается с поиска вдохновения и продумывания сюжета, а затем переходит к визуализации персонажей и сцен. В этом материале подробно разобраны ключевые этапы взаимодействия с нейросетью — от появления задумки до реализации замысла в виде готовой картинки.
Как шаг за шагом создать аниме с помощью нейросетей
Шаг 1. Придумываем концепцию
Начальный этап — фундамент всей работы: именно здесь рождается персонаж и ставятся главные задачи для нейросети. Важно обдумать каждую деталь: какой будет цвет волос у героя, оттенок глаз, какие черты лица выделить, какую позу выбрать, каким сделать фон и в каком стиле оформить иллюстрацию.
Иногда именно маленькие нюансы меняют восприятие всей работы. Не бойтесь экспериментировать — аксессуары, необычные наряды, даже выражение лица могут придать герою яркости. Здесь фантазия не знает границ: нейросеть Qwen поддержит самые смелые задумки. Когда мысленный образ станет четким и живым, пора двигаться дальше.
Шаг 2. Пишем промт
Когда идея окончательно сформирована, опишите персонажа с максимальной детализацией. Важно не забыть про цвет глаз, длину и оттенок волос, стиль одежды и характерные черты внешности.
Укажите, чем занят герой: например, он может идти, широко улыбаясь, или задумчиво смотреть вдаль — именно такие детали создают нужную атмосферу.
Опишите место вокруг: городской пейзаж или таинственный лес — окружение оживляет картинку и задает настроение.
Чтобы промт получился уникальным, добавьте необычные стили — например, элементы киберпанка, готики или стимпанка. Это сделает героя особенным.
Каждая мелочь в промте влияет на итоговое изображение, поэтому пропишите все детали, которые важны для результата.
Шаг 3. Настраиваем нейросеть
Перейдите по ссылке и задайте параметры для работы с Qwen
В чате появится приветствие. Далее следуйте инструкциям на скриншотах, чтобы правильно выбрать настройки нейросети.
Шаг 4. Генерируем аниме-арт
Когда все параметры выставлены, отправьте свой промт (текстовое описание) в Telegram-бот и дождитесь, пока нейросеть создаст иллюстрацию.
Пример промта (по которому был создан арт для этой статьи):
<lora:1914845:1>, anime, illustration woman in black and blue costume, burlesque psychobilly style, gothic clothing bunny bodysuit, stunning gothic top model, ornate patterns, fine detailed lines, fishnet corset with choker, pale goth beauty, full body art, dynamic illumination and shadow
Рассмотрим подробнее, из чего состоит этот промт:
Красным отмечен LoRA-код — это своего рода компактный набор сведений для нейросети, задающий параметры генерации картинок в определенном стиле, например, в духе аниме.
Синие слова — это триггеры, которые подают сигнал алгоритму искусственного интеллекта: как только они встречаются, автоматически подключается библиотека LoRA для получения нужного результата.
Зеленым обозначаются заметки, которые любой пользователь вправе добавить прямо в промт. При создании картинок весь текст, начинающийся с #, игнорируется — удобно для пометок, сортировки и поиска нужных промтов в боте.
Полный перечень LoRA с пояснениями собран в галерее стилей нейросети Qwen. За примерами использования и дополнительными сведениями о LoRA стоит перейти по ссылке под стрелкой на скриншоте — она ведет на сайт Civitai.com, где подробно разбираются настройки выбранной LoRA.
Слияние аниме и нейросетей: перспективы искусства и искусственного интеллекта
Аниме и нейросети — это стремительно развивающиеся направления, которые все чаще взаимно обогащают друг друга.
Аниме славится своим узнаваемым визуальным языком, широким выбором жанров и продуманными сюжетами. В основе — яркие цвета, запоминающиеся персонажи и сложные истории, часто затрагивающие глубокие философские темы и эмоции.
Нейросети — мощный инструмент искусственного интеллекта, который уже меняет подход к творчеству. AI создает изображения, тексты, музыку, открывая художникам новые горизонты и вдохновляя на уникальные художественные эксперименты.
Сегодня творцы и аниматоры активно берут на вооружение нейросети для создания аниме-работ. Это заметно ускоряет процесс и расширяет палитру стилей, которые раньше казались недоступными. Алгоритмы могут изучить традиционное аниме и, сохраняя его дух, придумывать новых персонажей и фоны.
В итоге, симбиоз аниме и нейросетей открывает авторам свежие пути для самовыражения, а аудитории — новые впечатления. Такое взаимодействие развивается, формируя будущее анимации и искусства с поддержкой искусственного интеллекта.
Промты для создания аниме-картинок доступны без оплаты вгалереена нашем сайте.
Для демонстрации стилей я буду стилизовать это изображение капибары:
Стилизовать я буду при помощи модели Qwen-Image-Edit-2509.
Стиль 1:
объёмные формы с мягкой светотенью, масляная текстура, частичная 2D-плоскость для отдельных объектов, градиентные переходы цвета, сочетание 3D-глубины и живописной 2D-стилизации, академическая живопись, высокая детализация текстур, высокое качество, профессиональная художественная композиция, приглушённая цветовая палитра с акцентами, частичное размытие краёв для объёма, динамичные масляные блики, контраст матовых и глянцевых поверхностей.
Стиль 2:
плоские тени, абсолютно чёрно-белый, лайн-арт, без цветов, только чёрный контур, плоский мультфильм, эскиз чёрным пером, тонкие линии, белый фон, преобладает белый цвет, высокая детализация, высокое качество, 2D.
Стиль 3:
плоский векторный стиль, толстые контуры, минималистичные детали, ограниченная палитра цветов, градиенты для объема, отсутствие теней, чистый белый фон, графический дизайн, без текстовых подписей.
Стиль 4:
аниме-иллюстрация с высокой детализацией, драматическим освещением, контрастной цветовой палитрой (тёмные тона с акцентами красного и золотого), сложной текстурой материалов (металл, ткань, кожа), мягкими тенями, стилизованными линиями контуров, глубоким композиционным фокусом на центральном объекте, мрачной атмосферой, элементами готического дизайна и кинематографической постановкой.
Стиль 5:
аниме-стиль, яркая цветовая палитра, четкие контуры, мягкие градиенты, объемные тени, акцент на глазах, стилизованные волосы, минималистичный фон, пастельные оттенки кожи, детализированные блики в глазах, симметричное композиционное построение, плоскостная глубина, характерные для аниме пропорции лица, использование хэйрспрайнов, слегка растушеванные переходы, мультяшная выразительность.
Стиль 6:
пиксельный, низкое разрешение, квадратные пиксели, ретро-видеоигровой, ограниченная цветовая палитра, плоские цвета без градиентов, чёткие контуры, минималистичное моделирование форм, отсутствие теней и объёма, стилизованная текстура, вид характерный для 16-битных игр, сглаживание отсутствует, контрастные акценты, упрощённая анатомия, без текстовых подписей, чистый белый фон, 2D.
Стиль 7:
Одна фигурка в масштабе 1/7, разработанная как готовый коммерческий товар, стоит на столе, фигурка помещена на чистый круглый прозрачный акриловый постамент без надписей или этикеток, профессиональное студийное освещение подчеркивает детали скульптуры, высокая детализация, высокое качество.
HunyuanImage 3.0 (https://huggingface.co/tencent/HunyuanImage-3.0) это новая мощная открытая мультимодальная модель для генерации и понимания изображений в рамках авторегрессионной архитектуры. В основе её находится большая языковая модель (LLM) Mixture-of-Experts (MoE) с 80+ млрд параметров из них активно 13 млрд. Модель объединяет генерацию и понимание изображений в одной модели. Используется Chain-of-Thought (CoT) для улучшения генерации через "рассуждения". Архитектурно основана на трансформере, использует диффузию для генерации изображений и 2D позиционные эмбеддинги. При сборе данные использовалась тщательная фильтрация и обогащение данных (5 млрд изображений) и продвинутое описание изображений. При обучении применяли прогрессивное претренирование и агрессивное посттренирование (SFT, DPO, RL) для улучшения качества. В результате по качеству и соответствию тексту модель не уступает современным закрытым моделям (Seedream 4.0, Nano Banana, GPT-Image).
Это если прочитать их официальный отчёт, а на деле модель ужасная и с неоправданными требованиями к железу.
Вот небольшое сравнение:
Промт для генерации:
Городская улица в дождливый вечер, мокрый асфальт с отражениями неоновых вывесок, прохожий в чёрном плаще с зонтом, красный кабриолет у тротуара, витрина кафе с тёплым светом и паром на стекле, урны с мусором, мокрые газеты у обочины, реалистичный стиль, высокая детализация, атмосферное освещение.
Qwen-Image: Ночь, одним кадром, таинственный рыцарь в позолочённых доспехах с сапфирами на плечах стоит на краю скалы в облаках рядом с огромным замком, замок горит алым пламенем, звёзды падают, плоский векторный стиль, толстые контуры, минималистичные детали, ограниченная палитра цветов, градиенты для объема, отсутствие теней, чистый белый фон, графический дизайн, без текстовых подписей.