Серия «Полезные и интересные нейросети»

113

Fish Speech - Нейросеть для озвучки текста вашим голосом. Портативная версия1

Серия Полезные и интересные нейросети

🎙 Fish Speech 1.5 – это модель преобразования текста в речь, созданная для генерации естественного и качественного голоса. Она идеально подходит для разработчиков, создателей контента и всех, кто ищет продвинутую TTS-технологию.

Fish Speech - Нейросеть для озвучки текста вашим голосом. Портативная версия

🔥 Ключевые особенности:

- Поддержка клонирования голоса – добавь уникальность, просто загрузив референсный аудио-файл. Достаточно 10-30 секунд для копирования вашей речи.

- Высокое качество генерации – реалистичная речь с интонациями.

- Гибкая настройка – параметры Top-P, Temperature и Seed позволяют контролировать стиль и выразительность голоса.

- Поддержка мультиязычности – используйте модель для различных языков: английский, китайский, японский, немецкий, французский, испанский, корейский, арабский, русский, нидерландский, итальянский, польский и португальский.

- Простой интерфейс – минималистичный и понятный UI через Gradio.

💡 Для кого подходит?

Создатели подкастов, разработчики приложений, голосовые ассистенты, генераторы контента для видео, образовательные платформы.

---

Пошаговый гайд:

1. Ввод текста:

- В поле Input Text напишите текст на любом поддерживаемом языке.

2. Референсное аудио (опционально):

- Для клонирования голоса переключитесь на вкладку Reference Audio и загрузите образец голоса.

3. Настройка параметров:

- Используйте Advanced Config, чтобы настроить параметры синтеза под свои нужды.

Расширенные настройки:

- Iterative Prompt Length – определяет длину итерации текста (0 отключает эту функцию).

- Top-P – отвечает за разнообразие текста, чем выше значение, тем более свободной будет речь.

- Temperature – регулирует степень "творчества" в синтезе речи.

- Repetition Penalty – снижает повторяемость слов для более естественного результата.

- Seed – задаёт случайность генерации, 0 для случайного результата, любое число – для детерминированного.

4. Генерация:

- Нажмите Generate. После генерации аудио появится в правой части интерфейса. Вы можете прослушать результат или скачать его.

5. Эксперименты:

- Изменяйте параметры, такие как Top-P и Temperature, чтобы добиться нужного стиля речи.

Программа достаточно неприхотлива к видеопамяти и использует всего несколько гигабайт видеопамяти.

Я подготовил для вас портативную версию, которая позволяет запустить программу всего в пару кликов:

1) Распакйте архив
2) Запустите файл start_fish_audio_portable.bat

Скачать портативный Fish Speech 1.5 можно:

С моего хранилища | С зеркала (Yandex Disk)


Больше различных сборок, в том числе и будущие обновления, гайдов и новостей из мира AI и нейросетей доступно в моем Телеграм канале:

Neurogen

Показать полностью
45

Stable Video Diffusion - генератор видео у вас на ПК. Портативная версия

Серия Полезные и интересные нейросети

Всем привет с вами Neurogen, думаю, с момента релиза, уже многие знакомы со Stable Video Diffusion или хотя бы слышали - модель, позволяющая локально, у вас на ПК, генерировать короткие видео из изображения или же по текстовому промпту.

Сегодня на обзоре будет версия img2vid, создающая видео на основе изображения. Для комфортной работы понадобится видеокарта Nvidia с количеством видеопамяти не менее 16 гигабайт. Если у вас меньше, но приличное количество оперативной памяти - вы тоже можете попробовать, но главное обновите драйвер до последней версии.

Интерфейс программы достаточно простой и по факту процесс генерации заключается в двух действиях:

Stable Video Diffusion - генератор видео у вас на ПК. Портативная версия
  • Прикрепить изображение

  • Нажать Generate

Но, здесь есть и дополнительные настройки.

Seed - по умолчанию, каждая попытка выдает рандомный результат. Если вы хотите повторить попытку, используйте один и тот же seed

Number of frames decoded at a time - Параметр, который должен влиять на скорость работы, но по факту его влияние не так ощутимо. Для уменьшения потребления видеопамяти рекомендуется выставить на 1

Number of frames in video - Количество кадров в видео. Параметр экспериментальный и работает нестабильно, лучше оставить как есть

Motion bucket id - влияет на количество и тип анимаций в видео.
Frames per second - FPS, сколько кадров в секунду будет у вашего видео

Получившиеся результаты сохраняются в папку outputs

Портативная версия отличается тем, что всё уже готово для работы, вам не надо устанавливать Python, Cuda и т.д. - качаете, распаковываете и запускаете.

Скачать архивом и через torrent можно тут:

Скачать
Качаете все файлы, затем распаковываете архив который заканчивается на 001. Остальные файлы подтянутся сами, другие архивы распаковывать не надо. Затем просто запускаете start_portable_nvidia.bat и ждете когда откроется вкладка с WebUI в браузере. Если этого не произошло то просто откройте сами адрес http://127.0.0.1:7860

Что же касается генерации по текстовому промпту - релиз данной версии будет в моем Телеграм канале. Также там можно найти и другие портативные сборки различных нейронок.

А если захочется обсудить данную сборку или же просто пообщаться на тему ИИ, то вступайте в наш чат.

Показать полностью 1 2
35

Нейросеть, которая анимирует любое лицо

Серия Полезные и интересные нейросети

Данную нейросеть очень сильно просили ребята с моего телеграм канала по этому я решил сделать её портативную версию.

В целом, нейросеть максимально простая. На вход мы подаем изображение и видео, с которого будет захватываться анимация, подогнанное друг под друга. Затем нажимаем генерировать и получаем видео анимированного лица. Пример можно посмотреть в небольшом обзоре выше.

Что же касается работы, в целом программа работает как с GPU ускорением, если у вас видеокарта Nvidia так и без него, но уже на вашем процессоре.

Саму нейросеть можно найти тут: Github

В чем отличие портативной версии:

  • Есть графический интерфейс

  • Все готово к работе, не надо ничего качать и устанавливать

  • Последние версии библиотек для работы с GPU

Графический интерфейс программы на базе WebUI

Графический интерфейс программы на базе WebUI

Скачать портативную версию можно тут.

Ну а если вам интересны другие прикладные нейронки, а также их портативные сборки, то подписывайтесь на мой Телеграм канал.

Если же вы просто хотите пообщаться на тематику нейросетей, у вас есть какие-то вопросы, то добро пожаловать в наш чат.

Показать полностью 1
197

Lama Cleaner - нейронная альтернатива Photoshop | Портативная версия

Серия Полезные и интересные нейросети

Нейросеть для обработки фото и изображений, позволяющая редактировать, ретушировать и изменять объекты на изображении.



В целом, думаю, многие слышали про Lama Cleaner и уже активно пользуются, поэтому информация дальше будет для тех, кто не знаком с данной программой.

Кому полезно: дизайнерам, фотографам, цифровым художникам и другим пользователям, работающим с изображениями.

Основные функции Lama Cleaner включают в себя:

  1. Удаление объекта: Это ключевая функция, позволяющая пользователям выделить и удалить любой объект на фотографии. Программа использует различные нейросетевые модели для замены удаленного объекта и сохранения естественного вида изображения.

  2. Добавление объекта: Lama Cleaner функцию Inpaint, которая позволяет пользователям добавлять новые объекты на изображение, при помощи моделей Stable Diffusion.

Официальная страница программы тут: GitHub

По просьбе моих подписчиков, подготовил портативную версию данной программы. В отличие от официальной версии, она не требует установки Python и других зависимостей, всё уже идет в комплекте.

Особенности сборки:

- Установлены самые последние версии Torch и Xformers

- Предзагружена базовая модель

Для запуска необходимо:

- Загрузить архив:

Торрент | Яндекс Диск

Полная версия, со всеми загруженными моделями (20 гигабайт):
Торрент | Яндекс Диск

- Распаковать, запустить start_portable_nvidia.bat (для нормальной работы нужна видеокарта Nvidia, в ином случае придется работать на CPU).

После чего, открываем в браузере адрес: http://127.0.0.1:8080

После этого у нас откроется интерфейс для работы. Загружаем изображение, начинаем работу.

Ну, а больше портативных сборок различных нейросетей, а также бесплатный ChatGPT можно найти в моем телеграм канале.

А обсудить программу можно в нашем чате.

Показать полностью 1
19

Бесплатный доступ к ChatGPT на вашем iPhone

Серия Полезные и интересные нейросети

С историей диалога, и возможностью общения через Siri.

Для начала качаем нашего чат бота с iCloud: https://www.icloud.com/shortcuts/d0f4de78d4bb44fdbdb3208dce3...

Бот сделан через приложение Команды и использует наш API сервер проекта NeuroGPT. GitHub проекта: https://github.com/Em1tSan/NeuroGPT

После загрузки нажимаете Настроить, а затем Добавить. Теперь в списке команд у нас появился Нейробот. Для удобства можете добавить его как виджет на рабочий стол.

Для того чтобы начать чат, просто нажмите на виджет и введите свой текст, к примеру мы попросим рассказать его про Нептун.

Если текст отображен не полностью то просто нажмите на сообщение и оно откроется целиком.

Кнопка Отмена закрывает чат, кнопка Готово перейдет к след запросу.

Для активации Siri необходимо сказать "Siri, Нейробот" и она запустит команду.

Будущие обновления будут выходить в моем Telegram канале: https://t.me/neurogen_news

Также можно найти другую информацию по различным нейросетям.

Ну а если у вас возникнут трудности, спросить помощи можно в нашем чате: https://t.me/neurogen_chat

Показать полностью 3
189

Обзор FaceFusion - перевоплощение популярного дипфейка Roop. Портативная версия в конце статьи

Серия Полезные и интересные нейросети

FaceFusion - это продукт одного из разработчиков популярного дипфейка Roop. Дело в том, что у них произошел разлад, проект Roop закрался, а команда разошлась.

В целом, FaceFusion - это тот же самый Roop, только с интерфейсом на базе Gradio, который многие знают по Stable Diffusion от Automatic1111

Тем не менее множество функций тут вынесены из командной строки в интерфейс.



FRAME PROCESSORS - этот модуль отвечает за обработку кадров.
face_swapper - просто замена лица
face_enhancer - улучшение лица (через GFPGAN)
frame_enhancer - новая опция, апскейлит весь кадр.

EXECUTION PROVIDERS - тут вы выбираете ваш бэкенд, через что будет идти обработка. На видеокартах Nvidia это Cuda либо TensoRT, на AMD это DirectML (DML), если запускать на Windows.

Остальные же параметры в блоке EXECUTION отвечают за скорость обработки. Больше потоков - больше скорость, больше потребление видеопамяти. Поэтому выставляйте в меру, большое количество потоков может привести к вылету либо к замедлению работы.

MAX MEMORY - лимит потребления оперативной памяти.

OUTPUT VIDEO ENCODER - через какой енкодер будут собраны кадры в видео, после замены лица. Для видеокарт Nvidia можно использовать NVENC, так как он базируется на аппаратном ускорении.


KEEP FPS, KEEP TEMP, SKIP AUDIO - Отвечают за то, чтобы Сохранить фпс оригинального видео, оставить временную папку с раскадровками и пропустить аудио.

Средний блок отвечает за выбор файлов с которыми мы будем работать.

SOURCE - фото с лицом, на которое будем менять

TARGET - фото или видео, в котором будем менять лицо

OUTPUT PATH - где будет сохранено видео. Также в Output появится итоговое видео

Третий блок содержит в себе:

PREVIEW - Тут вы можете посмотреть как будет выглядеть замена.
FACE RECOGNITION - выбор распознавания лиц. Либо на основе референса, либо все лица.

REFERENCE FACE - тут как раз и будут лица, распознанные на кадре из превью. Выбирая их, вы выбираете какое лицо будет меняться в кадре.

Оставшиеся параметры отвечают за настройки анализа лиц.

Что касается скорости работы - я не заметил разницы с последней версией Roop. Все примерно точно так же, шустро, но можно и шустрее (Refacer и Rope тому примеры)

Как обычно, я сделал портативную версию с запуском в 1 клик. Пока что готова версия для Nvidia, версия для AMD будет позже, ссылку на нее оставлю у себя в Телеграм канале.

Скачать портативную версию можно по ссылкам:

Мое облако | Яндекс Диск

Особенности портативной сборки:
- Запуск в 1 клик, не надо ничего устанавливать
- Удалена 18+ цензура.
- Обновлены библиотеки CUDA (Cudnn 8.9.4)

После открытия программы, откройте в браузере адрес, который будет написан в консоли (обычно http://127.0.0.1:7860)

Последующие обновления, а так же другие дипфейки можно найти у меня в Телеграм канале, а пообщаться на тематику всего, что связано с нейронками - можно в нашем чате.

Показать полностью 4
401

DeepFake Swap Mukham - всё в одном. Универсальный DeepFake

Серия Полезные и интересные нейросети

Тут есть замена лиц в видео, фото и даже пакетная обработка. Работает на Nvidia, AMD и CPU.

Подробный обзор функционала в данном видео:

Ну а в этом посте мы кратко пробежимся по ключевым особенностям:

GitHub оригинального проекта. Я убрал NSFW цензуру и добавил ряд оптимизаций.

  • Большой список определения лиц: по полу, возрасту, положению в кадре, по сходству.

  • Тонкие настройки маски: Вы можете контролировать какие части лица менять, а какие оставить.

  • Поддержка улучшителей лица: GFPGAN, GPEN, CODEFORMER, RESTOREFORMER

Скачать портативную версию, не требующую установки и доп. программ и зависимостей можно тут и с Яндекс Диска.

Ну, а будущие обновления, а также портативные версии roop, refacer и других полезных нейронок можно найти в моем телеграм канале.

Показать полностью 2
486

Портативная версия улучшенной версии Stable Diffusion с запуском в 1 клик (работает на видеокартах Nvidia и AMD)

Серия Полезные и интересные нейросети

Многие просили меня сделать собственную версию портативной версии Stable Diffusion, и вот наконец-то у меня дошли руки.

Портативная версия улучшенной версии Stable Diffusion с запуском в 1 клик (работает на видеокартах Nvidia и AMD)


За основу взят форк stable-diffusion-webui под названием SD.Next (он же automatic от vladmandic). У меня был его обзор на YouTube канале, сейчас он конечно сильно изменился, но функции из видео все еще остались на месте.

В чем отличие от automatic1111:

  • SD.Next отличается глубокой оптимизацией и улучшенной производительностью, а также расширенным функционалом.

  • Больший диапазон настроек.

  • Предустановлен и интегрирован в систему ряд расширений: ControlNet, Tiled VAE, Image Browser и другие.

  • Возможность переключиться на diffusers, что расширяет поддержку моделей, добавляя поддержку Kandinsky 2.1 и других.

  • Работа на GPU Nvidia, AMD, Intel и в том числе на процессорах из коробки.

Особенности портативной версии:

- Не требует установки Python, GIT, Cuda toolkit и т.д. Скачали, распаковали, пользуетесь.

- Предустановлен VAE и универсальная модель dreamshaper v8

- Предустановлены кастомные ESRGAN апскейлеры

- Предустановлено расширение roop (замена лица на изображениях)

- Предустановлено расширение swap-mukham (замена лица на изображениях, видео)

- Обновляется автоматически при каждом запуске

Поддерживаются видеокарты Nvidia и AMD и Intel ARC

Скачать портативную версию можно по этой ссылке

Для запуска необходимо распаковать архив через WinRAR или 7zip и запустить файл universal_start.bat


Будущие обновления сборки, а также другие полезные нейросети с простым запуском можно найти в моем телеграм канале Neurogen

Показать полностью 1 1
Отличная работа, все прочитано!

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества