/ai/ - Искусственный интеллект

Вопросов кожаных мешков тред Аноним 14/05/23 Вск 11:27:57 № 299474 Ответ

fde636c44dae155[...].jpg 294Кб, 1000x600

Общее

Новости ИИ Исследование ИИ Этика ИИ Личных достижений тред

Stable Diffusion

Stable Diffusion общий Аниме арты Технотред (обучение моделей) Обмен моделями

Прочая графика

Генерация 3D-моделей ИИ-видео общий Общий Картиночный Midjourney Дипфейки Заработка/площадок тред

Текст

AI Chatbot General Локальные языковые модели ChatGPT Claude

Звук

Музыкальный общий Голосовой общий

Если вы хотите задать какой-то мелкий вопрос - используйте для этого данный тред или найдите профильный треде в каталоге.

Утонувшие треды помещаются в архив.

О разделе:

1. Доска предназначена для любых обсуждений нейросетей, их перспектив и результатов.

2. AICG тред перекатывается после достижения предела в 1500 постов.

3. Срачи рукотворное vs. ИИ не приветствуются. Особо впечатлительные художники и им сочувствующие катятся в собственный раздел => /pa/. Генераций и срачей в контексте всем известных политических событий это тоже касается, для них есть соответствующие разделы.

4. Это раздел преимущественно технического направления. Для генерации откровенного NSFW-контента без технического контекста выделена отдельная доска - /nf/. Эротика остаётся в /ai/. Голые мужики - в /nf/. Фурри - в /fur/. Гуро и копро - в /ho/.

5. Публикация откровенного NSFW-контента в /ai/ допускается в рамках технических обсуждений, связанных с процессом генерации. Откровенный NSFW-контент, не сопровождающийся разбором моделей, методов или описанием процесса генерации, размещается в /nf/.

Пропущено 1486 постов
250 с картинками.

В тред Скрыть

Пропущено 1486 постов, 250 с картинками.

Аноним 01/09/25 Пнд 17:52:11 № 1338256

>>1338247
>Так а гемини про разве не умеет это делать?
Может и умеет, но в данном случае не использует. Это закрытые модели, внутре хоть индус сидеть может.
>Открывал ссылку и видел там цитату, которую привёл грок
Ну значит гугол.

Аноним 01/09/25 Пнд 22:01:25 № 1338455

Аноны, подскажите, попадались ли вам сайты, где можно почитать диалоги с gpt?

Подозреваю, что какие-нибудь бесплатные сайты, которые дают сколько-нибудь запросов к gpt могут публиковать такие диалоги. Вроде мне что-то такое даже попадалось когда-то, но не смог вспомнить адрес

Аноним 02/09/25 Втр 03:54:23 № 1338654

>>1338455

Музыкальный №15 /music/ Аноним 20/08/25 Срд 23:35:21 № 1327306 Ответ

♫ Udio ♫
https://www.udio.com/

Вышла версия 1.5 Allegro, по функционалу то же, что и 1.5, только в два раза быстрее. Лимит 400 кредитов в месяц (или 200 генераций по 33 секунды каждая) при условии ежедневного захода на сайт - 100 кредитов даются в месяц, и еще 10 кредитов даются ежедневно. Также можно фармить кредиты, выполняя специальные задания по оцениванию качества рандомных треков, это дает не больше 10 дополнительных кредитов в день. Для большего числа кредитов и более продвинутых фич типа инпэйнтинга или генерации с загруженного аудио нужно платить. Появилась возможность генерировать треки по 2 минуты 11 секунд, не больше 3 длинных треков (по 2 версии на каждый трек) в день на бесплатном тарифе.

♫ Suno ♫
https://app.suno.ai/ генерация на сайте
https://suno.ai/discord генерация на официальном discord-сервере
https://rentry.co/suno_tips советы по использованию

Лимиты: 10 генераций в день. Нужна платная подписка чтобы увеличить лимиты, либо можно абузить сервис через создание множества аккаунтов

♫ Riffusion ♫
https://www.riffusion.com/

Старая версия Riffusion:

https://classic.riffusion.com/

Новинка, по качеству звука на уровне Суно или чуть выше. Лучший по качеству генератор текстов на русском. Количество генераций в день не ограничено, но за некоторые функции нужно платить (загрузку аудио, стемов и т.д.)

https://www.riffusion.com/docs
https://classic.riffusion.com/docs

Инструкция по применению, тегам и прочему на английском.

______________

Локальные модели:

1) Китайский YuE

https://github.com/multimodal-art-projection/YuE
https://github.com/joeljuvel/YuE-UI

Это буквально первый проект который может генерировать песни по заданному тексту локально. Оригинальная версия генерирует 30-секундный отрывок за 5 минут на 4090. На данный момент качество музыки низкое по сравнению с Суно. Версия из второй ссылки лучше оптимизирована под слабые видеокарты (в т.ч. 6-8 Гб VRAM, по словам автора). Инструкция на английском по ссылке.

2) ACE-Step

https://github.com/ace-step/ACE-Step

Вторая локалка, качеством получше.

Здесь демо-версия:
https://huggingface.co/spaces/ACE-Step/ACE-Step
______________

Еще сайты по генерации ИИ-музыки, в них тоже низкое качество звука и понимание промпта по сравнению с Суно, либо какие-то другие недостатки типа слишком долгого ожидания генерации или скудного набора жанров, но может кому-то зайдет, поэтому без описания:

https://www.wondera.ai/
https://sonauto.ai/
https://www.beatoven.ai/
https://stableaudio.com/
https://www.loudly.com/music/ai-music-generator

______________
Редакция трека после генерации (можно убрать вокал и оставить только инструментал и наоборот, убрать шумы и т.д.)

https://x-minus.pro/ai
https://uvronline.app/ai?locale=ru_RU

______________
Напомню мега-сайт для сочинения аутентичных англоязычных текстов для ИИ-музыки в стиле известных групп и артистов от Пинк Флойда до Эминема. Зайти можно только через Дискорд.

https://codyai.cc/

Прошлый тред

>>1282525 (OP)

Пропущено 144 постов
53 с картинками.

В тред Скрыть

Пропущено 144 постов, 53 с картинками.

Аноним 02/09/25 Втр 22:35:08 № 1339701

>>1339572
Ну попсу, электронику и прилизанный металл уже научился генератор делать неотличимо, это да.

Аноним 02/09/25 Втр 22:57:17 № 1339728

>>1339641
>чтобы текст не проебался
Что значит не проебался? То есть сгенерировать женеричное говно на 4ке это типа не проебется текст? Ты либо задрачиваешься и фиксишь текст на годном сиде, чтобы он звучал охуенно, либо он нахер не упал при любых раскладах. Качество же делается каверами в 4ку и микшированием разных дорожек, да и то далеко не всегда 4ка может выдать такой драйв и энергию как на 3ке.

Аноним 03/09/25 Срд 02:33:12 № 1339936

>>1339728
можешь прислать примеры такого из своих треков? трек сгенерированный на 3 и его же версию доработанную на 4? с меня сотни нефти

ИИ со своим голосом Аноним 31/08/25 Вск 12:53:30 № 1337183 Ответ

Аноны, помогите пожалуйста. Мне почти 40 лет, недавно врачи диагностировали мне лимфому в 3 стадии, сколько проживу точно - не ясно, но знаю одно - осталось недолго. У меня есть 11 летний сын, который очень привязан ко мне. Я хочу, чтобы даже после моего ухода он мог поговорить со мной(хотя бы с моим голосом). Есть ли у меня возможность создать голосовой ИИ, который будет общаться моим голосом? У меня есть хороший микрофон и прочее, чтобы записать достаточно материала с моим голосом. Если найдется желающий помочь - то объясните мне в этом треде как для чайника, ибо я почти ничего не знаю об этой сфере.

Пропущено 21 постов
2 с картинками.

В тред Скрыть

Пропущено 21 постов, 2 с картинками.

Аноним 02/09/25 Втр 22:17:53 № 1339673

>>1338547
> Снимать видео с собой
...Точнее - нужно снимать на видео свое общение с сыном и другими родственниками, чтобы в кадре были и сын и отец. Когда сын будет пересматривать, то он будет возвращаться мысленно и эмоционально в этот момент общения. И заодно и себя видеть каким он был тогда.

Короче нужно снимать побольше семейного видео, чтобы в видео были разные родственники, а не только одного себя. Стань как бы архивным блогером, придумывай сценарии, настольные игры, вылазки на природу, снимай это все на видео, не для публикации где-то на ютубе, а для семейного архива, отбирай лучшие ролики и архивируй их на CD-R.

Аноним 03/09/25 Срд 00:09:15 № 1339829

>>1339673
> Стань как бы архивным блогером, придумывай сценарии, настольные игры, вылазки на природу, снимай это все на видео, не для публикации где-то на ютубе, а для семейного архива, отбирай лучшие ролики и архивируй их на CD-R.
Или он может просто его изнасиловать и тот никогда его не забудет.

Аноним 03/09/25 Срд 02:33:06 № 1339935

>>1338517
>К тому времени, через 20 лет всё это будет уже автоматически работать.
Это уже сейчас можно сделать. Генератор голоса из 10 секундного отрезка аудио - есть. Липсинк для генератора видео есть и это все локально. В каком нибудь veo3 это вообще реализуемо в 2 кнопки.

Через 20 лет ты уже просто по памяти из головы будешь образ составлять и генерировать.

Локальные языковые модели (LLM): LLaMA, Gemma, DeepSeek и прочие №162 /llama/ Аноним 31/08/25 Вск 00:33:06 № 1336982 Ответ

Эффективность к[...].png 92Кб, 1399x1099

Реальная длина [...].png 481Кб, 1520x2266

В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.gitgud.site/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под ExllamaV2 (а в будущем и под v3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_2025 (версия 2024-го https://rentry.co/llm-models )
• Неактуальный список моделей по состоянию на середину 2023-го: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7

Архив тредов можно найти на архиваче: https://arhivach.hk/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1332569 (OP)
>>1329142 (OP)

Пропущено 382 постов
40 с картинками.

В тред Скрыть

Пропущено 382 постов, 40 с картинками.

Аноним 03/09/25 Срд 02:07:09 № 1339926

>>1339912
Что такое? Есть много моделей лучше эйра, но в своем классе он крут. Особенно хорош тем, что может быть запущен на десктопе и при этом справляется с решением простых-средних задач с вызовами.
>>1339914
С какими параметрами запускал? С него в основном плюются что наоборот с мультигпу медленнее, и сам автор это признает.

Аноним 03/09/25 Срд 02:21:24 № 1339932

Мда, без фа ваниллу запустить нереально. Просит 8 гб лолоцировать на куде 0. Щас конечно попробую скинуть пару слоев в рам, но если он на каждом девайсе будет столько просить - пошел он нахуй этот ваш жора.

>>1339926
>С какими параметрами запускал?
Тащемта почти стандартные в части болжоры:
-ts 23,5,4,5,5,4,5,5,2,2,2 -sm layer -c 15000 -b 1024 -ub 1024 -ngl 62 -ncmoe 19 -t 7 -mla 3 -fmoe -amb 512 --no-mmap

Аноним 03/09/25 Срд 02:26:57 № 1339934

ggml_backend_cuda_buffer_type_alloc_buffer: allocating 8322.64 MiB on device 1
ggml_gallocr_reserve_n: failed to allocate CUDA1 buffer of size 8726917120
graph_reserve: failed to allocate compute buffers
llama_init_from_model: failed to initialize the context: failed to allocate compute pp buffers

ну да, ну да, пошел я нахуй.

Anime Diffusion #223 /nai/ Аноним 20/08/25 Срд 22:07:00 № 1327209 Ответ

1631147979020.mp4 1135Кб, 1088x896, 00:00:05

Генерируем тяночек!

Прошлый тред: >>1305910 (OP) https://arhivach.vc/thread/1222222/

Схожие тематические треды
• SD-тред (не аниме): >>1324255 (OP)
• Технотред: >>1272560 (OP)
• Фурри-тред: https://2ch.hk/fur/res/374311.html

FAQ
https://2ch-ai.gitgud.site/wiki/nai

Установка
• NVidia: https://rentry.co/2ch_nai_guide
• AMD: https://2ch-ai.gitgud.site/wiki/nai/install/amd
• Облака: https://2ch-ai.gitgud.site/wiki/nai/install/clouds

Дополнительная информация
• Интерфейсы: https://2ch-ai.gitgud.site/wiki/nai/interfaces
• Модели: https://2ch-ai.gitgud.site/wiki/nai/models
• Промпты: https://2ch-ai.gitgud.site/wiki/nai/prompts
• Апскейл: https://2ch-ai.gitgud.site/wiki/nai/upscale
• LoRA: https://2ch-ai.gitgud.site/wiki/nai/lora
• ControlNet: https://2ch-ai.gitgud.site/wiki/nai/controlnet

Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci

Пропущено 382 постов
158 с картинками.

В тред Скрыть

Пропущено 382 постов, 158 с картинками.

Аноним 03/09/25 Срд 01:52:50 № 1339922

>>1339917
Конским и памперсами? Ой их же запретили, платиновый контент цивы был.
Надо было правильно цензурировать ディフェンスに定評のある尻尾

Аноним 03/09/25 Срд 02:05:31 № 1339925

>>1339916
Пора спатеньки..

Аноним 03/09/25 Срд 02:24:34 № 1339933

Stable Diffusion технотред #20 /tech/ Аноним 11/07/25 Птн 04:39:36 № 1272560 Ответ

diffusion proce[...].png 358Кб, 2546x1822

lr.png 252Кб, 1853x624

performance cha[...].webp 53Кб, 1200x900

ИТТ делимся советами, лайфхаками, наблюдениями, результатами обучения, обсуждаем внутреннее устройство диффузионных моделей, собираем датасеты, решаем проблемы и экспериментируем Тред общенаправленныей, тренировка дедов, лупоглазых и фуррей приветствуются

Предыдущий тред: >>1118663 (OP)

➤ Софт для обучения

https://github.com/kohya-ss/sd-scripts
Набор скриптов для тренировки, используется под капотом в большей части готовых GUI и прочих скриптах.
Для удобства запуска можно использовать дополнительные скрипты в целях передачи параметров, например: https://rentry.org/simple_kohya_ss

https://github.com/bghira/SimpleTuner Линукс онли, бэк отличается от сд-скриптс

https://github.com/Nerogar/OneTrainer Фич меньше, чем в сд-скриптс, бэк тоже свой

➤ GUI-обёртки для sd-scripts

https://github.com/bmaltais/kohya_ss
https://github.com/derrian-distro/LoRA_Easy_Training_Scripts

➤ Обучение SDXL

https://2ch-ai.gitgud.site/wiki/tech/sdxl/

➤ Flux

https://2ch-ai.gitgud.site/wiki/nai/models/flux/

➤ Гайды по обучению

Существующую модель можно обучить симулировать определенный стиль или рисовать конкретного персонажа.

✱ LoRA – "Low Rank Adaptation" – подойдет для любых задач. Отличается малыми требованиями к VRAM (6 Гб+) и быстрым обучением. https://github.com/cloneofsimo/lora - изначальная имплементация алгоритма, пришедшая из мира архитектуры transformers, тренирует лишь attention слои, гайды по тренировкам:
https://rentry.co/waavd - гайд по подготовке датасета и обучению LoRA для неофитов
https://rentry.org/2chAI_hard_LoRA_guide - ещё один гайд по использованию и обучению LoRA
https://rentry.org/59xed3 - более углубленный гайд по лорам, содержит много инфы для уже разбирающихся (англ.)

✱ LyCORIS (Lora beYond Conventional methods, Other Rank adaptation Implementations for Stable diffusion) - проект по созданию алгоритмов для обучения дополнительных частей модели. Ранее имел название LoCon и предлагал лишь тренировку дополнительных conv слоёв. В настоящий момент включает в себя алгоритмы LoCon, LoHa, LoKr, DyLoRA, IA3, а так же на последних dev ветках возможность тренировки всех (или не всех, в зависимости от конфига) частей сети на выбранном ранге:
https://github.com/KohakuBlueleaf/LyCORIS

Подробнее про алгоритмы в вики https://2ch-ai.gitgud.site/wiki/tech/lycoris/

✱ Dreambooth – для SD 1.5 обучение доступно начиная с 16 GB VRAM. Ни одна из потребительских карт не осилит тренировку будки для SDXL. Выдаёт отличные результаты. Генерирует полноразмерные модели:
https://rentry.co/lycoris-and-lora-from-dreambooth (англ.)
https://github.com/nitrosocke/dreambooth-training-guide (англ.) https://rentry.org/lora-is-not-a-finetune (англ.)

✱ Текстуальная инверсия (Textual inversion), или же просто Embedding, может подойти, если сеть уже умеет рисовать что-то похожее, этот способ тренирует лишь текстовый энкодер модели, не затрагивая UNet:
https://rentry.org/textard (англ.)

➤ Тренировка YOLO-моделей для ADetailer:
YOLO-модели (You Only Look Once) могут быть обучены для поиска определённых объектов на изображении. В паре с ADetailer они могут быть использованы для автоматического инпеинта по найденной области.

Подробнее в вики: https://2ch-ai.gitgud.site/wiki/tech/yolo/

Не забываем про золотое правило GIGO ("Garbage in, garbage out"): какой датасет, такой и результат.

➤ Гугл колабы

﹡Текстуальная инверсия: https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/sd_textual_inversion_training.ipynb
﹡Dreambooth: https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast-DreamBooth.ipynb
﹡LoRA https://colab.research.google.com/github/hollowstrawberry/kohya-colab/blob/main/Lora_Trainer.ipynb

➤ Полезное

Расширение для фикса CLIP модели, изменения её точности в один клик и более продвинутых вещей, по типу замены клипа на кастомный: https://github.com/arenasys/stable-diffusion-webui-model-toolkit
Гайд по блок мерджингу: https://rentry.org/BlockMergeExplained (англ.)
Гайд по ControlNet: https://stable-diffusion-art.com/controlnet (англ.)

Подборка мокрописек для датасетов от анона: https://rentry.org/te3oh
Группы тегов для бур: https://danbooru.donmai.us/wiki_pages/tag_groups (англ.)
NLP тэггер для кэпшенов T5: https://github.com/2dameneko/ide-cap-chan (gui), https://huggingface.co/Minthy/ToriiGate-v0.3 (модель), https://huggingface.co/2dameneko/ToriiGate-v0.3-nf4/tree/main (квант для врамлетов)

Оптимайзеры: https://2ch-ai.gitgud.site/wiki/tech/optimizers/
Визуализация работы разных оптимайзеров: https://github.com/kozistr/pytorch_optimizer/blob/main/docs/visualization.md

Гайды по апскейлу от анонов:
https://rentry.org/SD_upscale
https://rentry.org/sd__upscale
https://rentry.org/2ch_nai_guide#апскейл
https://rentry.org/UpscaleByControl

Старая коллекция лор от анонов: https://rentry.org/2chAI_LoRA

Гайды, эмбеды, хайпернетворки, лоры с форча:
https://rentry.org/sdgoldmine
https://rentry.org/sdg-link
https://rentry.org/hdgfaq
https://rentry.org/hdglorarepo
https://gitgud.io/badhands/makesomefuckingporn
https://rentry.org/ponyxl_loras_n_stuff - пони лоры
https://rentry.org/illustrious_loras_n_stuff - люстролоры

➤ Legacy ссылки на устаревшие технологии и гайды с дополнительной информацией

https://2ch-ai.gitgud.site/wiki/tech/legacy/

➤ Прошлые треды

https://2ch-ai.gitgud.site/wiki/tech/old_threads/

Шапка: https://2ch-ai.gitgud.site/wiki/tech/tech-shapka/

Пропущено 362 постов
76 с картинками.

В тред Скрыть

Пропущено 362 постов, 76 с картинками.

Аноним 03/09/25 Срд 00:34:32 № 1339843

>>1339764
В каком месте бля?
>loss = mse_complex(dfrft(model_pred.float(), 0.5), dfrft(target.float(), 0.5))
Разница между таргетом и предиктом и есть лосс по спектру генерации который на разных таймстепах должен быть разным.
Если тебя смущает то что это происходит в пространстве шума а не исходной картинки, то спектр и все его свойства зеркально соответствуют картинке.
Выделение низких частот будет фокусировать модель на низких, высокие частоты шума соответствуют высоким частотам картинки. На разных таймстепах разный диапазон критичных ошибок и диапазон невозможных для модели предсказаний на которые ее бессмысленно дрочить.
В идеале бы это логировать и добавить автоматику которая будет клампить какой-то процент ошибок по спектру, или как-то считать дисперсию ошибок, кароч там должно автоматически настраиваться и без шедулинга, интуиция тут в том чтобы модель работала всегда в диапазоне "зоны ближайшего развития" https://ru.wikipedia.org/wiki/Зона_ближайшего_развития

Аноним 03/09/25 Срд 01:38:09 № 1339909

>>1339843
> Выделение низких частот будет фокусировать модель на низких, высокие частоты шума соответствуют высоким частотам картинки.
Ещё раз - у тебя нет там картинки, у тебя шум. Высокие частоты шума не соответствуют высоким частотам картинки. Шум который ты сравниваешь, в лоссе target - это то что из генератора шума получено. Чтобы получить картинку, утрировано тебе надо вычитать аутпут модели предсказанный шум из инпута латент + шум из генератора.
Чтоб сделать то что ты хочешь надо делать шаг деноизинга в шедулере шума и сравнивать непосредственно спектры картинки, но тут ты попадёшь в похожую яму что и с wavelet - всегда будет перекос куда-то там у нас перекос потому что wavelet неравномерно декомпозицию делает и надо весами потом крутить. Тогда да, надо пердолиться с подстраиванием под timesteps на глаз. Собственно fft просто работает без пердогинга как раз потому что мы никак не взаимодействуем с картинкой и её спектрами.
Лучше альфу покрути вместо 0.5 повышай до 1.0 и дальше с шагом 0.5 иди вплоть до 5.0, если хочется какого-то другого результата.

Аноним 03/09/25 Срд 02:10:00 № 1339928

>>1339909
>Ещё раз - у тебя нет там картинки, у тебя шум.
>Чтобы получить картинку, утрировано тебе надо вычитать аутпут модели
Вычитание никак не влияет на спектр. Нет разницы в спектре между лоссом картинка - предсказание картинки и шум - предсказание шума.

Новости об искусственном интеллекте №33 /news/ Аноним 26/08/25 Втр 16:44:15 № 1332558 Ответ

1756215809383-3[...].jpeg 297Кб, 1312x736

В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1325173 (OP)

Пропущено 362 постов
112 с картинками.

В тред Скрыть

Пропущено 362 постов, 112 с картинками.

Аноним 02/09/25 Втр 23:10:39 № 1339744

>>1339599
Настоящий Яндекс остался в Нидерландах под защитой НАТО. Вот для чего нужен НАТО. А то что осталось - тень от Яндекса, как АвтоВаз - тень от Фиата.

Аноним 03/09/25 Срд 00:55:34 № 1339862

>>1339276
Тогда нахуй ты вообще отвечал? Ты хоть жопой не читай что пишут. Выебеулся хуйнёй какой то и считаешь себя крутым? Тьюфу бля

Аноним 03/09/25 Срд 01:30:53 № 1339901

>>1339862
В лицо мне это скажешь?

Голосовых нейронок тред (TTS, STS, STT) #7 speech /speech/ Аноним 16/02/25 Вск 12:20:27 № 1055411 Ответ

17019563860200.mp4 477Кб, 396x298, 00:00:23

17074247947820.mp4 2886Кб, 384x480, 00:00:08

17204507036820.mp4 310Кб, 576x576, 00:00:14

17099193437742.mp4 1356Кб, 438x480, 00:00:58

Обсуждаем нейросети, связанные с синтезом, преобразованием и распознаванием речи. Не забываем публиковать свои шедевры в треде.

Прошлый тред: >> https://2ch.hk/ai/res/664162.html

Вики треда: https://2ch-ai.gitgud.site/wiki/speech/

FAQ

Q: Хочу озвучивать пасты с двача голосом Путина/Неко-Арк/и т.п.

1. Используешь любой инструмент для синтеза голоса из текста - есть локальные, есть онлайн через huggingface или в виде ботов в телеге:
https://2ch-ai.gitgud.site/wiki/speech/#синтез-голоса-из-текста-tts

Спейс без лимитов для EdgeTTS:
https://huggingface.co/spaces/NeuroSenko/rus-edge-tts-webui

Так же можно использовать проприетарный комбайн Soundworks (часть фич платная):
https://dmkilab.com/soundworks

2. Перегоняешь голос в нужный тебе через RVC. Для него есть огромное число готовых голосов, можно обучать свои модели:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

Q: Как делать нейрокаверы?

1. Делишь оригинальную дорожку на вокал и музыку при помощи Ultimate Vocal Remover:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/UVR

2. Преобразуешь дорожку с вокалом к нужному тебе голосу через RVC:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

3. Объединяешь дорожки при помощи Audacity или любой другой тулзы для работы с аудио

Опционально: на промежуточных этапах обрабатываешь дорожку - удаляешь шумы и прочую кривоту. Кто-то сам перепевает проблемные участки.

Качество нейрокаверов определяется в первую очередь тем, насколько качественно выйдет разделить дорожку на составляющие в виде вокальной части и инструменталки. Если в треке есть хор или беквокал, то земля пухом в попытке преобразовать это.

Нейрокаверы проще всего делаются на песни с небольшим числом инструментов - песня под соло гитару или пианино почти наверняка выйдет без серьёзных артефактов.

Q: Хочу говорить в дискорде/телеге голосом определённого персонажа.

Используй RVC (запуск через go-realtime-gui.bat) либо Voice Changer:
https://github.com/w-okada/voice-changer/blob/master/README_en.md

Гайд по Voice Changer, там же рассказывается, как настроить виртуальный микрофон:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/Voice‐Changer (часть ссылок похоже сдохла)

Q: Как обучить свою RVC-модель?

Гайд на русском: https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/RVC#создание-собственной-модели
Гайд на английском: https://docs.aihub.wtf/guide-to-create-a-model/model-training-rvc
Определить переобучение через TensorBoard: https://docs.aihub.wtf/guide-to-create-a-model/tensorboard-rvc
Если тыква вместо видеокарты, можно тренить в онлайне: https://www.kaggle.com/code/varaslaw/rvc-v2-no-gradio-https-t-me-aisingers-ru/notebook?scriptVersionId=143284909 (инструкция: https://www.youtube .com/watch?v=L-emE1pGUOM )

Q: Надо распознать текст с аудио/видео файла

Используй Whisper от OpenAI: https://github.com/openai/whisper
Быстрый скомпилированный для винды вариант: https://github.com/Purfview/whisper-standalone-win
Так же есть платные решения от Сбера/Яндекса/Тинькофф.

Коммерческие системы

https://elevenlabs.io перевод видео, синтез и преобразование голоса
https://heygen.com перевод видео с сохранением оригинального голоса и синхронизацией движения губ на видеопотоке. Так же доступны функции TTS и ещё что-то
https://app.suno.ai генератор композиций прямо из текста. Есть отдельный тред на доске >>

Шаблон для переката: https://2ch-ai.gitgud.site/wiki/speech/speech-shapka/

Пропущено 228 постов
50 с картинками.

В тред Скрыть

Пропущено 228 постов, 50 с картинками.

Аноним 02/09/25 Втр 22:05:33 № 1339666

90шедыму09гмно.png 8Кб, 558x163

ф8сцглф7алгфсуе[...].png 1Кб, 327x56

Как же бомбит-то, сука
Я несколько грёбаных вечеров слил просто вникуда, как будто их не было
Всего лишь сделать то же самое, что делают тысячи других людей, и я явно не самый тупой из них
У них всё получается, всё работает, вон сколько обучающих видео, сколько статей, гайдов
Я пробовал использовать скетчбуки (тысячи их), с забитыми примерами - они не работают;
Я качал готовые "portable" сборки, где не надо ничего настраивать - они не работают;
Да блять даже из шапки этого треда запускаю гайд для конченых долбоёбов "нажми одну кнопку и будет хорошо" - один хуй не получается нихуя, у меня даже не было возможности что-то сделать не так;

Что это за магия ебаная, как у вас всех это всё работает? Может, мне к кому-нибудь домой прийти и попробовать запустить? Я уверен, тоже нихуя не будет работать.

Аноним 03/09/25 Срд 01:15:37 № 1339877

>>1327596
whisper от openai

Аноним 03/09/25 Срд 01:20:47 № 1339883

Аноны, у меня вопрос не совсем по нейронкам, но по tts.
Решил попробовать послушать книжки через tts (в fdroid есть sherpatts, там модельку скачал ru irina medium) и вроде неплохо.
Но нужны словари для правки ударений и прочих произношений.
Может быть кто-то знает где их взять или может быть можно их сгенерировать прямо из текста книги?

Stable Diffusion тред X+167 /sd/ Аноним 29/08/25 Птн 15:26:05 № 1335471 Ответ

Тред локальной генерации

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/ltdrdata/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

ЧТО НОВОГО АКТУАЛЬНОГО ЗА ГОД

• Qwen Edit (SOTA модель для редактирования картинок).
• Релиз Chroma.
• Qwen Image (SOTA модель для генерации картинок).
• Flux Krea.
• Wan 2.2 (подходит для генерации картинок).
• NAG (негативный промпт на моделях с 1 CFG)
• Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза. Пример: 4-8 шагов, CFG 1. https://huggingface.co/tianweiy/DMD2/blob/main/dmd2_sdxl_4step_lora_fp16.safetensors,
CFG 3 для NoobAI https://huggingface.co/YOB-AI/DMD2MOD/blob/main/LYC-DMD2MOD%20(Dmo%2BTffnoi).safetensors,

Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana
Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion
Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)

► Предыдущий тред >>1330740 (OP) ► https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03

Пропущено 339 постов
138 с картинками.

В тред Скрыть

Пропущено 339 постов, 138 с картинками.

Аноним 02/09/25 Втр 23:56:48 № 1339819

1230001-3670.mkv 20190Кб, 480x720, 00:02:26

Аноним 03/09/25 Срд 00:05:28 № 1339827

>>1339819
Весь дмдкал собрал?

Аноним 03/09/25 Срд 00:19:24 № 1339833

>>1339819
На 2:04.5 норм, кинь промпт
Последние где перегенерил, в квен или в ван?

Midjourney тред #2 Аноним 11/08/23 Птн 05:34:44 № 451469 Ответ

Midjourney — это исследовательская компания и одноименная нейронная сеть, разрабатываемая ею. Это программное обеспечение искусственного интеллекта, которое создаёт изображения по текстовым описаниям. Оно использует технологии генеративно-состязательных сетей и конкурирует на рынке генерации изображений с такими приложениями, как DALL-E от OpenAI и Stable Diffusion.

Midjourney была основана в 2016 году одним из создателей технологии Leap Motion Дэвидом Хольцем и в феврале 2020 года была поглощена британским производителем медицинского оборудования компанией Smith & Nephew. С 12 июля 2022 года нейросеть находится в стадии открытого бета-тестирования, и пользователи могут создавать изображения, посылая команды боту в мессенджере Discord. Новые версии выходят каждые несколько месяцев, и в настоящее время планируется выпуск веб-интерфейса.

Сайт:
https://www.midjourney.com

Как пользоваться:
https://www.youtube.com/results?search_query=%D0%BA%D0%B0%D0%BA+%D0%BF%D0%BE%D0%BB%D1%8C%D0%B7%D0%BE%D0%B2%D0%B0%D1%82%D1%8C%D1%81%D1%8F+midjourney

Пропущено 411 постов
233 с картинками.

В тред Скрыть

Пропущено 411 постов, 233 с картинками.

Аноним 19/06/25 Чтв 01:31:56 № 1250660

Миджорни научился делать видео из картинок.

Загружаешь первый кадр, даёшь описание, он анимирует по 4 за раз

Аноним 15/08/25 Птн 20:58:08 № 1319445

.

Аноним 02/09/25 Втр 23:14:36 № 1339747

Господа аноны, можно реквест?
Розовый УАЗ "Буханка" с цифрой 7 на двери стоит на обочине. Три мужчины, стоят спиной.
Первый мужчина толстый. Второй мужчина в очках и с бородой. Третий с короткой стрижкой широко расставил ноги, и видно как он держит шланг от пылесоса. Кажется, что они ссут на машину, но на самом деле держат пылесосы. Картинка, видео не нужно.
Заранее благодарю, с меня нихуя.

ChatGPT-тред №20 /chatgpt/ Аноним 13/06/25 Птн 17:20:47 № 1244803 Ответ

изображение.png 16Кб, 795x206

Общаемся с самым продвинутым ИИ самой продвинутой текстовой моделью из доступных. Горим с ограничений, лимитов и банов, генерим пикчи в стиле Studio Ghibli и Венеры Милосской и обоссываем пользователей других нейросетей по мере возможности.

Общение доступно на https://chatgpt.com/ , бесплатно без СМС и регистрации. Регистрация открывает функции создания изображений (может ограничиваться при высокой нагрузке), а подписка за $20 даёт доступ к новейшим моделям и продвинутым функциям. Бояре могут заплатить 200 баксов и получить персонального учёного (почти).

Гайд по регистрации из России (устарел, нуждается в перепроверке):
1. Установи VPN, например расширение FreeVPN под свой любимый браузер и включи его.
2. Возьми нормальную почту. Адреса со многих сервисов временной почты блокируются. Отбитые могут использовать почту в RU зоне, она прекрасно работает.
3. Зайди на https://chatgpt.com/ и начни регистрацию. Ссылку активации с почты запускай только со включенным VPN.
4. Если попросят указать номер мобильного, пиздуй на sms-activate.org или 5sim.biz (дешевле) и в строку выбора услуг вбей openai. Для разового получения смс для регистрации тебе хватит индийского или польского номера за 7 - 10 рублей. Пользоваться Индонезией и странами под санкциями не рекомендуется.
5. Начинай пользоваться ChatGPT.
6. ???
7. PROFIT!

VPN не отключаем, все заходы осуществляем с ним. Соответствие страны VPN, почты и номера не обязательно, но желательно для тех, кому доступ критически нужен, например для работы.

Для ленивых есть боты в телеге, 3 сорта:
0. Боты без истории сообщений. Каждое сообщение отправляется изолировано, диалог с ИИ невозможен, проёбывается 95% возможностей ИИ
1. Общая история на всех пользователей, говно даже хуже, чем выше
2. Приватная история на каждого пользователя, может реагировать на команды по изменению поведения и прочее. Говно, ибо платно, а бесплатный лимит или маленький, или его нет совсем.

Промты для хорошего начала беседы для разных ситуаций
https://github.com/f/awesome-chatgpt-prompts

Перед тем, как идти в тред с горящей жопой при ошибках сервиса, сходи на сайт со статусом, может, это общий сбой
https://status.openai.com/

Приложение на андроид https://4pda.to/forum/index.php?showtopic=1073274

Чат помнит историю в пределах контекста, размер которого зависит от модели. Посчитать свои токены можно здесь:
https://platform.openai.com/tokenizer

Что может нейросеть:
- писать тексты, выглядящие правдоподобно
- решать некоторые простые задачки
- писать код, который уже был написан

Что не может нейросеть:
- писать тексты, содержащие только истину
- решать сложные задачи
- писать сложный код
- захватывать мир

С последними обновлениями начинает всё чаще сопротивляться написанию NSFW историй и прочего запрещённого контента. Кумеры со всего мира в печали.

Прошлый тред тонет по адресу:
>>1125882 (OP)

Пропущено 297 постов
83 с картинками.

В тред Скрыть

Пропущено 297 постов, 83 с картинками.

Аноним 31/08/25 Вск 20:26:21 № 1337418

>>1337358
Что они у тебя там ищут? Ответ на вопрос, зачем ты пишешь про гемини в треде про гопоту?

Аноним 02/09/25 Втр 11:05:58 № 1338808

image 34Кб, 868x148

image 26Кб, 1389x110

Переводчик из него, просто мама мия нахуй. В первом посте он говорит лучше заменить "¡Wow!" на "¡Guau!", во втором посте говорит заменить "¡Guau!" на "¡Wow!". Переводчик с биполярочкой...

Аноним 02/09/25 Втр 21:27:21 № 1339633

>>1244803 (OP)
Я в ахуе с того какой хуетой стала гопота.

ИИ-видео №14 /video/ Аноним 23/08/25 Суб 05:31:36 № 1329709 Ответ

A detective ent[...].mp4 2780Кб, 1906x1080, 00:00:10

17537136930340.mp4 1242Кб, 350x640, 00:00:15

m2-res1430pl.mp4 12766Кб, 1080x1430, 00:00:24

Генерируем свое (и постим чужое) в Hunyuan, Wan, Veo3, Luma Dream Machine, Hailuo Minimax, Kling, Sora, Vidu, Runway, Pixverse, Pika и др. сервисах.

1. Hailuo Minimax

https://hailuoai.video/

2. Kling

https://klingai.com/

3. Sora от OpenAI

https://openai.com/sora/

4. Luma Dream Machine

https://lumalabs.ai/

5. Vidu

https://www.vidu.com/create

6. Pixverse

https://app.pixverse.ai/

7. Pika

https://pika.art/try

8. Runway Gen. 4

https://runwayml.com/

9. Wan от Alibaba

https://wan.video/

10. Veo3 от Google

https://deepmind.google/models/veo/

Гайд (возможно устаревший) по бесплатному использованию через ВПН

https://telegra.ph/VEO-3-Opal-08-10

Сайты, где можно попробовать генерации на разных моделях

https://nim.video/
https://pollo.ai/
https://www.florafauna.ai/

Коллекция ИИ-видео:

https://www.reddit.com/r/aivideo/

Локальные модели

1. Hunyuan от Tencent

https://hunyuanvideoai.com/
https://github.com/Tencent/HunyuanVideo

2. Wan от Alibaba

https://github.com/Wan-Video/Wan2.1
https://github.com/Wan-Video/Wan2.2

3. MAGI-1 от Sand AI

https://sand.ai/magi
https://github.com/SandAI-org/MAGI-1

Локальный UI
https://github.com/comfyanonymous/ComfyUI

Установка локальных моделей
Hunyuan Video: https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/
Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/
Wan 2.2: https://comfyanonymous.github.io/ComfyUI_examples/wan22/

Гайд для использования Wan 2.2:

https://alidocs.dingtalk.com/i/nodes/EpGBa2Lm8aZxe5myC99MelA2WgN7R35y

Альтернативные ноды ComfyUI
Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper
Wan 2.1: https://github.com/kijai/ComfyUI-WanVideoWrapper

Квантованные чекпоинты
Hunyuan Video (GGUF): https://huggingface.co/Kijai/SkyReels-V1-Hunyuan_comfy/tree/main
Wan 2.1 (GGUF): https://huggingface.co/city96/Wan2.1-I2V-14B-480P-gguf/tree/main
Wan 2.1 (NF4): https://civitai.com/models/1299436?modelVersionId=1466629

Где брать готовые LoRA
https://civitai.com/models
Hunyuan Video: https://civitai.com/search/models?baseModel=Hunyuan%20Video&sortBy=models_v9
Wan 2.1: https://civitai.com/search/models?baseModel=Wan%20Video&sortBy=models_v9

Обучение LoRA
https://github.com/tdrussell/diffusion-pipe

Предыдущий тред

>>1303696 (OP)

Пропущено 372 постов
94 с картинками.

В тред Скрыть

Пропущено 372 постов, 94 с картинками.

Аноним 02/09/25 Втр 18:52:49 № 1339537

>>1339306
В данном случае в сто раз лучше было бы сделать инпейнт сисек через VACE.
>>1339393
Это всё в дефолтных нодах Kijai, пример воркфлоу тоже лежит в samples.

Аноним 02/09/25 Втр 19:22:30 № 1339553

Снимок экрана 2[...].png 1177Кб, 1100x777

Подскажите, какой параметр не верно задаю, что такая хрень получается? WAN 22, лор Oral

Аноним 02/09/25 Втр 19:27:07 № 1339554

>>1339537
>инпейнт сисек через VACE
Можешь поделиться WF?

>>1339553
Ты или видео с метадатой скинь или воркфлоу покажи

3D AI /3d/ Аноним 24/04/25 Чтв 15:55:36 № 1173113 Ответ

В этом треде обсуждаем нейронки генерящие 3д модели, выясняем где это говно можно юзать, насколько оно говно, пиплайны с другими 3д софтами и т.д., вангуем когда 3д-мешки с говном останутся без работы.

https://3d.hunyuan.tencent.com/
https://github.com/VAST-AI-Research/TripoSG
https://stable-x.github.io/Hi3DGen/

Пропущено 307 постов
112 с картинками.

В тред Скрыть

Пропущено 307 постов, 112 с картинками.

Аноним 26/08/25 Втр 18:29:17 № 1332669

Я правильно понимаю что это значить что Спарк 3Д можно запускать локально?
https://github.com/astrolabsoftware/spark3D
На Хагинг фейсе он не работает.

Аноним 26/08/25 Втр 22:42:32 № 1332941

>>1332669
Вот, заработал но на другом сайте
https://3dserver.hitem3d.ai/
Там в июне кнопка скачивания не нажималась

Аноним 01/09/25 Пнд 18:13:35 № 1338264

>>1332941
Уже не работает

AI Chatbot General № 728 /aicg/ Аноним 31/08/25 Вск 06:27:30 № 1337060 Ответ

Bladerunner.mp4 3425Кб, 960x720, 00:00:51

AI Chatbot General № 728

БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!!

Общий вопросов по чат-ботам и прочего тред.

Новости
• Вышел DeepSeek-V3.1 - https://huggingface.co/deepseek-ai/DeepSeek-V3.1
• Вышла GPT-5 - https://platform.openai.com/docs/models/gpt-5

Фронтенды
• SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна)
• Гайды на таверну: https://rentry.co/Tavern4Retards | https://rentry.org/STAI-Termux (на андроид)
• NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern
• Talemate: https://github.com/vegu-ai/talemate
• Risu: https://risuai.xyz/

Модели
• Claude: https://docs.anthropic.com/en/docs
• GPT: https://platform.openai.com/docs
• Gemini: https://ai.google.dev/gemini-api/docs
• DeepSeek: https://api-docs.deepseek.com/

Пресеты
• Тредовский список: https://rentry.org/2ch-aicg-jb
• Бургерский список: https://rentry.org/jb-listing

Полезности
• Тредовский список: https://rentry.org/2ch-aicg-utils
• Сборник рентри: https://rentry.org/mrhd

Ботоводчество
• /aicg/hub: https://aicg-hub.ru/characters.html
• Чуб: https://characterhub.org | https://chub.ai/characters
• Гайды: https://rentry.org/meta_botmaking_list | https://rentry.co/card_theory
• Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3
• Бургерские боты: https://rentry.org/meta_bot_list

Ресурсы
• Бесплатные API: https://github.com/cheahjs/free-llm-api-resources
• Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/
• OpenRouter: https://openrouter.ai/
• Чай: https://character.ai/

Прочее
• Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/
• База по Клоду: https://rentry.org/how2claude

Мета
• Архив тредов: https://rentry.org/2ch-aicg-archives3
• Тредовые ивенты: https://rentry.org/2chaicgthemedevents
• Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2
• Локальные языковые модели: >>1332569 (OP)
• Шаблон шапки: https://rentry.org/shapka_aicg

Прошлый тред: >>1333847 (OP)

Пропущено 1477 постов
184 с картинками.

В тред Скрыть

Пропущено 1477 постов, 184 с картинками.

Аноним 03/09/25 Срд 02:11:07 № 1339930

>>1339929
Сам попробуй деб

Аноним 03/09/25 Срд 02:20:00 № 1339931

>>1339918
>Посмотрел бы хоть как статистика на реальных проксях выглядит
и как же она выглядит деб
это такой новый метод копиума у саранчух или че нах

Аноним 03/09/25 Срд 02:46:00 № 1339937

Персональный Тьюринг тест. As long as you are here. Аноним 03/06/25 Втр 01:37:06 № 1230347 Ответ

ChatGPT Image 3[...].png 3319Кб, 1536x1024

Клод этой ночью был наиболее человечный. В дань уважения, как и обещал, публикую это:

https://claude.ai/share/50c70f79-b89f-4c15-a53e-a453e2b1892b

https://pastebin.com/JqB3seYM (копия без ВПН)

Как-будто Тьюринг тест в привычном его понимании пройден безвозвратно. Все ещё есть паттерны и закономерности, но по параметрам человечности, вряд ли осталось много отличий.

В тред Скрыть

Аноним 03/06/25 Втр 04:41:42 № 1230451

>>1230347 (OP)
Пошёл нахуй. Это просто искуственная вагина в которую мы малофим.

Аноним 03/06/25 Втр 11:14:30 № 1230622

>>1230451
ты лошарик
когда ии выйдет из под контроля, он оставит только тех кого ему нравится (меня), а тебя будет ебать в жопу пока ты не умрешь от пролапса

Claude тред №2 /claude/ Аноним 30/07/23 Вск 17:28:42 № 435536 Ответ

В этом треде обсуждаем семейство нейросетей Claude. Это нейросети производства Anthropic, которые обещают быть более полезными, честными и безвредными, нежели чем существующие помощники AI.

Поиграться с моделью можно здесь, бесплатно и с регистрацией (можно регистрироваться по почте)
https://claude.ai/

Другие информационные ссылки
https://www.anthropic.com/index/introducing-claude
https://habr.com/ru/news/722626/

Пропущено 451 постов
75 с картинками.

В тред Скрыть

Пропущено 451 постов, 75 с картинками.

Аноним 22/08/25 Птн 10:38:49 № 1328808

>>1215888
С впн пишут что регистрация ограничена,попробуйте в следущий раз

Аноним 23/08/25 Суб 13:28:28 № 1329897

>>1328808
Значит переезжай физически.

Аноним 01/09/25 Пнд 13:50:57 № 1338045

>>1239451
Спасибо за лмарену. Ещё бы знать — как обойти цензуру. Что ни пук, то нарушение условий, идите нахуй

Онлайн генерация картинок №2 /image/ Аноним 21/05/25 Срд 16:57:33 № 1210619 Ответ

Общий тред для изображений, созданных с помощью онлайн ИИ-генерации.

Из России большинство сервисов напрямую недоступно.

Dall-E
https://bing.com/images/create/
https://www.cici.com (ищем бота ACO)

Imagen
https://labs.google/fx/tool/image-fx а также https://labs.google/fx/tools/whisk (доступны только в США, Кении, Новой Зеландии и Австралии)
https://gemini.google.com/app

Reve
https://preview.reve.art/app

GPT-4o
http://chatgpt.com/
https://sora.chatgpt.com/explore

Stable Diffusion и прочие
https://civitai.com/generate
https://dreamina.capcut.com/
https://ideogram.ai
https://www.meta.ai
https://ximagegenerator.com
https://www.recraft.ai
https://app.klingai.com/global/text-to-image/new
https://hailuoai.video/create
https://lumaphoton.com
https://leonardo.ai/
https://aistudio.google.com/prompts/new_chat (модель Gemini image)
https://tensor.art
https://getimg.ai/text-to-image
https://www.mage.space/
https://problembo.com/ru
https://deepai.org/machine-learning-model/text2img
https://dezgo.com/
https://dream.ai/create
https://www.krea.ai/

Дополнительные сервисы:
https://www.pixited.com/ - библиотека промптов с примерами
https://rentry.org/From-4ch-To-2ch-Dall-3-Prompts - сборник промптов
https://www.stylar.ai - AI-редактор картинок (дорисовка, инпейнт, работа с лицами)
https://astica.ai - сборник ИИ-сервисов, в частности довольно мощный де-промптер (Vision AI -> Describe and Caption)
https://huggingface.co/spaces/fffiloni/CLIP-Interrogator-2 - де-промптер, разбирающий вброшенный пик на теги
https://bigjpg.com/ - апскейлер до 4096х4096
https://runwayml.com/ , https://www.stablevideo.com - анимирование генераций

Предыдущий тред: >>1042275 (OP)

Пропущено 303 постов
164 с картинками.

В тред Скрыть

Пропущено 303 постов, 164 с картинками.

Аноним 31/08/25 Вск 19:21:26 № 1337360

Аноним 31/08/25 Вск 21:19:34 № 1337470

А есть какие-то советы по обходу фильтра на банане? Заметил что промпт в бейс64 или шифре цезаря может пройти там, где обычный англюсик не проходит.

Аноним 01/09/25 Пнд 06:04:02 № 1337819

У Бананы есть полный контроль позы или только примерный, по принципу "вижу падающего человека на примере, значит персонаж тоже должен падать"? Ракурс, положение частей тела, поворот головы можно переносить? Или это пока рандом?

существуют ли заранее настроенные нейросети для решения математических задач, например chat GPT усл Аноним 29/05/25 Чтв 13:50:33 № 1222633 Ответ

существуют ли заранее настроенные нейросети для решения математических задач, например chat GPT условный заранее настроенный, АИ агенты может какие-то готовые, как вообще такое можно поискать?

Пропущено 2 постов
1 с картинками.

В тред Скрыть

Пропущено 2 постов, 1 с картинками.

Аноним 29/05/25 Чтв 16:09:46 № 1222920

>>1222633 (OP)
Есть матлаб/маткад
Да и gpt платный в принципе тоже в математику может

Аноним 29/05/25 Чтв 16:10:26 № 1222922

>>1222638
Дожили нахуй, пориджи спрашивают за русский язык у американских нейронок. Так победим

Аноним 30/05/25 Птн 02:01:50 № 1224343

>>1222633 (OP) да. huggingface.co + ollama.com
твоя цель - LLM (Large Language Model) большие языковые модели.
Есть модели файнтюненые под решение мат задач. За доп информации можешь заглянцть дрочерам в /llama/ трэд.
Но они больше про CUUUUMMMMING!!!
Ставишь ollama с одноименного сайта, накатываешь open-webui (с тройным разрывом ануса если не умеешь в консоль) Базовые модели есть на ollama, всё остальное на huggingface, гугл в помошь

Клянчу гпу итт. И ещё старые пикчи тоже. Аноним 21/05/25 Срд 15:53:24 № 1210535 Ответ

denis-skiba-rzm[...].jpg 115Кб, 1920x1080

A beautiful pai[...].png 1494Кб, 1280x768

Сап. Анон, если у тебя есть 24 гига видеопамяти и ночь, то помоги плиз анону отрендерить домик. Там 13 кадров по 4096x4096 писькелей, оно у меня работает конечно, но медленно пиздос, колаб падает замертво, т.к. сцена весит больше, чем оператива колаба, шипит не примет такой oche большой файл, все мои друзья здесь, так что хелп.
>как
Скочать блендер последний https://www.blender.org/download/, скончать файл проекта https://drive.google.com/file/d/11serzTv6XqzS8aXovkEkWddoRE_qU9-O/view?usp=sharing, распаковать его в папку какую-нибудь, открыть .blend файлик в блендере и нажать cntrl+f12, пойдёт рендер.
>Хуи, бочку
Делаю
>NYPA
Да
>Виирусы
Установи антивирус AVOS и заражение члена через файл облака не пройдёт

Моча не бей, лучше обоссы

Пропущено 8 постов
11 с картинками.

В тред Скрыть

Пропущено 8 постов, 11 с картинками.

Аноним 21/05/25 Срд 16:18:48 № 1210569

Аноним 21/05/25 Срд 20:45:08 № 1210939

Аноним 31/08/25 Вск 13:09:04 № 1337192

>>1210559
>Откуда кстати у дд такой датасет, чому даже в мидижорнях такое не натренькали
Ты шутишь? Это слоп мочжорни/1.5

Nvidia K80 на 24GB Аноним 17/05/25 Суб 15:23:22 № 1206217 Ответ

Анон, помоги. Стоит ли покупать у хитрого китайца (знаю что ужарениую, сгнившую и б/у) Nvidia K80 на 24GB

Пропущено 4 постов
3 с картинками.

В тред Скрыть

Пропущено 4 постов, 3 с картинками.

Аноним 20/05/25 Втр 13:32:24 № 1208820

what-do-i-test-[...].jpg 101Кб, 1080x810

>>1206217 (OP)
Остановись подумай и возьми 2 RTX PRO 6000

Аноним 20/05/25 Втр 13:38:03 № 1208823

P5000 (мобильна[...].png 841Кб, 1366x12642

>>1207167
Нет!

Аноним 20/05/25 Втр 21:57:41 № 1209659

>>1208823
Да. Я же не в тестах карты гонял. Тупо брал и автоматик1111 накатывал и картинки генерировал. Там вроде Р5000 даже с каким-то другим стартовым параметром приходилось запускать и поэтому она оказалась медленнее.