Как создать музыку по текстовому запросу
Riffusion генерирует трек на основе промптов. Сервис работает на основе Stable Diffusion 1.5 и Torchaudio.
Для этого ИИ создает визуальное представление (соннограмму) звука, а после превращает его в аудио. В сонограмме ось X показывает время — порядок воспроизведения частот, заданных в Y.
Насыщенность каждого пикселя отображает громкость звука.
Инструмент соединяет различные звуки и жанры в единое целое и вносит в мелодию элементы соответствующих жанров, следуя промптам.
#сервис