Zpět na přehled
Post Thumbnail

Společnost Meta přichází s AI nástrojem AudioCraft

Tento nový generátor je schopný na základě textových příkazů vytvářet audio pomocí tří modelů MusicGen, AudioGen a EnCodec

Oficiální tisková zpráva tento nástroj představuje následovně: 

„Zatímco u obrázků, videa a textu jsme byli svědky velkého nadšení z generativní umělé inteligence, u zvuku se zdá, že zůstává trochu pozadu. Některé nástroje jsou již venku, ale jsou velmi komplikované a nepříliš otevřené, takže si s nimi lidé nemohou snadno hrát. Generování vysoce věrného zvuku jakéhokoli druhu vyžaduje modelování složitých signálů a vzorců v různých měřítkách. Hudba je pravděpodobně nejnáročnějším typem zvuku pro generování, protože se skládá z lokálních a dálkových vzorců, od sady not až po globální hudební strukturu s více nástroji.

Rodina modelů AudioCraft je schopna vytvářet vysoce kvalitní zvuk s dlouhodobou konzistencí a snadno se používá. S AudioCraftem zjednodušujeme celkový návrh generativních modelů pro zvuk ve srovnání s předchozími pracemi v této oblasti — dáváme lidem plný recept na hraní si s existujícími modely, které Meta vyvíjela v posledních několika letech, a zároveň jim umožňujeme posouvat hranice a vyvíjet vlastní modely.“