Společnost Meta přichází s AI nástrojem AudioCraft
Tento nový generátor je schopný na základě textových příkazů vytvářet audio pomocí tří modelů MusicGen, AudioGen a EnCodec.
Oficiální tisková zpráva tento nástroj představuje následovně:
„Zatímco u obrázků, videa a textu jsme byli svědky velkého nadšení z generativní umělé inteligence, u zvuku se zdá, že zůstává trochu pozadu. Některé nástroje jsou již venku, ale jsou velmi komplikované a nepříliš otevřené, takže si s nimi lidé nemohou snadno hrát. Generování vysoce věrného zvuku jakéhokoli druhu vyžaduje modelování složitých signálů a vzorců v různých měřítkách. Hudba je pravděpodobně nejnáročnějším typem zvuku pro generování, protože se skládá z lokálních a dálkových vzorců, od sady not až po globální hudební strukturu s více nástroji.
Rodina modelů AudioCraft je schopna vytvářet vysoce kvalitní zvuk s dlouhodobou konzistencí a snadno se používá. S AudioCraftem zjednodušujeme celkový návrh generativních modelů pro zvuk ve srovnání s předchozími pracemi v této oblasti — dáváme lidem plný recept na hraní si s existujícími modely, které Meta vyvíjela v posledních několika letech, a zároveň jim umožňujeme posouvat hranice a vyvíjet vlastní modely.“