mei 1, 2024

Soest Nu

Soest Nu is de toonaangevende aanbieder van kwalitatief Nederlands nieuws in het Engels voor een internationaal publiek.

Door AI gegenereerde nummers worden langer, niet noodzakelijkerwijs beter

Door AI gegenereerde nummers worden langer, niet noodzakelijkerwijs beter

Met Stable Audio 2.0, het audiogeneratiemodel van Stable AI, kunnen gebruikers nu hun eigen audiofragmenten uploaden die ze vervolgens met aanwijzingen kunnen transformeren en door AI gegenereerde nummers kunnen maken. Maar de nummers zullen nog geen Grammy Awards winnen.

De eerste versie van Stable Audio werd uitgebracht in september 2023 en bood voor sommige betalende gebruikers slechts 90 seconden, wat betekent dat ze alleen korte audiofragmenten konden maken om uit te proberen. Stable Audio 2.0 biedt een volledig nummer van drie minuten, dezelfde lengte als de meeste radiovriendelijke nummers. Alle geüploade audiobestanden moeten vrij zijn van auteursrechten.

In tegenstelling tot het stemgeneratiemodel van OpenAI, Voice Engine, dat alleen beschikbaar is voor een selecte groep gebruikers, heeft Stability AI statische stemmen gratis en openbaar beschikbaar gemaakt via haar website en binnenkort ook via haar API.

Een groot verschil tussen Stable Audio 2.0 en de vorige versie is de mogelijkheid om nummers te maken die klinken als nummers, compleet met een intro, progressie en outro, zegt Stability AI.

Het bedrijf liet me een beetje spelen met de Stable Audio om te zien hoe het werkt, en laten we zeggen dat er nog een lange weg te gaan is voordat ik mijn innerlijke Beyoncé kan kanaliseren. Met een “popnummer met een Americana-vibe” (ik bedoelde overigens Americana) heeft Stable Audio een nummer geproduceerd dat gedeeltelijk klinkt alsof het thuishoort op een Mountain Vibes Wednesday Morning Spotify-afspeellijst. Maar ze voegde ook toe wat volgens mij zang is? laatst rand De verslaggever beweert dat het klinkt als walvisgeluiden. Ik maak me meer zorgen dat ik Keanu per ongeluk bij mij thuis heb uitgenodigd.

READ  iPhone 15- en iPhone 15 Pro-modellen zijn nu beschikbaar voor pre-order

Ik zou in theorie de audio kunnen aanpassen om het meer mijn luisterstijl te maken, omdat nieuwe functies in Stable Audio 2.0 gebruikers in staat stellen hun project aan te passen door de sterkte van de prompt aan te passen (oftewel hoeveel van een prompt te volgen) en hoeveel geüploade audio zal moduleren. Gebruikers kunnen ook geluidseffecten toevoegen, zoals gebrul van het publiek of toetsenbordklikken.

Afgezien van de vreemde geluiden van Whale Gregory, is het geen verrassing dat door AI gegenereerde nummers nog steeds raar en zielloos klinken. mijn collega Wes Davis bedacht dit nadat hij naar een nummer van Sono had geluisterd. Andere bedrijven, zoals Meta en Google, hebben zich ook beziggehouden met het genereren van AI-audio, maar hebben hun modellen niet publiekelijk vrijgegeven omdat ze feedback van ontwikkelaars verzamelen om te reageren op het probleem van zielloze audio.

Stable Audio is getraind op gegevens van AudioSparx, dat een bibliotheek heeft met meer dan 800.000 audiobestanden, aldus Stable AI in een persbericht. Stability AI bevestigt dat artiesten binnen AudioSparx zich hebben kunnen afmelden voor hun materiaal om het model te trainen. Auteursrechtelijk beschermde audiotraining was een van de redenen waarom de voormalige vice-president audio van Stable AI, Ed Newton-Rex, het bedrijf verliet kort nadat Stable Audio was gelanceerd. Voor deze release zegt Stability AI samen te werken met Audible Magic om zijn contentherkenningstechnologie te gebruiken om auteursrechtelijk beschermd materiaal te volgen en te voorkomen dat het het platform betreedt.

Stable Audio 2.0 is beter dan de vorige versie in het laten klinken van liedjes als liedjes, maar het is er nog niet. Als het model erop staat een soort zang toe te voegen, zal de volgende versie misschien duidelijker taalgebruik hebben.

READ  De nieuwe draadloze hoofdtelefoon van Turtle Beach doet eigenlijk alles