Afbeeldingscredits: Bryce Durbin/TechCrunch
OpenAI heeft vandaag een verbeterde versie onthuld van zijn tekst-naar-afbeelding-tool, DALL-E, die ChatGPT gebruikt – de virale chatbot van OpenAI – om de pijn bij het vragen weg te nemen.
De meeste moderne, door AI aangedreven tools voor het maken van afbeeldingen gebruiken aanwijzingen (afbeeldingsbeschrijvingen) en zetten deze om in kunstwerken in een reeks stijlen, van fotorealistisch tot fantasie. Maar het creëren van de juiste vector kan een uitdaging zijn, zo erg zelfs dat ‘agile engineering’ een echt beroep is geworden.
De nieuwe tool van OpenAI, DALL-E 3, gebruikt ChatGPT om claims in te vullen. Via ChatGPT kunnen abonnees van de premium ChatGPT-abonnementen van OpenAI, ChatGPT Plus en ChatGPT Enterprise, een verzoek om een afbeelding schrijven en deze verfijnen via gesprekken met de chatbot – waarbij ze de resultaten rechtstreeks in de chat-app ontvangen.
ChatGPT zal een korte prompt van niet meer dan een paar woorden gebruiken en deze beschrijvender maken, waardoor er meer richting wordt gegeven aan het DALL-E 3-model.
ChatGPT-integratie is niet het enige dat nieuw is in DALL-E 3. DALL-E 3 creëert ook afbeeldingen van hogere kwaliteit die aanwijzingen nauwkeuriger weergeven, zegt OpenAI, vooral als het om langere aanwijzingen gaat. Het kan beter omgaan met inhoud die historisch gezien modellen voor het genereren van afbeeldingen heeft belemmerd, zoals tekst en mensenhanden.
Bovendien heeft DALL-E 3 nieuwe mechanismen om algoritmische vooroordelen te verminderen en de veiligheid te verbeteren, zo zegt OpenAI. DALL-E 3 zal bijvoorbeeld verzoeken afwijzen waarin wordt verzocht om een portret in de stijl van levende kunstenaars of afbeeldingen van publieke figuren. Kunstenaars kunnen er nu voor kiezen om sommige (of alle) van hun kunstwerken niet te gebruiken om toekomstige generaties OpenAI-modellen te trainen in het omzetten van tekst naar afbeelding. (OpenAI wordt, samen met enkele van zijn concurrenten, geconfronteerd met een rechtszaak omdat het naar verluidt auteursrechtelijk beschermde werken van kunstenaars zou gebruiken om zijn generatieve AI-beeldmodellen te trainen.)
De lancering van DALL-E 3 komt terwijl de race om generatieve AI toeneemt, vooral op het gebied van beeldsynthese. Concurrenten als Midjourney en Stability AI blijven hun beeldgenererende modellen verbeteren, waardoor OpenAI onder druk wordt gezet om het hoofd boven water te houden.
OpenAI is van plan om DALL-E 3 in oktober uit te rollen naar premium ChatGPT-gebruikers, gevolgd door onderzoekslaboratoria en zijn API-klanten. Het bedrijf heeft niet gezegd wanneer – en of – het van plan is een gratis webtool uit te brengen, zoals wel gebeurde met DALL-E 2 en het originele DALL-E-model.
“Hipster-Friendly Explorer. Award-Winning Coffee Fanatic. Analyst. Problem Solver. Troublemaker.”
More Stories
Uit het astronautenrecord – The New York Times
De vreemde nieuwe manier om je voor te bereiden op de definitieve vorm van Destiny 2
Sony vraagt om PSN-accounts voor Helldivers 2 pc-spelers, en dat gaat niet goed