3 min Applications

Razend populaire beeldgenerator van OpenAI nu gratis

Razend populaire beeldgenerator van OpenAI nu gratis

Een week geleden verraste de nieuwste GPT-4o-beeldgenerator van OpenAI dankzij verbluffend sterke resultaten. Nu kondigt OpenAI-CEO Sam Altman zoals beloofd aan dat de functie gratis beschikbaar is, zij het met beperkingen.

Hoewel OpenAI niet precies aangeeft hoeveel afbeeldingen gebruikers in het gratis abonnement kunnen genereren, meldde Sam Altman vorige week al dat er een limiet van drie afbeeldingen per dag zou worden gehanteerd. Dit is een aanzienlijke beperking vergeleken met de mogelijkheden voor betalende gebruikers (vijf per uur), maar biedt wel een laagdrempelige instap voor mensen die willen experimenteren met AI-beeldgeneratie.

Enorme populariteit

De beeldgeneratietool van OpenAI werd direct na lancering enorm populair. Zo populair zelfs dat Altman aangaf dat de GPU’s van het bedrijf “aan het smelten waren” door de grote vraag. Gebruikers konden in korte tijd indrukwekkende beelden creëren in diverse stijlen, wat leidde tot een explosie aan online gedeelde generaties.

De generator werkt niet met een ‘diffusion’-techniek zoals gold voor voorganger DALL-E 3 (dat al in ChatGPT zat ingebouwd en nu is vervangen) of bij concurrent Stable Diffusion. In plaats daarvan bereikt het model het eindresultaat op een vergelijkbare manier als bij tekst. De transformer-architectuur voedt voortdurend nieuwe gegenereerde informatie door, waarbij de afbeelding van links naar rechts en van boven naar beneden toe wordt opgebouwd.

Een van de sterkere punten van GPT-4o is het vermogen om meerdere objecten met specifieke eigenschappen en relaties accuraat weer te geven. Waar eerdere modellen moeite hadden met de juiste plaatsing van 5 tot 8 elementen, kan GPT-4o er 10 tot 20 tegelijk verwerken, wat de complexiteit van de gegenereerde beelden aanzienlijk verhoogt.

Opvallend was de snelle populariteit van het genereren van afbeeldingen in de stijl van de Japanse animatiestudio Studio Ghibli. Dit leidde echter ook tot nieuwe discussies over auteursrecht en de trainingsdata die OpenAI gebruikt. Dit is al sinds de opkomst van ChatGPT een onopgelost vraagstuk. De sterke gelijkenis met de originele stijl van Studio Ghibli roept vragen op over hoe AI-modellen omgaan met beschermde artistieke expressies, hoewel er geen restrictief auteursrecht zit op een bepaalde stijl. OpenAI heeft al eerder beweerd dat het AI-outputs juridisch zal beschermen indien nodig.

Veiligheidsmaatregelen

OpenAI heeft daarnaast stappen ondernomen om de veiligheid van zijn beeldgeneratie te verbeteren. Alle gegenereerde afbeeldingen worden voorzien van C2PA-metadata om transparantie te garanderen. Deze metadata helpt om de herkomst van afbeeldingen te kunnen achterhalen, wat belangrijk is in een tijd waarin het onderscheid tussen AI-gegenereerde en echte beelden steeds moeilijker wordt. De vraag is of dit uiteindelijk een oplossing biedt, aangezien het nog altijd mogelijk is de afbeelding te reproduceren zonder deze metadata mee te nemen.

Om gebruikers in bescherming te nemen en af te remmen, heeft OpenAI een intern redeneermodel ontwikkeld dat getraind is op menselijke veiligheidsrichtlijnen. Dit model helpt bij het interpreteren en handhaven van beleid rond beeldgeneratie, waardoor misbruik van de technologie wordt tegengegaan.

Lees ook: OpenAI introduceert geavanceerde beeldgeneratie met GPT-4o