De meest populaire generatieve kunstmatige intelligentie heeft een nieuwe versie. ChatGPT versie 4o mini is een afgeslankte versie van het vlaggenschip AI-model, dat is ontworpen om zowel populaire taken als de belangrijkste ChatGPT uit te voeren, maar sneller werkt. Er zijn ook voordelen voor OpenAI: de kosten voor het onderhoud van 4o mini zullen lager zijn.
OpenAI onthulde GPT-4o in mei van dit jaar en toonde zijn potentieel als digitale assistent die visuele en audio-informatie in realtime kan verwerken. Bovendien klonk de assistent praktisch als Scarlett Johansson, met een verwarrend vergelijkbare stem zonder toestemming of medeweten van de actrice. Dit was een van de redenen waarom OpenAI de implementatie van enkele van de aanbevolen functies uitstelde.
Blijkbaar waren er ook veiligheidsproblemen en dit vertraagde ook het debuut van een volledig operationele GPT-4o. Nu zijn enkele bugs opgelost en lanceert OpenAI GPT-4o mini. Ook dit jaar worden er nog meer noviteiten verwacht.
ChatGPT-4o mini is een antwoord op de marktbehoeften
Anthropic en Google hebben de afgelopen maanden flexibele, minder geavanceerde en goedkopere versies van hun AI-modellen geïntroduceerd om ontwikkelaars en bedrijven meer opties te bieden. Een kleiner model van generatieve AI kan bijvoorbeeld nog steeds bepaalde taken automatiseren, documentsamenvattingen voorbereiden of vooraf opgemaakte e-mails voor verkopers maken. Vaak hebben bedrijven geen behoefte aan een geavanceerd, volledig functioneel model, bijvoorbeeld voor complexe analyses, en willen ze daar niet voor betalen.
OpenAI had dit type model niet voor zakelijke klanten, maar dat is nu aan het veranderen. Het bedrijf gaf toe dat het de meest geavanceerde AI op de markt wil en zal blijven ontwikkelen, maar ook wil inspelen op de behoeften van de markt – en daarom introduceerde het de GPT-4o miniversie.
Voorlopig kan GPT-4o mini tekst en afbeeldingen verwerken en genereren. In de toekomst zal het ook andere soorten inhoud kunnen ondersteunen. De huidige versie wordt al gewaardeerd door enkele start-ups, die vaak geen grote budgetten hebben. Superhuman gebruikt het nieuwe model dus al om automatische antwoorden op berichten te creëren, en de startup Ramp uit de financiële sector helpt zichzelf met GPT-4o mini bij de taak om informatie te extraheren uit door gebruikers gescande bonnen. Elke dag stappen meer bedrijven over op de “mini”-versie.
De nieuwste ChatGPT maakt ook gebruik van de nieuwe beveiligingsstrategie van het bedrijf. Het is ook het eerste OpenAI-model dat dergelijke mogelijkheden heeft. Waar hebben we het precies over? Dit is de zgn instructiehiërarchie, een aanpak die is ontworpen om ervoor te zorgen dat een AI-systeem bepaalde instructies prioriteit geeft en deze niet kan omzeilen. Dit voorkomt dat mensen het gereedschap dwingen dingen te doen die het niet zou moeten doen (bijvoorbeeld instructies maken over hoe je een bom moet bouwen of schadelijke chemicaliën).
GPT-4o mini verbruikt minder bronnen, waardoor OpenAI kosten bespaart. Gebruikers van gratis accounts hebben toegang tot deze versie van AI, maar het gebruik van de volledige GPT-4o zal beperkt zijn. Abonnees van de ChatGPT Plus-versie ($20/maand) hebben op hun beurt toegang tot GPT-4, GPT-4o en GPT-4o mini. Ze kunnen ook bestanden uploaden voor analyse, afbeeldingen maken in Dall-E, informatie van internet gebruiken en aangepaste GPT’s maken en gebruiken.
OpenAI wil zijn eigen chips hebben
Het verschijnen van GPT-4o mini heeft ook veel te maken met het feit dat OpenAI op zoek is naar manieren om het onderhouden van de IT-infrastructuur goedkoper te maken. AI-modellen hebben een gigantische honger naar elektriciteit.
Aan de ene kant creëert het bedrijf minder geavanceerde en goedkoper te onderhouden AI-modellen, en aan de andere kant streeft het ernaar meer controle te hebben over de infrastructuur zelf. OpenAI is momenteel in gesprek met Broadcom om de productiecapaciteit van de gigant te gebruiken om chips voor OpenAI te maken. Dankzij dit zou de startup van Sam Altman toegang krijgen tot systemen die een lager stroomverbruik zouden moeten hebben dan wat er momenteel op de markt is, maar bovenal zouden dit chips zijn die perfect “afgestemd” zijn op OpenAI-modellen. Zelfs als ze een vergelijkbaar energieverbruik zouden hebben, zouden ze meer taken kunnen uitvoeren (hogere efficiëntie).
De gesprekken met Broadcom zijn al in een vergevorderd stadium en OpenAI heeft naar verluidt al een aantal engineers aangenomen, waaronder voormalige Google-medewerkers die daar aan de Tensor-processor hebben gewerkt voor AI-taken.
De aandelen van Broadcom zijn dit jaar met 47% gestegen. Het bedrijf verkoopt een reeks componenten aan datacenterexploitanten die hun faciliteiten snel uitbreiden om aan de vraag naar AI-ontwikkeling te voldoen.