0

OpenAI introduceert een stemassistent zoals in de Hollywood-film “Her”

OpenAI heeft een nieuwe versie van zijn vlaggenschip ChatGPT-kunstmatige-intelligentiesysteem onthuld. Deze bevat een nieuwe stemassistent die het gebruik van AI eenvoudiger maakt. Dit is een van de meest interessante technologische innovaties van de afgelopen jaren.

Het nieuwe AI-model, GPT-4o genaamd, kan afbeeldingen en video (naast tekst) beter verwerken en kan in realtime via spraak met mensen communiceren. Mensen kunnen de nieuwe spraakfunctie onderbreken tijdens een gesprek, in tegenstelling tot huidige stemassistenten zoals Siri, en het model kan vrijwel onmiddellijk reageren, aldus het bedrijf.

OpenAI introduceert een stemassistent zoals in de Hollywood-film "Her"

Tijdens een livestream op maandag lieten leidinggevenden van OpenAI zien hoe het model code kon analyseren, talen tussen twee gesprekspartners kon vertalen of gebruikers door een eenvoudig algebraprobleem kon leiden dat op een stuk papier was geschreven. Dit alles lijkt in realtime te gebeuren.

De lancering van GPT-4o weerspiegelt een poging van OpenAI en andere startups en technologiegiganten om hun gebruikersbestand uit te breiden en inkomsten te genereren uit generatieve AI-technologie. Deze behoefte om geld te verdienen groeit omdat bedrijven enorme hoeveelheden geld hebben geïnvesteerd in de rekenkracht en energie die nodig zijn om hun systemen te ontwikkelen.

OpenAI maakte het nieuws een dag vóór Google bekend

De aankondiging van OpenAI kwam een dag voor de start van Google’s jaarlijkse ontwikkelaarsconferentie, bekend als I/O. Google concurreert met OpenAI en haar partner en investeerder Microsoft om dominantie op het gebied van generatieve AI.

Sam Altman, CEO van OpenAI, vergeleek het nieuwe product met AI-tools die je normaal gesproken in films ziet. In een toespraak vorig jaar zei hij dat hij en andere leidinggevenden van OpenAI inspiratie hadden gevonden in de film ‘Her’ uit 2013, over een man die verliefd wordt op een stemassistent. Altman en andere OpenAI-medewerkers plaatsten kort na de aankondiging op maandag relevante verwijzingen naar de video op het X-platform.

OpenAI introduceert een stemassistent zoals in de Hollywood-film "Her"

Het nieuwe model kan ook emoties detecteren in de toon van iemands stem of gezichtsuitdrukking, betoogt OpenAI. Ook kan hij sneller schakelen tussen verschillende emotionele tonen, van een dramatische stem tot een robotachtige toon tot zang. Deze functie zal de komende weken beschikbaar zijn voor gebruikers van ChatGPT Plus, de versie waarvoor abonnementskosten van $ 20 per maand vereist zijn.

Waarom ChatGPT-4o en niet 5.0?

GPT-4o zal ook aan bedrijven worden aangeboden. Mira Murati, Chief Technology Officer van OpenAI, zei dat het model twee keer zo snel zal zijn en de helft van de prijs zal kosten van het huidige, meest geavanceerde GPT-4 Turbo-aanbod.

Het bedrijf zei dat de letter “o” in de GPT-4o-naam staat voor “omni”. Omni is een Latijns woord dat ‘alles’ of ‘alleskunner’ betekent. Het wordt gebruikt om de veelzijdigheid of het vermogen om veel verschillende aspecten te bestrijken te benadrukken. De naam ChatGPT 4o komt voort uit het feit dat het GPT-4o-model een alles-in-één (omni) artificieel intelligentiemodel is, dat in staat is tekst, afbeeldingen en audio te verwerken.

OpenAI biedt al een functie genaamd ‘stemmodus’, die drie afzonderlijke modellen combineert om via stem op gebruikers te reageren. Het werkt echter vrij langzaam. GPT-4o is daarentegen gebouwd als één enkel model dat is getraind op tekst-, beeld- en audiomateriaal – en kan sneller en nauwkeuriger reageren op een verscheidenheid aan signalen.

Leidinggevenden van OpenAI weigerden te beschrijven welk soort gegevens werden gebruikt om het model te trainen. Ze weigerden ook uit te leggen of OpenAI erin slaagde het nieuwe model met minder rekenkracht te trainen.

OpenAI introduceert een stemassistent zoals in de Hollywood-film "Her"

Plannen voor de toekomst

Momenteel werkt OpenAI ook aan een geheel nieuw AI-model genaamd GPT-5, dat naar verwachting een grote sprong voorwaarts zal opleveren ten opzichte van de huidige technologie.

Murati zei dat het OpenAI-team niet zozeer inspiratie putte uit de film “Her” als wel uit menselijke gesprekken. – Als je stopt met praten, komt ChatGPT binnen. Hij kan je toon tot op zekere hoogte lezen en erop reageren. En het is heel natuurlijk, rijk en interactief, zei ze. En inderdaad, ChatGPT 4o lijkt geweldig en merkbaar beter te werken dan wat Google’s Gemini biedt. Voorlopig wint OpenAI de strijd om de AI-koning.

admin

Leave a Reply

Your email address will not be published. Required fields are marked *