Het Chinese bedrijf DeepSeek, dat met minder chips en oudere technologie werkt, is in staat AI-modellen te ontwikkelen die vergelijkbaar zijn met die van bedrijven als Meta en OpenAI. Bovendien doet het dit met aanzienlijk kleinere budgetten, aldus Jan Jęcz, analist bij Polityka Insight.
“DeepSeek is een Chinees bedrijf binnen de kunstmatige intelligentie-industrie dat al enkele jaren actief is op de markt. Het bedrijf heeft meerdere AI-modellen ontwikkeld die voor iedereen toegankelijk zijn. Toch zijn dit geen open-source modellen, omdat er geen informatie beschikbaar is over de gebruikte datasets en trainingsmethoden,” merkte de expert op.
“Op 26 december bracht DeepSeek het V3-model uit, dat in vergelijkende tests zeer geavanceerd bleek te zijn en kon concurreren met modellen uit het Westen. De lancering ging gepaard met een document waarin stond dat de laatste training van dit model ongeveer 6 miljoen dollar kostte,” benadrukte Jęcz.
Volgens hem betekent dit echter niet dat het gehele model voor dit bedrag ontwikkeld werd.
“Veel media die hierover berichtten, begrepen dit verkeerd. DeepSeek meldde alleen dat de kosten voor het uitvoeren van de laatste test – dus het gebruik van processoren, energieverbruik en de benodigde infrastructuur – ongeveer 6 miljoen dollar bedroegen,” legde hij uit.
Hoewel het hier om de kosten van de laatste test ging en niet om de ontwikkeling van het gehele model, werden deze gegevens als baanbrekend beschouwd.
“De kosten van de eindtest voor het V3-model waren aanzienlijk lager dan die van modellen die in de VS of Europa zijn ontwikkeld,” aldus de analist.
Op 20 januari bracht het bedrijf een model uit dat is gericht op redenering, genaamd R1. Daarnaast staat de mobiele app van DeepSeek bovenaan de lijst met populairste gratis apps in de AppStore. Dit alles leidde tot een daling van de waarde van AI-aandelen op de Amerikaanse, Europese en Aziatische markten.
Jęcz wijst erop dat DeepSeek is ontwikkeld in een land dat onder sancties staat en daardoor geen toegang heeft tot de nieuwste westerse technologie. China kreeg al te maken met beperkingen opgelegd door de regering van voormalig Amerikaans president Joe Biden. Vanaf 2022 werden er in Peking verdere beperkingen opgelegd aan microprocessoren die worden gebruikt voor de ontwikkeling van AI-oplossingen.
“Dit betekent dat het bedrijf waarschijnlijk geen toegang had tot de meest geavanceerde westerse chips, waaronder de NVIDIA H100 grafische processor, die als maatstaf geldt in de markt voor kunstmatige intelligentie,” aldus de analist.
Volgens de deskundige is de betrouwbaarheid van de informatie over de kosten van de laatste test van het V3-model hoog.
“DeepSeek opereert binnen de wetenschappelijke wereld. Het werk van het bedrijf wordt beschreven in wetenschappelijke artikelen die zijn gepubliceerd door ingenieurs die verbonden zijn aan deze Chinese entiteit,” merkte de expert op.
Westerse media vermoeden dat DeepSeek zijn kosten en technologische uitgaven heeft onderschat om aan te tonen dat de Amerikaanse AI-industrie een investeringszeepbel heeft gecreëerd.
Volgens de analist is “de theorie dat China kort na de aankondiging van het Stargate-project een tegenreactie heeft gecreëerd op het Amerikaanse AI-onderzoek nogal vergezocht.”
“DeepSeek neemt deel aan een levendige intellectuele uitwisseling tussen de Chinese en Amerikaanse markt, ondanks de opgelegde sancties tegen China,” merkte de expert op. Hij voegde eraan toe dat de betrouwbaarheid van de door DeepSeek gepubliceerde gegevens wordt geanalyseerd door onafhankelijke westerse wetenschappers.
“Deze situatie suggereert dat westerse technologiebedrijven mogelijk te veel hebben geïnvesteerd. Dit is precies waarom de aandelenkoersen van Amerikaanse technologie-giganten dalen,” concludeerde hij.