Deepseek: Heeft een weinig bekende Chinese startup een ‘sputnik -moment’ voor AI veroorzaakt?

Deepseek: Heeft een weinig bekende Chinese startup een 'sputnik -moment' voor AI veroorzaakt?

Had AI gewoon een “sputnik moment”?

Dat is wat sommige Beleggers, nadat de weinig bekende Chinese startup Deepseek een chatbot heeft uitgebracht die volgens experts zijn eigen bezit heeft tegen marktleiders, zoals Openai en Google, ondanks dat ze met minder geld en rekenkracht worden gemaakt.

Buzz rond Deepseek ingebouwd in een golf van bezorgdheid die te technische aandelen op maandag hamerde. Het veegde bijna $ 600 miljard af van de marktwaarde van chipmaker Nvidia.

Niet iteratief of evolutionair, maar pathbreaking

“Dit is, denk ik, iets dat echt tot op zekere hoogte heeft aangetoond hoeveel de VS in een bubbel leefden,” zei Antonia Hmaidi, een senior analist bij het Mercator Institute for China Studies in Berlijn.

“Openai en bedrijven zoals Openai hadden echt wedden dat schalen een beetje oneindig was, en moesten steeds meer chips kopen voor prestaties om te verbeteren.”

Wat Deepseek liet zien, zei ze, is dat er verschillende paden zijn.

Het bedrijf zegt dat het iets meer dan 2.000 NVIDIA H800 GPU’s heeft gebruikt om de bot te trainen, en dit deed dit in een kwestie van weken voor $ 5,6 miljoen. Anderen hebben naar verluidt 10.000 of meer GPU’s ingezet en hebben meer dan $ 100 miljoen uitgegeven of meer om vergelijkbare resultaten te krijgen.

Marina Zhang, een geleerde bij de Universiteit van Technology Sydney, zei dat Deepseek ook een nieuw soort innovatie voor China heeft aangetoond – niet iteratief of evolutionair, maar pathbreaking.

“Ze volgen niet echt bestaande modellen,” zei ze. “Het is in feite gebaseerd op algoritme -optimalisatie, met behulp van software om de beperkingen van niet genoeg rekenkracht te doorbreken.”

Zijn de US ChIP -exportcontroles mislukt?

Die beperkingen werden door de Verenigde Staten aan China opgelegd. In 2022 verbood de Biden -administratie de export van geavanceerde microchips naar China, met het argument dat ze konden worden gebruikt om het Chinese leger te verbeteren.

Zhang zei dat Deepseek heeft aangetoond dat de chipblokkade tot nu toe niet succesvol is geweest. Beijing verdubbelt al enkele jaren op een zelfredzaamheid in technologie en giet geld in chipontwikkeling en andere sectoren, waaronder AI.

Anderen beweren dat het te vroeg is om te zeggen dat de chip -exportcontroles zijn mislukt.

Gregory Allen, directeur van het Wadhwani AI Center in het Centre for Strategic and International Studies in Washington, zei dat Deepseek al zijn chips had kunnen krijgen voordat het effect van de controles voelde.

In een breed gemeld 2023 -interview zei de oprichter van Deepseek, Liang Wenfeng, dat het bedrijf ongeveer 10.000 NVIDIA A100 GPU’s had opgeslagen – een variëteit die op de Amerikaanse exportcontrolelijst werd geplaatst. Experts denken dat deze mogelijk zijn ingezet in eerdere versies van het dieptewendmodel.

Nadat de chipblokkade begon, ontwikkelde Nvidia een oplossing, waardoor de iets minder krachtige H800 GPU werd gecreëerd, die een tijdje legaal was om aan China te verkopen.

“We leven momenteel door het tijdperk van de achterblijvende impact van het misvuur van de Biden -administratie in die eerste partij AI -exportcontroles,” zei Allen.

Deepseek had een venster waarin het in staat was om H800’s te kopen – voordat de administratie uiteindelijk ook de verkoop van hen aan China verbood.

“Deepseek heeft enkele architecturale innovaties ontdekt, sommige algoritmische innovaties die het aantal IQ -punten, de hoeveelheid intelligentie, een beetje vergroten, dat een bepaald AI -model kan krijgen van een bepaalde hoeveelheid computationele bronnen,” zei hij.

Maar AI -ontwikkeling vereist rekenkracht, en het aantal geavanceerde GPU’s dat Deepseek, of een ander Chinees bedrijf, toegang kan hebben, wordt beperkt door de exportcontroles, zei hij. Dat zal uiteindelijk bijten.

Allen zegt dat het betekent dat de VS een voorsprong hebben: toegang tot geavanceerde chips zonder beperkingen.

“We kunnen de voordelen van China kopiëren. Ze kunnen onze voordelen niet kopiëren. Tenminste niet snel,” zei hij.

In termen van de hype rond Deepseek die zijn bijna snijdende randmodel goedkoop ontwikkelt, zei Allen dat de kosten ongetwijfeld ver noord-ten noorden van de gerapporteerde $ 5,6 miljoen waren. Hij vergeleek het met de ontwikkeling van een medicijn.

“De kosten voor het ontwikkelen van een nieuw medicijn zijn niet alleen de kosten van de klinische proef die werkte,” zei hij. “Het zijn de kosten van alle klinische proeven die niet werkten. En het is hetzelfde met deze AI -modelopleiding. Deepseek heeft gepubliceerd hoeveel het hen kostte voor die laatste succesvolle trainingsrun.”

Het is niet bekend hoeveel het bedrijf heeft uitgegeven om op dat punt te komen, zei hij.

Hmaidi zegt dat Deepseek een “zeer legitieme triomf van Chinese engineering” is. Maar ze zegt dat het nog niet de dreiging is die velen het maken.

“Ik zie momenteel niet hoe je een aanzienlijk beter model krijgt met hun huidige pijplijn – zonder meer reken te zetten,” zei ze.

“Persoonlijk denk ik niet dat het een bedreiging is voor de AI -dapperheid van Amerika op dit moment.”