Chinesisches Startup DeepSeek schockiert Silicon Valley-Elite

DeepSeek hat ein neues KI-Modell entwickelt, das das Silicon Valley aufrüttelt und Diskussionen über mögliche Umwälzungen in der Technologiewelt auslöst. DeepSeek konzentriert sich auf fortschrittliche Funktionen wie Argumentation, anstatt auf große Modelle mit hohen Rechenanforderungen, was als Paradigmenwechsel in der KI-Entwicklung angesehen wird. Das Vorgängermodell von DeepSeek war mit 5,6 Millionen US-Dollar deutlich kostengünstiger als vergleichbare Modelle anderer Unternehmen. DeepSeeks Erfolg zeigt, dass offene sowie weniger restriktive Ansätze bei der KI-Entwicklung zunehmend an Bedeutung gewinnen. Der Zugang von DeepSeek zu fortschrittlichen Chips trotz Handelsbeschränkungen ist ein wesentlicher Faktor für die Effizienz und Leistungsfähigkeit ihres Modells.

In den letzten Tagen hat ein neues, mächtiges Modell der chinesischen Startup-Firma DeepSeek das Silicon Valley erschüttert. Ausgestattet mit modernsten Fähigkeiten und entwickelt mit einem scheinbar minimalen Budget, löst das Modell DeepSeek R1 Diskussionen über eine mögliche Umwälzung in der Technologiewelt aus. Für einige signalisiert der Aufstieg von DeepSeek einen Wendepunkt in der Dominanz der USA bei der Künstlichen Intelligenz. Doch Experten, darunter Führungskräfte von Firmen, die einige der leistungsstärksten KI-Modelle der Welt entwickeln, sehen dies als Zeichen eines anderen technologischen Wandels.

Ein Paradigmenwechsel in der KI-Entwicklung

Anstatt immer größere Modelle zu schaffen, die enorme Rechenressourcen erfordern, konzentrieren sich KI-Unternehmen nun mehr auf die Entwicklung fortschrittlicher Funktionen wie Argumentation. Dies eröffnet neuen und kreativen Startups wie DeepSeek, die nicht über Milliarden von Dollar an externen Investitionen verfügen, neue Möglichkeiten. „Es ist ein Paradigmenwechsel hin zur Argumentation, und das wird viel demokratischer sein“, sagt Ali Ghodsi, CEO von Databricks. „Es ist schon seit einiger Zeit offensichtlich, dass die nächste Welle von technologischen Durchbrüchen durch Innovation und Effizienzen und nicht durch unerschwingliche Rechenleistung angetrieben werden wird“, sagt Nick Frosst, Mitbegründer von Cohere.

Tausende von Entwicklern und KI-Enthusiasten besuchten die Website von DeepSeek, um das neueste Modell auszuprobieren und teilten seine raffinierten Fähigkeiten auf sozialen Medien. Der Aktienkurs amerikanischer Technologiefirmen fiel merklich, als Investoren die hohen Summen in Frage stellten, die in die KI-Entwicklung investiert werden.

Kosten und Effizienz als zentrale Aspekte

DeepSeek entsprang einem Forschungszentrum in China und wurde ursprünglich von einem erfolgreichen quantitativen Hedgefonds gegründet. Ein Bericht von Dezember besagt, dass das Vorgängermodell DeepSeek-V3 nur 5,6 Millionen US-Dollar kostete, was im Vergleich zu den Ausgaben der Konkurrenz ein Bruchteil darstellt. Offizielle Schätzungen für Modelle wie die von OpenAI und anderen großen Namen bewegen sich um ein Vielfaches höher. Die Leistungen und Effizienz der DeepSeek-Modelle haben bereits Diskussionen über mögliche Kostensenkungen bei großen Technologiefirmen ausgelöst.

Ein Ingenieur bei Meta, der anonym bleiben möchte, teilte mit, dass der Technologieriese wahrscheinlich die Techniken von DeepSeek untersuchen wird, um seine eigenen Ausgaben zu überprüfen. Die Existenz solcher Modelle hat, trotz Bedenken über die Nutzung von chinesischen Modellen für sensible Aufgaben, großen Einfluss auf die strategische Ausrichtung westlicher Unternehmen.

Herausforderungen bei der Hardware-Beschaffung

Die Hardware, die DeepSeek möglicherweise verwendet hat, ist ebenfalls ein Thema von Spekulationen. Besonders bemerkenswert, da die USA über die Jahre Handelsbeschränkungen eingeführt haben, um Chinas Zugriff auf fortschrittliche Chips zu limitieren. DeepSeek gab an, Zugriff auf 10.000 Nvidia A100 Chips zu haben, die unter US-Kontrollmaßnahmen stehen. Ein Insider eines konkurrierenden KI-Unternehmens schätzt, dass DeepSeek etwa 50.000 Nvidia Chips verwendet hat, was die bemerkenswerte Effizienz und Leistungsfähigkeit ihrer Produkte erklärt.

Nichtsdestotrotz zeigt der Erfolg von DeepSeek, dass eine weniger restriktive Herangehensweise an die Entwicklung von KI an Bedeutung gewinnt. Die Innovationen bei Open-Source-Modellen, die China größtenteils annimmt, gewannen an Geschwindigkeit, was so manchen überraschte.