- DeepSeek hat ein neues KI-Modell vorgestellt, das speziell für chinesische Prozessoren optimiert ist. Die aktuelle Version, DeepSeek V3.1, nutzt die FP8-Technologie zur Speicher- und Geschwindigkeitsoptimierung. Aufgrund von Handelsbeschränkungen setzt DeepSeek auf Huawei’s Ascend-Technologie, trotz Performance-Problemen des Chips. Die Einführung des Ascend-Chips verzögerte sich, was auch den Start von DeepSeek R2 beeinträchtigt hat. DeepSeek nutzt bei der Inferenz weiterhin NVidia-Chips, was einen Rückschritt von den Plänen darstellt, vollständig auf chinesische Technologie zu setzen.
Das chinesische Startup DeepSeek hat eine neuartige Iteration seines signifikantesten KI-Modells präsentiert, welches speziell auf Rechnern mit fortschrittlichen chinesischen Prozessoren operiert. Diese Ankündigung kommt vor dem Hintergrund der Bemühungen der Volksrepublik, angesichts exportbeschränkender Maßnahmen der USA eigenständige Hochleistungschips zu entwickeln. Ziel solcher Maßnahmen ist es, Chinas militärischen und technologischen Aufstieg zu verlangsamen. DeepSeek V3.1 soll seinen Vorgängern in puncto Geschwindigkeit überlegen sein und kommt mit weniger Energie aus. Im direkten Vergleich mit westlichen Pendants wie ChatGPT von OpenAI oder Gemini von Google erweist es sich als gleichwertig, jedoch mit einem reduzierten Energieaufwand.
Optimierte Arbeitsweisen
Die aktuelle Version, DeepSeek V3.1, nutzt die FP8-Technologie, um den Speicherbedarf zu minimieren und die Geschwindigkeit zu maximieren. Nutzer können zwischen einer schnellen Antwort oder einer detaillierteren, aber zeitintensiveren Reaktionszeit wählen. Dieses flexible Antwortverhalten stellt einen Wettbewerbsvorteil dar. Vor Kurzem hatte OpenAI mit verhaltenem Echno eine neue Version seiner KI vorgestellt, die trotz allem nicht den erwarteten Innovationsschritt mit sich brachte. Ähnlich ergeht es Meta, das die Entwicklung seines „Behemoth“-Projekts aufgrund mangelnder Fortschritte in Betracht zieht. Während die Abhängigkeit von Nvidia für DeepSeek anhält, kann das Unternehmen die dortigen Kapazitäten wegen Handelsbeschränkungen nicht voll ausschöpfen.
Huawei und der Problemchip
Aufgrund dieser Einschränkungen konzentriert sich DeepSeek auf die Hoffnung, die Huawei und dessen Ascend-Technologie bieten könnte. Jedoch sind die Berichte über den Ascend-Chip ernüchternd: Unter Volllast leidet die Leistung, was zu verlangsamten Datenübertragungen führt. Diese Herausforderungen führten zu fortwährenden Verzögerungen, obwohl der Chip ursprünglich bereits im Mai auf dem Markt hätte erscheinen sollen. Die Schwierigkeiten bei der Markteinführung des Ascend-Chips beeinflussten auch die Verzögerungen beim Start von DeepSeek R2. Trotz dieser Rückschläge bleibt das Unternehmen bestrebt, vollständig auf chinesische Technologie zu setzen, wenngleich dies derzeit weiterhin eine Herausforderung ist.
Der Weg der Inferenz
Im KI-Bereich ist der Inferenzprozess essenziell: Hier geht es darum, dass ein bereits trainiertes Modell auf neue, unbekannte Daten angewendet wird. Nachdem die KI in der Trainingsphase Muster erlernt hat, wird sie in der Inferenzphase für praktische Anwendungen eingesetzt. Das Ergebnis sind Vorhersagen oder Entscheidungen auf Basis der erkannten Muster. Obwohl DeepSeek auf NVidia-Chips zurückgreifen muss, nutzt das Unternehmen die Huawei-Technologie bei der Anwendung, der sogenannten Inferenz. Dies sichert vorerst das Projekt, stellt jedoch einen Rückschritt gegenüber den ursprünglichen Plänen dar, das gesamte Vorhaben auf heimischen Entwicklungen zu stützen.