In einer bahnbrechenden Woche am 2025-01-20 hat das chinesische Startup DeepSeek mit seinem neuen Chatbot DeepSeek R1 die Tech-Welt auf den Kopf gestellt. Mit beeindruckender Effizienz und einem Bruchteil der Kosten amerikanischer Modelle hat DeepSeek gezeigt, dass auch andere Länder in den KI-Wettbewerb einsteigen können.
DeepSeek R1 Die neue Revolution im KI-Bereich
Am 2.16 Uhr am Sonntagabend Ortszeit Kaliforniens postete der US-amerikanische Tech-Investor Marc Andreessen auf X: DeepSeek R1 ist der Sputnik-Moment der künstlichen Intelligenz.
DeepSeek, ein chinesisches Startup gegründet im Jahr 2023 und geleitet von dem Mathematiker Liang Wenfeng, hat einen neuen Chatbot vorgestellt, der die Leistung amerikanischer Top-Modelle bei einem Bruchteil der Kosten erreicht. Die Antworten des Chatbots zu Themen wie den Status Taiwans oder das Massaker auf dem Tiananmen-Platz wurden jedoch durch Zensur der Kommunistischen Partei Chinas (KPC) eingeschränkt.
Für Andreessen, einen Veteranen der Technologieboom- und -absturzphasen, war dies vergleichbar mit dem Start des ersten sowjetischen Satelliten 1957, der die USA schockierte. Am nächsten Tag stürzten die Aktienkurse mehrerer globaler Top-Unternehmen ab, darunter Nvidia, ein amerikanischer Mikrochip-Hersteller, dessen Wert um fast 600 Milliarden US-Dollar sank.
Die Auswirkungen auf den Markt und die Technologie
Investoren glaubten, dass DeepSeeks Leistung bedeuten könnte, dass China nicht mehr so viele amerikanische Chips benötigen würde. Die Vorherrschaft der USA im Bereich KI sei bedroht oder bereits vorbei, und die Silicon-Valley-Riesen hätten möglicherweise zu viel Geld ausgegeben.
DeepSeek gab an, dass die Trainingskosten für eines seiner Basismodelle nur 5,6 Millionen US-Dollar betrugen – ein Bruchteil dessen, was amerikanische Unternehmen ausgaben. In der größten Woche für KI seit dem Launch von ChatGPT im November 2022 wurde DeepSeeks App mit ihrem fröhlichen Blauwal-Logo zur meist heruntergeladenen kostenlosen App in den Apple App Stores der USA und Großbritanniens.
Geopolitische Implikationen
Könnte das größte autokratische Land der Welt die westliche Führung im Bereich KI überholen? Was könnte dies für die Kontrolle einer Technologie bedeuten, die viele als missbräuchlich in Cyberangriffen, bei der Herstellung biologischer Waffen und zur Gedankenkontrolle betrachten?
AI wird weltweit als eines der Hauptfelder des geopolitischen Wettbewerbs angesehen. Wo lässt dies die Hoffnungen der USA auf eine Aufrechterhaltung ihrer Vorherrschaft durch Exportverbote von Mikrochips, die für den Fortschritt entscheidend sind? Die US-Regierung hat bereits Maßnahmen ergriffen, um Chinas Zugang zu fortschrittlicher Technologie zu beschränken.
Technologische Innovation und Zukunftsaussichten
Seit einiger Zeit kamen aus DeepSeeks Labor in Hangzhou, nahe Shanghai, leichte Beben. Einige Experten waren von den Entwicklungen unter der Leitung des 40-jährigen Hedgefonds-Unternehmers Liang Wenfeng beeindruckt.
Doch erst am vergangenen Mittwoch traf ein richtiges Erdbeben ein: DeepSeek veröffentlichte eine 22-seitige Studie, in der das R1-Modell vorgestellt wurde. Es soll mächtige und faszinierende Denkfähigkeiten besitzen und sei mit OpenAIs Modell O1 vergleichbar – teilweise sogar besser.
Während Google, Meta und OpenAI ihre neuen Veröffentlichungen normalerweise mit Marketing-Hype umgeben, war DeepSeeks sachliche Herangehensweise bereits im schläfrigen Titel ihrer Ankündigung erkennbar: Anreizen der Denkfähigkeit in LLMs durch Verstärkendes Lernen.
Das Modell war kostenlos nutzbar und schien eine bahnbrechende Effizienz zu besitzen. Es verbrauchte weniger Rechenleistung, da es nur den relevanten Teil des Systems aktivierte, um die Anfrage zu beantworten. Leistung, für die andere Unternehmen Milliarden ausgegeben hatten, schien für Millionen verfügbar zu sein.
In Reaktion darauf kündigte OpenAI am Freitag das Release eines neuen Denkmodells an, o3-Mini, das allen Nutzern zur Verfügung gestellt wird, einschließlich derjenigen in ChatGPTs kostenloser Ebene.
(Dieser Text wurde mit der Unterstützung von AI generiert)
Hallo Anton, die Meldung besagt das in meinem Beisiel Methoden verwendet werden die veraltet (deprecated) sind. Also müsstest Du die…
Danke für das Tool! Ich habe erst kürzlich angefangen mich mit der Thematik zu beschäftigen und bin für meine Erwartungen…
Hallo, ich habe ihre Anleitung befolgt und bekomme im letzten Schritt leider immer folgende Meldung im Terminal: bash <(wget -qO-…
Hi Dennis, vielen Dank für den Hinweis, ich habe die URLs angepasst so das diese wieder gehen. Ich bin gespannt…
Ich weiss, es ist noch im Aufbau. Aber hier ist ein Broken Link: https://www.ai-box.eu/smurf_training_data_small.zip Freue mich drauf, die ganze Serie…