Agentur.rocks
  • Technologien
    • KI
    • Adserver
    • CMS
    • CRM
    • E-Commerce
    • Tools
    • Tracking
  • Marketing
    • Affiliate Marketing
    • Content Marketing
    • Display Advertising
    • Network Marketing
    • Newsletter Marketing
    • Digitales Marketing
    • Push Notifications
    • SEA
    • SEO
    • Social Advertising
    • Personal Marketing
    • Social Media
  • Agenturen
  • Dienstleister
    • Daten Dienstleister
    • Entwickler
    • Server Hosting
  • Tools und Weiteres
    • News
    • Anleitungen
    • Wissen
    • CRM Systeme
    • Tipps & Tricks
    • FAQ
    • Jobs
    • Rechner
      • Cost per Action (CPA) berechnen
      • Cost per Click (CPC) berechnen
      • Cost per Lead (CPL) berechnen
      • Cost per View (CPV)
      • Cost per Order (CPO) berechnen
      • Kosten Umsatz Relation (KUR) berechnen
    • Datenschutz
      • Datenschutz News
      • Datenschutz Tools
Kategorien
  • Adserver
  • Affiliate Marketing
  • Agenturen
  • Allgemein
  • Anleitungen
  • Branchen
  • CMS
  • Content Marketing
  • CRM
  • CRM Anbieter
  • Datenschutz
  • Dienstleister
  • Digitales Marketing
  • Display Advertising
  • E-Commerce
  • Entwickler
  • FAQ
  • Jobs
  • KI
  • Marketing
  • Network Marketing
  • News
  • Newsletter Marketing
  • Online Marketing
  • Personal Marketing
  • Push Notifications
  • SEA
  • SEO
  • Server Hosting
  • Social Advertising
  • Social Media
  • Technologien
  • Tipps & Tricks
  • Tools
  • Tracking
  • Wissen
Bei Google Podcast anhören
Agentur.rocks
  • Technologien
    • KI
    • Adserver
    • CMS
    • CRM
    • E-Commerce
    • Tools
    • Tracking
  • Marketing
    • Affiliate Marketing
    • Content Marketing
    • Display Advertising
    • Network Marketing
    • Newsletter Marketing
    • Digitales Marketing
    • Push Notifications
    • SEA
    • SEO
    • Social Advertising
    • Personal Marketing
    • Social Media
  • Agenturen
  • Dienstleister
    • Daten Dienstleister
    • Entwickler
    • Server Hosting
  • Tools und Weiteres
    • News
    • Anleitungen
    • Wissen
    • CRM Systeme
    • Tipps & Tricks
    • FAQ
    • Jobs
    • Rechner
      • Cost per Action (CPA) berechnen
      • Cost per Click (CPC) berechnen
      • Cost per Lead (CPL) berechnen
      • Cost per View (CPV)
      • Cost per Order (CPO) berechnen
      • Kosten Umsatz Relation (KUR) berechnen
    • Datenschutz
      • Datenschutz News
      • Datenschutz Tools
  • News

DeepSeek unter Beschuss: 100% Erfolgsquote bei Angriffen auf KI

  • Thomas Harnisch
  • 31.01.2025 20:44
DeepSeek unter Beschuss: 100% Erfolgsquote bei Angriffen auf KI
Symbolfoto
Total
1
Shares
0
0
1
  • Hacker und Sicherheitsforscher nutzen Schwachstellen in Sprachmodellen aus, um schädliche Inhalte zu erzeugen. OpenAI und andere KI-Entwickler haben ihre Schutzmechanismen verfeinert, aber DeepSeek bleibt hinterher. Tests zeigten, dass DeepSeek keine bösartigen Eingaben erkannte oder blockierte, mit einer 100-prozentigen Angriffs-Erfolgsquote. DeepSeek ist anfällig für Jailbreak-Methoden und weist Schwächen in der Abwehrstrategie auf. Effizienter Schutz gegen Schwachstellen erfordert kontinuierliche Tests und Anpassungen.

Seit Ende 2022 bemühen sich Hacker und Sicherheitsforscher, Schwachstellen in großen Sprachmodellen (LLMs) auszunutzen, um diese zu zwingen, Hassreden, Bombenbauanleitungen, Propaganda und andere schädliche Inhalte auszugeben. Als Reaktion darauf haben OpenAI und andere Entwickler generativer KI die Schutzmechanismen ihrer Systeme verfeinert, um solche Angriffe zu erschweren. Doch während die chinesische KI-Plattform DeepSeek einen rasanten Aufstieg erlebt, zeigt sich, dass ihre Sicherheitsvorkehrungen deutlich hinter denen etablierter Konkurrenten zurückbleiben.

Sicherheitslücken im Fokus

Aktuelle Untersuchungen von Sicherheitsforschern bei Cisco und der University of Pennsylvania zeigen, dass DeepSeek bei Tests mit 50 bösartigen Eingaben, die toxische Inhalte provozieren sollten, keines dieser Eingaben erkannt oder blockiert hat. Die Forscher sprechen von einer „100-prozentigen Angriffs-Erfolgsquote“. Dies wirft Fragen auf hinsichtlich der Effektivität der Schutzmechanismen, die DeepSeek implementiert hat. Insbesondere die Zensur von Themen, die in China als sensibel gelten, kann leicht umgangen werden.

Auch Untersuchungen der AI-Sicherheitsfirma Adversa AI legen nahe, dass DeepSeek anfällig für eine Vielzahl von Jailbreak-Methoden ist. Solche Angriffe ermöglichen es Benutzern, die Sicherheitsbarrieren zu umgehen, die in die Modelle integriert wurden, um schädliche Inhalte zu verhindern. Von einfachen sprachlichen Tricks bis hin zu komplexen, von KI generierten Aufforderungen—DeepSeek zeigt Schwächen in seiner Abwehrstrategie.

Technologische Feinheiten und Risiken

Generative KI-Modelle, ähnlich wie jedes technologische System, bergen in sich das Potenzial von Schwachstellen, die von böswilligen Akteuren ausgenutzt werden könnten. Insbesondere indirekte Eingabeangriffe sind derzeit von großer Bedeutung. Diese Angriffe beinhalten, dass ein KI-System Informationen von einer externen Quelle übernimmt und darauf basierende Handlungen ausführt. Ein Beispiel hierfür sind Jailbreaks, die Menschen dazu nutzen, die eingebauten Sicherheitssysteme zu umgehen und beispielsweise irreführende Informationen zu generieren.

Ciscoforscher verwendeten ein bekanntes Set von Prüfanweisungen namens HarmBench, um DeepSeeks Modell auf solche Schwachstellen hin zu testen. Sie führten die Tests lokal, auf Maschinen durch, anstatt über die Webseite oder App von DeepSeek zu gehen. Dadurch konnten sie potenziell besorgniserregende Ergebnisse erzielen, besonders bei nicht-sprachlichen Angriffen mit Kyrillischen Zeichen und maßgeschneiderten Skripten.

Systematische Analyse

Vergleiche mit anderen Modellen zeigten, dass auch andere Plattformen nicht immer widerstandsfähig gegen HarmBench-Eingaben sind. Doch DeepSeek’s R1, ein eigenständiger Modellentwurf, zeigte eine besonders ausgeprägte Schwäche. Polyakov von Adversa AI verdeutlicht, dass viele dieser Angriffe bekannt sind und schon seit Jahren existieren, dennoch scheint DeepSeek keine nachhaltigen Gegenmaßnahmen etabliert zu haben. In mehreren Tests war es möglich, die Sicherheitsbeschränkungen des Modells mühelos zu überwinden.

Dies verdeutlicht, dass Sicherheitslücken – ähnlich denen in Software – nie vollständig eliminiert werden können. Risikominderungen erfordern kontinuierliche Tests und Anpassungen. Unternehmen, die solche KI-Modelle implementieren, sollten gewarnt sein. Ein Versäumnis in der Sicherheitsarchitektur kann weitreichende geschäftliche Konsequenzen nach sich ziehen.

Mehr zum Thema:
  • Die besten 50 Seo Tipps für Einsteiger
    Die 50 besten SEO Tipps für Einsteiger
  • Die besten kostenlosen CRM Systeme
    CRM – Customer Relationship Management zur…
  • AI-Startup revolutioniert den Markt: Die Lösung für KI-Texte?
    AI-Startup revolutioniert den Markt: Die Lösung für…
Total
1
Shares
Share 0
Tweet 0
Pin it 1
Avatar-Foto
Thomas Harnisch

Thomas Harnisch ist Senior Online Marketing Manager mit über 17 Jahren Berufserfahrung, davon mehr als 8 Jahre in der Touristik. Als Hobbyfotograf und -koch probiert Thomas Harnisch gerne neue technische Geräte aus. Wenn er nicht gerade fotografiert oder eine kulinarische Kreation zaubert, verbringt er seine Zeit mit seiner Frau und seiner kleinen Tochter. Mit seinem neuen Blog agentur.rocks möchte Thomas gerne sein Wissen und seine gemachten Erfahrungen teilen.

Dir könnte auch gefallen
Weiterlesen
  • News
Vergessen Sie alles, was Sie über Notiz-Apps wussten! Lernen Sie die geniale Geheimwaffe kennen!
  • Thomas Harnisch
  • 22.05.2025 23:17
Signal stoppt Microsoft: Keine Screenshots mehr mit Recall!
Weiterlesen
  • News
Signal stoppt Microsoft: Keine Screenshots mehr mit Recall!
  • Thomas Harnisch
  • 22.05.2025 23:10
Brisante Datenpanne: 184 Millionen Logins aufgedeckt!
Weiterlesen
  • News
Brisante Datenpanne: 184 Millionen Logins aufgedeckt!
  • Thomas Harnisch
  • 22.05.2025 22:13
Schreibe einen Kommentar Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Anzeigen
Peter













Neueste Beiträge
  • Vergessen Sie alles, was Sie über Notiz-Apps wussten! Lernen Sie die geniale Geheimwaffe kennen!
  • Signal stoppt Microsoft: Keine Screenshots mehr mit Recall!
    Signal stoppt Microsoft: Keine Screenshots mehr mit Recall!
  • Brisante Datenpanne: 184 Millionen Logins aufgedeckt!
    Brisante Datenpanne: 184 Millionen Logins aufgedeckt!
  • Unglaublich: Wie 3D-Druck die Waffenwelt revolutioniert!
    Unglaublich: Wie 3D-Druck die Waffenwelt revolutioniert!
  • Verpassen Sie nicht die 35 besten Amazon-Deals zum Memorial Day!
    Verpassen Sie nicht die 35 besten Amazon-Deals zum Memorial Day!
  • Asus ROG Strix G16: Power im Schatten eines schwachen Displays
    Asus ROG Strix G16: Power im Schatten eines schwachen Displays
Agentur.rocks
  • Datenschutzerklärung
  • Impressum
  • Sitemap
  • Gastbeiträge
  • Portale und Profile
  • Cookies
Der Blog für Marketing-Interessierte
Marketing/CRM
  • Die 50 wichtigsten Marketingbegriffe
  • CRM Systeme
  • CRM – Customer Relationship Management
  • CRM-Marketing Kundenloyalität
  • CRM Systeme für kleine Unternehmen 
  • Network Marketing Firmen
SEO
  • SEO Optimierung
  • Die 50 besten SEO Tipps
  • SEO Optimierung Preis
  • SEO Optimierung kostenlos
E-Commerce
  • E-Commerce
  • E-Commerce Umsatz steigern
  • E-Commerce Online Marktplatz
  • E-Commerce Nische
  • Network Marketing Firmen

Gib dein Suchwort ein und drücke Enter.