Agentur.rocks
  • Technologien
    • KI
    • Adserver
    • CMS
    • CRM
    • E-Commerce
    • Tools
    • Tracking
  • Marketing
    • Affiliate Marketing
    • Content Marketing
    • Display Advertising
    • Network Marketing
    • Newsletter Marketing
    • Digitales Marketing
    • Push Notifications
    • SEA
    • SEO
    • Social Advertising
    • Personal Marketing
    • Social Media
  • Agenturen
  • Dienstleister
    • Daten Dienstleister
    • Entwickler
    • Server Hosting
  • Tools und Weiteres
    • News
    • Anleitungen
    • Wissen
    • CRM Systeme
    • Tipps & Tricks
    • FAQ
    • Jobs
    • Rechner
      • Cost per Action (CPA) berechnen
      • Cost per Click (CPC) berechnen
      • Cost per Lead (CPL) berechnen
      • Cost per View (CPV)
      • Cost per Order (CPO) berechnen
      • Kosten Umsatz Relation (KUR) berechnen
    • Datenschutz
      • Datenschutz News
      • Datenschutz Tools
Kategorien
  • Adserver
  • Affiliate Marketing
  • Agenturen
  • Allgemein
  • Anleitungen
  • Branchen
  • CMS
  • Content Marketing
  • CRM
  • CRM Anbieter
  • Datenschutz
  • Dienstleister
  • Digitales Marketing
  • Display Advertising
  • E-Commerce
  • Entwickler
  • FAQ
  • Jobs
  • KI
  • Marketing
  • Network Marketing
  • News
  • Newsletter Marketing
  • Online Marketing
  • Personal Marketing
  • Push Notifications
  • SEA
  • SEO
  • Server Hosting
  • Social Advertising
  • Social Media
  • Technologien
  • Tipps & Tricks
  • Tools
  • Tracking
  • Wissen
Bei Google Podcast anhören
Agentur.rocks
  • Technologien
    • KI
    • Adserver
    • CMS
    • CRM
    • E-Commerce
    • Tools
    • Tracking
  • Marketing
    • Affiliate Marketing
    • Content Marketing
    • Display Advertising
    • Network Marketing
    • Newsletter Marketing
    • Digitales Marketing
    • Push Notifications
    • SEA
    • SEO
    • Social Advertising
    • Personal Marketing
    • Social Media
  • Agenturen
  • Dienstleister
    • Daten Dienstleister
    • Entwickler
    • Server Hosting
  • Tools und Weiteres
    • News
    • Anleitungen
    • Wissen
    • CRM Systeme
    • Tipps & Tricks
    • FAQ
    • Jobs
    • Rechner
      • Cost per Action (CPA) berechnen
      • Cost per Click (CPC) berechnen
      • Cost per Lead (CPL) berechnen
      • Cost per View (CPV)
      • Cost per Order (CPO) berechnen
      • Kosten Umsatz Relation (KUR) berechnen
    • Datenschutz
      • Datenschutz News
      • Datenschutz Tools
  • News

AWS deckt schockierende Praktiken von Perplexity AI auf

  • Thomas Harnisch
  • 28.06.2024 01:48
Total
1
Shares
0
0
1
  • Amazon Web Services (AWS) untersucht das Verhalten des KI-Suchunternehmens Perplexity AI wegen des Verdachts des Verstoßes gegen Richtlinien durch systematisches Scrapen von Webseiten. . Die AWS-Nutzungsbedingungen verbieten die Nutzung ihrer Dienste fĂŒr illegale AktivitĂ€ten, und AWS stellt klar, dass Kunden fĂŒr die Einhaltung aller geltenden Gesetze und Bedingungen verantwortlich sind. . Eine technische Analyse ergab, dass eine virtuelle Maschine auf AWS-Diensten Inhalte von Webseiten gescraped hat, die durch eine robots.txt-Datei geschĂŒtzt waren. . Der CEO von Perplexity AI erklĂ€rt, dass die fragliche IP-Adresse von einer Drittfirma betrieben werde und bestreitet jegliches Fehlverhalten. . Diese VorfĂ€lle werfen rechtliche Fragen auf und könnten zu strengeren Vorschriften und Kontrollen fĂŒr KI-Unternehmen fĂŒhren.

Amazon Web Services (AWS) untersucht derzeit das Verhalten des aufstrebenden KI-Suchunternehmens Perplexity AI. Der Anlass der Ermittlungen ist der Verdacht, dass Perplexity AI durch das systematische Scrapen von Webseiten gegen Richtlinien verstĂ¶ĂŸt, obwohl diese Webseiten den Zugang durch den Robots Exclusion Protocol untersagt haben. AWS wurde auf diese Praktiken aufmerksam gemacht und hat bestĂ€tigt, dass eine interne Untersuchung im Gange ist.

Robots Exclusion Protocol und Rechtlichkeit

Das Robots Exclusion Protocol, ein gĂ€ngiger Webstandard, besteht aus einer einfachen Textdatei (wie z.B. wired.com/robots.txt). Diese Datei wird auf einer Domain platziert und signalisiert, welche Seiten nicht von automatisierten Bots und Crawlers besucht werden sollen. Obwohl das Protokoll selbst rechtlich nicht bindend ist, sind die Nutzungsbedingungen der meisten Webseiten dies durchaus. Das bedeutet, dass Unternehmen, die Scraping betreiben, das Protokoll respektieren sollten, um nicht gegen die Nutzungsbedingungen zu verstoßen.

Ein AWS-Sprecher erklĂ€rte dazu: „Die AWS-Nutzungsbedingungen verbieten unseren Kunden, unsere Dienste fĂŒr illegale AktivitĂ€ten zu nutzen, und unsere Kunden sind dafĂŒr verantwortlich, unsere Bedingungen und alle geltenden Gesetze einzuhalten.“ Diese Aussagen verdeutlichen, dass AWS strikt darauf achtet, dass die Kunden sich an die Regeln halten. Das Anliegen um Perplexity AI entstand, nachdem ein Konkurrent dem Unternehmen vorgeworfen hatte, mindestens einen Artikel gestohlen zu haben. Weitere Untersuchungen durch WIRED bestĂ€tigten diesen Verdacht und belegten zudem, dass Systeme von Perplexity auf Inhalte von CondĂ© Nast-Webseiten zugegriffen hatten, obwohl diese durch eine robots.txt-Datei geschĂŒtzt waren.

Spuren im Netz: IP-Adressen und serverseitige AktivitÀten

Die technische Analyse von WIRED brachte ans Licht, dass eine virtuelle Maschine auf AWS-Diensten verwendet wurde, um Inhalte von Webseiten zu scrapen, die dies ausdrĂŒcklich verboten hatten. Diese Scraper-IP-Adresse (44.221.181.252) konnte in den letzten drei Monaten hunderte Male auf CondĂ© Nast’s Webseiten zugreifen. Auch andere namhafte MedienhĂ€user wie The Guardian, Forbes und The New York Times haben Ă€hnliche Zugriffe entdeckt und bestĂ€tigt.

Perplexity AI reagierte auf diese EnthĂŒllungen mit einer ErklĂ€rung des CEO Aravind Srinivas. ZunĂ€chst bestritten sie jegliches Fehlverhalten und beschrieben die Beobachtungen als MissverstĂ€ndnis ihrer Technologie. Der CEO erklĂ€rte, dass die suspecte IP-Adresse von einer Drittfirma betrieben werde, die Web-Crawling-Dienste anbiete. Aufgrund einer Geheimhaltungsvereinbarung nannte er jedoch nicht den Namen dieses Drittunternehmens.

Verschleierung oder MissverstÀndnis?

Einige Tage spĂ€ter Ă€ußerte sich eine Perplexity-Sprecherin, Sara Platnick, und versicherte, dass das Unternehmen die Anfragen von AWS beantwortet habe und dass es sich um ein normales Prozedere handele. Platnick betonte, dass der PerplexityBot grundsĂ€tzlich die robots.txt-Dateien respektiere, jedoch unter bestimmten Bedingungen – wenn Nutzer eine spezifische URL eingeben – das Protokoll ignoriere.

Die ErklĂ€rung von Perplexity scheint jedoch zu bestĂ€tigen, dass das Unternehmen in einigen FĂ€llen die robots.txt-Regeln nicht einhĂ€lt. Diese Praxis wirft Fragen zur LegalitĂ€t und zu möglichen Verletzungen der Nutzungsbedingungen der betroffenen Webseiten auf. Jason Kint, CEO von Digital Content Next, einer Handelsorganisation fĂŒr digitale Inhalte, erklĂ€rte dazu: „KI-Unternehmen sollten grundsĂ€tzlich davon ausgehen, dass sie keinerlei Rechte haben, Inhalte von Verlagen ohne Erlaubnis zu nutzen.“

Diese VorfĂ€lle haben die Aufmerksamkeit der gesamten Branche auf sich gezogen und könnten dazu fĂŒhren, dass strengere Vorschriften und Kontrollen eingefĂŒhrt werden, um die Praktiken von KI-Firmen zu regulieren. Es bleibt abzuwarten, wie sich die Untersuchungen von AWS entwickeln und welche Konsequenzen daraus resultieren werden.

Mehr zum Thema:
  • EnthĂŒllt: Die schockierende Wahrheit hinter Perplexitys Antwortmaschine
    EnthĂŒllt: Die schockierende Wahrheit hinter…
  • Die besten 50 Seo Tipps fĂŒr Einsteiger
    Die 50 besten SEO Tipps fĂŒr Einsteiger
  • Die Zukunft der Robotik: Die Top-Experten verraten exklusive Einblicke in die bahnbrechenden Technologien
    Die Zukunft der Robotik: Die Top-Experten verraten…
Total
1
Shares
Share 0
Tweet 0
Pin it 1
Avatar-Foto
Thomas Harnisch

Thomas Harnisch ist Senior Online Marketing Manager mit ĂŒber 17 Jahren Berufserfahrung, davon mehr als 8 Jahre in der Touristik. Als Hobbyfotograf und -koch probiert Thomas Harnisch gerne neue technische GerĂ€te aus. Wenn er nicht gerade fotografiert oder eine kulinarische Kreation zaubert, verbringt er seine Zeit mit seiner Frau und seiner kleinen Tochter. Mit seinem neuen Blog agentur.rocks möchte Thomas gerne sein Wissen und seine gemachten Erfahrungen teilen.

Dir könnte auch gefallen
Chinas Sonde Tianwen-2 enthĂŒllt erstes mysteriöses Bild!
Weiterlesen
  • News
Chinas Sonde Tianwen-2 enthĂŒllt erstes mysteriöses Bild!
  • Thomas Harnisch
  • 13.06.2025 11:11
Meta Chatbot enthĂŒllt: Ihre privaten Daten sind in Gefahr!
Weiterlesen
  • News
Meta Chatbot enthĂŒllt: Ihre privaten Daten sind in Gefahr!
  • Thomas Harnisch
  • 12.06.2025 23:58
Weiterlesen
  • News
Virtuelle StÀdte der Zukunft: Revolutioniert Turin die Metropolen?
  • Thomas Harnisch
  • 12.06.2025 20:52
Schreibe einen Kommentar Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Anzeigen
Peter













Neueste BeitrÀge
  • Chinas Sonde Tianwen-2 enthĂŒllt erstes mysteriöses Bild!
    Chinas Sonde Tianwen-2 enthĂŒllt erstes mysteriöses Bild!
  • Meta Chatbot enthĂŒllt: Ihre privaten Daten sind in Gefahr!
    Meta Chatbot enthĂŒllt: Ihre privaten Daten sind in Gefahr!
  • Virtuelle StĂ€dte der Zukunft: Revolutioniert Turin die Metropolen?
  • Politiker warnen: Verkauf von 23andMe könnte Daten gefĂ€hrden
    Politiker warnen: Verkauf von 23andMe könnte Daten gefÀhrden
  • Olto E-Bike: Die urbane MobilitĂ€t wird völlig neu erfunden!
    Olto E-Bike: Die urbane MobilitÀt wird völlig neu erfunden!
  • Warum du nie wieder ein anderes Material tragen willst!
    Warum du nie wieder ein anderes Material tragen willst!
Agentur.rocks
  • DatenschutzerklĂ€rung
  • Impressum
  • Sitemap
  • GastbeitrĂ€ge
  • Portale und Profile
  • Cookies
Der Blog fĂŒr Marketing-Interessierte
Marketing/CRM
  • Die 50 wichtigsten Marketingbegriffe
  • CRM Systeme
  • CRM – Customer Relationship Management
  • CRM-Marketing KundenloyalitĂ€t
  • CRM Systeme fĂŒr kleine Unternehmen 
  • Network Marketing Firmen
SEO
  • SEO Optimierung
  • Die 50 besten SEO Tipps
  • SEO Optimierung Preis
  • SEO Optimierung kostenlos
E-Commerce
  • E-Commerce
  • E-Commerce Umsatz steigern
  • E-Commerce Online Marktplatz
  • E-Commerce Nische
  • Network Marketing Firmen

Gib dein Suchwort ein und drĂŒcke Enter.