Agentur.rocks
  • Technologien
    • KI
    • Adserver
    • CMS
    • CRM
    • E-Commerce
    • Tools
    • Tracking
  • Marketing
    • Affiliate Marketing
    • Content Marketing
    • Display Advertising
    • Network Marketing
    • Newsletter Marketing
    • Digitales Marketing
    • Push Notifications
    • SEA
    • SEO
    • Social Advertising
    • Personal Marketing
    • Social Media
  • Agenturen
  • Dienstleister
    • Daten Dienstleister
    • Entwickler
    • Server Hosting
  • Tools und Weiteres
    • News
    • Anleitungen
    • Wissen
    • CRM Systeme
    • Tipps & Tricks
    • FAQ
    • Jobs
    • Rechner
      • Cost per Action (CPA) berechnen
      • Cost per Click (CPC) berechnen
      • Cost per Lead (CPL) berechnen
      • Cost per View (CPV)
      • Cost per Order (CPO) berechnen
      • Kosten Umsatz Relation (KUR) berechnen
    • Datenschutz
      • Datenschutz News
      • Datenschutz Tools
Kategorien
  • Adserver
  • Affiliate Marketing
  • Agenturen
  • Allgemein
  • Anleitungen
  • Branchen
  • CMS
  • Content Marketing
  • CRM
  • CRM Anbieter
  • Datenschutz
  • Dienstleister
  • Digitales Marketing
  • Display Advertising
  • E-Commerce
  • Entwickler
  • FAQ
  • Jobs
  • KI
  • Marketing
  • Network Marketing
  • News
  • Newsletter Marketing
  • Online Marketing
  • Personal Marketing
  • Push Notifications
  • SEA
  • SEO
  • Server Hosting
  • Social Advertising
  • Social Media
  • Technologien
  • Tipps & Tricks
  • Tools
  • Tracking
  • Wissen
Bei Google Podcast anhören
Agentur.rocks
  • Technologien
    • KI
    • Adserver
    • CMS
    • CRM
    • E-Commerce
    • Tools
    • Tracking
  • Marketing
    • Affiliate Marketing
    • Content Marketing
    • Display Advertising
    • Network Marketing
    • Newsletter Marketing
    • Digitales Marketing
    • Push Notifications
    • SEA
    • SEO
    • Social Advertising
    • Personal Marketing
    • Social Media
  • Agenturen
  • Dienstleister
    • Daten Dienstleister
    • Entwickler
    • Server Hosting
  • Tools und Weiteres
    • News
    • Anleitungen
    • Wissen
    • CRM Systeme
    • Tipps & Tricks
    • FAQ
    • Jobs
    • Rechner
      • Cost per Action (CPA) berechnen
      • Cost per Click (CPC) berechnen
      • Cost per Lead (CPL) berechnen
      • Cost per View (CPV)
      • Cost per Order (CPO) berechnen
      • Kosten Umsatz Relation (KUR) berechnen
    • Datenschutz
      • Datenschutz News
      • Datenschutz Tools
  • News

Hightech-Revolution: Dieser Roboter ersetzt persönliche Assistenten

  • Thomas Harnisch
  • 12.07.2024 05:46
Hightech-Revolution: Dieser Roboter ersetzt persönliche Assistenten
Symbolfoto
Total
1
Shares
0
0
1
  • Ein großer Roboter in einem Großraumbüro in Mountain View dient als Tourguide und Büroassistent. Dank Google DeepMind kann der Roboter komplexe Befehle interpretieren und eigenständig navigieren. Das Gemini-Modell von Google ermöglicht dem Roboter, mit visuellen und textuellen Eingaben umzugehen. Forscher und Startups arbeiten intensiv daran, Sprachmodelle zur Verbesserung der Roboterfähigkeiten zu nutzen. Zukünftige Entwicklungen zielen darauf ab, Sprachmodelle und Robotik noch stärker zu verknüpfen.

In einem überladenen Großraumbüro in Mountain View, Kalifornien, verrichtet ein großer, schlanker Roboter auf Rädern seine täglichen Aufgaben als Tourguide und informeller Büroassistent. Dank fortschrittlicher Sprachmodell-Upgrade durch Google DeepMind ist der Roboter in der Lage, komplexe Befehle zu interpretieren und seine Umgebung selbstständig zu navigieren. Sagt ein Mensch beispielsweise „Finde mir einen Platz zum Schreiben“, navigiert der Roboter prompt zu einem tadellos sauberen Whiteboard irgendwo im Gebäude.

Die Fähigkeit des Roboters, sowohl Video als auch Text zu verarbeiten, erweitert seine Möglichkeiten erheblich. Er kann große Mengen von Informationen aus früher aufgezeichneten Touren des Büros aufnehmen und so seine Umgebung besser verstehen. Dadurch kann er auch scheinbar unkomplizierte Befehle, die jedoch ein gewisses Maß an gesundem Menschenverstand erfordern, korrekt umsetzen. Diese Kombination aus dem Gemini-Modell und einem speziellen Algorithmus ermöglicht es dem Roboter, konkrete Handlungen auszuführen, wie z.B. Abbiegen in Richtung eines bestimmten Ziels.

Gemini und KI – Mehr als nur Theorie

Im Dezember stellte Demis Hassabis, CEO von Google DeepMind, das Gemini-Modell vor und betonte, dass dessen multimodale Fähigkeiten neue Anwendungsmöglichkeiten für Roboter eröffnen würden. Die Forscher des Projekts berichten, dass ihr Roboter bis zu 90 Prozent der Zeit erfolgreich navigiert, selbst wenn ihm komplexe Befehle wie „Wo habe ich meinen Untersetzer gelassen?“ gegeben werden. Das System von DeepMind hat die Natürlichkeit der Mensch-Roboter-Interaktion erheblich verbessert und die Benutzerfreundlichkeit des Roboters stark erhöht.

Dieser Demonstration zufolge zeigen sich vielversprechende Ansätze, wie KI-Modelle wie Gemini die physische Welt beeinflussen können. Bislang operierten solche Modelle hauptsächlich innerhalb von Webbrowsern oder Apps, doch durch die zunehmende Fähigkeit zur Verarbeitung visueller und auditiver Eingaben erweitern sich ihre Einsatzbereiche. Im Mai präsentierte Hassabis eine Anwendung, die mit Hilfe einer Smartphone-Kamera die Bürolayouts analysieren kann.

Forschung und Investitionen: Zukunft der Robotik

Sowohl akademische als auch industrielle Forschungslabore arbeiten intensiv daran, Sprachmodelle zur Verbesserung der Roboterfähigkeiten zu nutzen. Auf der International Conference on Robotics and Automation im Mai wurden fast zwei Dutzend Arbeiten vorgestellt, die visuelle Sprachmodelle verwenden. Investoren zeigen großes Interesse an Startups, die fortschrittliche KI-Technologien auf die Robotik anwenden.

Einige der Forscher, die ursprünglich am Google-Projekt beteiligt waren, haben das Unternehmen verlassen und ein Startup gegründet, das 70 Millionen Dollar als Startkapital erhielt. Ziel ist es, große Sprachmodelle mit realer Ausbildung zu kombinieren, um Robotern allgemeine Problemlösungsfähigkeiten zu verleihen. Ein weiteres Startup, gegründet von Robotikern der Carnegie Mellon University, verfolgt ähnliche Ziele und konnte kürzlich 300 Millionen Dollar an Finanzierung sichern.

Noch vor wenigen Jahren benötigte ein Roboter detaillierte Karten seiner Umgebung und präzise Befehle, um erfolgreich zu navigieren. Heutige große Sprachmodelle beinhalten nützliches Wissen über die physische Welt. Neue Versionen, die auf Bildern und Videos sowie Texten trainiert wurden, bekannt als visuelle Sprachmodelle, können nun Fragen beantworten, die Wahrnehmung erfordern. Gemini erlaubt es Googles Robotern, visuelle Anweisungen ebenso wie gesprochene zu interpretieren.

Zukunftsperspektiven und Ausblick

In ihrer Veröffentlichung erklären die Forscher, dass sie planen, das System an verschiedenen Arten von Robotern zu testen. Sie sind zuversichtlich, dass Gemini in der Lage sein wird, auch komplexere Fragen zu verstehen, wie z.B. „Haben sie heute mein Lieblingsgetränk?“, gefragt von einem Benutzer, dessen Schreibtisch voller leerer Coladosen steht.

Die Entwicklungen zeigen eine vielversprechende Zukunft, in der Sprachmodelle und Robotik eng miteinander verknüpft sind und uns dabei helfen, alltägliche Aufgaben effizienter und intuitiver zu bewältigen.

Mehr zum Thema:
  • Die Arbeit eines Webdesigners
    Die Arbeitswelt eines Webdesigners
  • Forscher entsetzt über neue Pläne von führendem KI-Unternehmen!
    Forscher entsetzt über neue Pläne von führendem…
  • Die besten kostenlosen CRM Systeme
    CRM – Customer Relationship Management zur…
Total
1
Shares
Share 0
Tweet 0
Pin it 1
Avatar-Foto
Thomas Harnisch

Thomas Harnisch ist Senior Online Marketing Manager mit über 17 Jahren Berufserfahrung, davon mehr als 8 Jahre in der Touristik. Als Hobbyfotograf und -koch probiert Thomas Harnisch gerne neue technische Geräte aus. Wenn er nicht gerade fotografiert oder eine kulinarische Kreation zaubert, verbringt er seine Zeit mit seiner Frau und seiner kleinen Tochter. Mit seinem neuen Blog agentur.rocks möchte Thomas gerne sein Wissen und seine gemachten Erfahrungen teilen.

Dir könnte auch gefallen
Warum das MacBook Air der geheime Laptop-Tipp 2023 ist
Weiterlesen
  • News
Warum das MacBook Air der geheime Laptop-Tipp 2023 ist
  • Thomas Harnisch
  • 30.06.2025 16:10
Weiterlesen
  • News
Wie digitale Medien die Einsamkeit unserer Jugend fördern
  • Thomas Harnisch
  • 30.06.2025 15:37
Einsamkeit schockiert: Warum auch Jugendliche betroffen sind!
Weiterlesen
  • News
Einsamkeit schockiert: Warum auch Jugendliche betroffen sind!
  • Thomas Harnisch
  • 30.06.2025 15:25
Schreibe einen Kommentar Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Anzeigen
Peter













Neueste Beiträge
  • Warum das MacBook Air der geheime Laptop-Tipp 2023 ist
    Warum das MacBook Air der geheime Laptop-Tipp 2023 ist
  • Wie digitale Medien die Einsamkeit unserer Jugend fördern
  • Einsamkeit schockiert: Warum auch Jugendliche betroffen sind!
    Einsamkeit schockiert: Warum auch Jugendliche betroffen sind!
  • Entdecke das Chromebook, das alle anderen verblassen lässt!
    Entdecke das Chromebook, das alle anderen verblassen lässt!
  • Microsofts KI: Viermal präziser als menschliche Ärzte!
    Microsofts KI: Viermal präziser als menschliche Ärzte!
  • Warum diese einfache Kaffeemaschine Ihr Leben verändern könnte
    Warum diese einfache Kaffeemaschine Ihr Leben verändern könnte
Agentur.rocks
  • Datenschutzerklärung
  • Impressum
  • Sitemap
  • Gastbeiträge
  • Portale und Profile
  • Cookies
Der Blog für Marketing-Interessierte
Marketing/CRM
  • Die 50 wichtigsten Marketingbegriffe
  • CRM Systeme
  • CRM – Customer Relationship Management
  • CRM-Marketing Kundenloyalität
  • CRM Systeme für kleine Unternehmen 
  • Network Marketing Firmen
SEO
  • SEO Optimierung
  • Die 50 besten SEO Tipps
  • SEO Optimierung Preis
  • SEO Optimierung kostenlos
E-Commerce
  • E-Commerce
  • E-Commerce Umsatz steigern
  • E-Commerce Online Marktplatz
  • E-Commerce Nische
  • Network Marketing Firmen

Gib dein Suchwort ein und drücke Enter.