Roboter können mithilfe eines neuen Durchbruchmodells unbekannte Aufgaben erlernen
Ein US-Robotics-Startup sagt, sein neuestes KI-Modell könne Roboter anweisen, Aufgaben auszuführen, für die sie nie trainiert wurden.

Kurzfassung
Warum das wichtig ist
- Ein US-Robotics-Startup sagt, sein neuestes KI-Modell könne Roboter anweisen, Aufgaben auszuführen, für die sie nie trainiert wurden.
- Das namens π0.7 markiert einen frühen Schritt hin zu einem allgemeinen Robotergehirn, das unbekannte Aufgaben mithilfe ürlicher Sprache bewältigen kann.
- Der San-Francisco ansässige Betrieb teilte mit, dass die Ergebnisse unerwartet seien.
Falls bestätigt, deuten sie darauf hin, dass die Roboter-KI einen Wendepunkt erreichen könnte, wobei die Fähigkeiten schneller voranschreiten als erwartet.
„In unseren Experimenten sehen wir, dass π0.7 erste Anzeichen Fähigkeiten aus verschiedenen Aufgaben kombiniert, um neue Probleme zu lösen, wie die Verwendung neuer Küchengeräte und sogar die Ermöglichung, dass ein neuer Roboter Wäsche faltet, für die es keine Daten zum Wäschefalten gibt“, so das Unternehmen in einem Blogbeitrag.
Robotergehirn entsteht Das neue Modell, π0.7, wird als ein früher, aber bedeutsamer Schritt hin zu einem allgemeinen Robotergehirn beschrieben, das in der Lage ist, unbekannte Aufgaben durch Anweisungen in natürlicher Sprache zu bewältigen.
Technik und Auswirkungen
Laut Forschern zeigt es einen deutlichen Fortschritt in der Generalisierung und führt eine breite Palette aus, das mit spezialisierten Systemen vergleichbar ist, während es gleichzeitig Aufgaben ausführt, die nicht in seinen Trainingsdaten enthalten waren.
Experimente zeigen frühe Anzeichen, bei der das Modell erlernte Fähigkeiten kombiniert, um neue Probleme zu lösen. Beispiele hierfür sind die Verwendung unbekannter Küchengeräte und die Ermöglichung für einen Roboter, Aufgaben wie das Falten von Wäsche ohne vorherige tasksspezifische Daten auszuführen.
Dies markiert einen Wandel gegenüber dem traditionellen Robotertraining, das auf das Sammeln separater Modelle für jede Aufgabe angewiesen ist.
Im Gegensatz zu früheren Vision-Language-Action-Systemen, die
Im Gegensatz zu früheren Vision-Language-Action-Systemen, die Schwierigkeiten hatten, Fähigkeiten auf neue Weise zu kombinieren, kann π0.7 bestehende Fähigkeiten in neuen Kontexten ohne zusätzliches Fine-Tuning anwenden. Es generalisiert auch effektiver über verschiedene Roboter, Umgebungen und Aufgaben hinweg.

Diese Ergebnisse deuten auf einen Übergang zu flexibleren, allgemeinzweckmäßigen Systemen, bei denen die Fähigkeiten effizienter skalieren, während die Modelle lernen, Wissen über verschiedene Domänen hinweg wiederzuverwenden und zu kombinieren.
Flexible KI-Systeme π0.7s breite Generalisierung resultiert daraus, wie es trainiert und eingegeben wird (prompted). Anstatt sich auf eine einzige Datenquelle zu verlassen, basiert das Modell auf einer Mischung, darunter mehrere Roboterplattformen, menschliche Demonstrationen und autonom gesammelte Episoden.
Technik und Auswirkungen
Anstatt diese Datensätze direkt zu kombinieren, wird das System mit reichhaltigen, multimodalen Prompts trainiert, die nicht nur die Aufgabe, sondern auch die Ausführungsdetails definieren. Zu diesen Prompts können Textanweisungen, visuelle Unterziele, die Anordnungen, und Parameter wie die Dauer der Aufgabe gehören.
Dieser zusätzliche Kontext hilft dem Modell, vielfältiges Verhalten und Strategien zu interpretieren, und ermöglicht es ihm, Wissen flexibler anzuwenden. Während der Inferenz kann das Modell standardmäßige Sprachanweisungen befolgen und gleichzeitig Anleitungen einbeziehen, wie gewünschte Strategien oder generierte visuelle Ziele.
Dies ermöglicht es ihm, sich in Echtzeit anzupassen und die Leistung zu verbessern, ohne neu trainiert werden zu müssen. Im Test zeigte das System die Fähigkeit, zu inferieren, wie man unbekannte Objekte benutzt, indem es begrenzte Vorbeispiele mit breiterem erlerntem Wissen kombiniert.
Mit minimaler Anleitung versuchte es neue
Mit minimaler Anleitung versuchte es neue Aufgaben, und mit strukturierten Schritt-für-Schritt-Anweisungen verbesserte sich die Leistung signifikant. Der Ansatz unterstreicht einen Wandel hin zum interaktiven Lernen, bei dem menschliches Feedback und Prompt-Design eine entscheidende Rolle für die Ergebnisse spielen.
Allerdings benötigt das System für mehrstufige Aufgaben immer noch detaillierte Anleitungen und kann komplexe Anweisungen nicht autonom aus einem einzigen Befehl ausführen. Forscher weisen auch auf das Fehlen standardisierter Benchmarks hin, was eine unabhängige Validierung schwierig macht.
Die Ergebnisse sind noch in einem frühen Stadium, deuten aber auf anpassungsfähigere Robotersysteme hin, die Fähigkeiten über ihr ursprüngliches Training hinaus erweitern können.
Quelllink
Originalquelle: Interesting Engineering
Thema weiterverfolgen
Interne Verlinkung
Im Kontext weiterlesen
Diese weiterfuehrenden Links verbinden das Thema mit relevanten Archivseiten, Schlagwoertern und inhaltlich nahen Artikeln.
Technologie Archiv
Weitere Meldungen aus derselben Hauptkategorie.
Mehr von Interesting Engineering
Alle veroeffentlichten Inhalte derselben Quelle im Archiv.
Oktopus nutzt Spiegel, um Futter zu finden
Redaktionell verwandter Beitrag aus dem selben Themenumfeld.
CISA warnt vor Angriffen auf zweijährige Oracle WebLogic Server-Schwachstelle
Redaktionell verwandter Beitrag aus dem selben Themenumfeld.
Quellenprofil
Quelle und redaktionelle Angaben
- Quelle
- Interesting Engineering
- Originaltitel
- Robots could learn unseen tasks using a new breakthrough model
- Canonical
- https://interestingengineering.com/ai-robotics/us-ai-model-robots-unseen-tasks
- Quell-URL
- https://interestingengineering.com/ai-robotics/us-ai-model-robots-unseen-tasks
Aehnliche Inhalte
Verwandte Themen und interne Verlinkung
Weitere Artikel aus aehnlichen Themenfeldern, damit Leser direkt im selben Kontext weiterlesen koennen.

Oktopus nutzt Spiegel, um Futter zu finden
Zusammenfassung: Eine neue Studie liefert den ersten empirischen Beleg dafür, dass wirbellose Tiere Spiegel als abstraktes räumliches Werkzeug nutzen können, um ihre Umgebung zu interpretieren.
04.06.2026
Live Redaktion
CISA warnt vor Angriffen auf zweijährige Oracle WebLogic Server-Schwachstelle
Die CISA hat eine neue Warnung herausgegeben, die die aktive Ausnutzung einer kritischen Schwachstelle Oracle WebLogic Server thematisiert, die unter der Bezeichnung CVE-2024-21182 geführt wird. Am 1.
04.06.2026
Live Redaktion%2523%252Fmedia%252FFile%253AUSS_Connecticut_SSN_22.jpg%26ref%3Dhttps%253A%252F%252Finterestingengineering.com%252Fmilitary%252Fuss-connecticut-set-for-comeback%26sig%3Dj63KoUW7d5eDPKN-K8ykTElKfaUE4mFs60bUiMklXEc&w=3840&q=75)
US-Atom-U-Boot kehrt nach vierjähriger Reparatur zur Flotte zurück
Mehr als vier Jahre nach einem schweren Unfall Sdchinesischen Meer bereitet sich der nukleargetriebene U-Boot-Verteidiger USS Connecticut auf den Wiedereinsatz vor.
04.06.2026
Live Redaktion
Intel warnt vor Memory-Preisanstieg und verspricht Unterstützung für ältere Speicherstandards
Teilen Sie diesen Artikel
04.06.2026
Live Redaktion