Interesting EngineeringSEO 100/100Technologie

Roboter können mithilfe eines neuen Durchbruchmodells unbekannte Aufgaben erlernen

Ein US-Robotics-Startup sagt, sein neuestes KI-Modell könne Roboter anweisen, Aufgaben auszuführen, für die sie nie trainiert wurden.

18. April 2026Jijo MalayilLive Redaktion

Robots could learn unseen tasks using a new breakthrough model

Ein US-Robotics-Startup sagt, sein neuestes KI-Modell könne Roboter anweisen, Aufgaben auszuführen, für die sie nie trainiert wurden. Das von Physical Intelligence entwickelte System namens π0.7 markiert einen frühen Sch Ein US-Robotics-Startup sagt, sein neuestes KI-Modell könne Roboter anweisen, Aufgaben auszuführen, für die sie nie trainiert wurden.

Das von Physical Intelligence entwickelte System namens π0.7 markiert einen frühen Schritt hin zu einem allgemeinen Robotergehirn, das unbekannte Aufgaben mithilfe von Anweisungen in natürlicher Sprache bewältigen kann. Der San-Francisco ansässige Betrieb teilte mit, dass die Ergebnisse unerwartet seien.

Falls bestätigt, deuten sie darauf hin, dass die Roboter-KI einen Wendepunkt erreichen könnte, wobei die Fähigkeiten schneller voranschreiten als erwartet.

In unseren Experimenten sehen wir,

„In unseren Experimenten sehen wir, dass π0.7 erste Anzeichen von kompositorischer Generalisierung zeigt und Fähigkeiten aus verschiedenen Aufgaben kombiniert, um neue Probleme zu lösen, wie die Verwendung neuer Küchengeräte und sogar die Ermöglichung, dass ein neuer Roboter Wäsche faltet, für die es keine Daten zum Wäschefalten gibt“, so das Unternehmen in einem Blogbeitrag.

Robotergehirn entsteht Das neue Modell, π0.7, wird als ein früher, aber bedeutsamer Schritt hin zu einem allgemeinen Robotergehirn beschrieben, das in der Lage ist, unbekannte Aufgaben durch Anweisungen in natürlicher Sprache zu bewältigen.

Laut Forschern zeigt es einen deutlichen Fortschritt in der Generalisierung und führt eine breite Palette von Geschicklichkeitsaufgaben auf einem Niveau aus, das mit spezialisierten Systemen vergleichbar ist, während es gleichzeitig Aufgaben ausführt, die nicht in seinen Trainingsdaten enthalten waren.

Experimente zeigen frühe Anzeichen von kompositorischer

Experimente zeigen frühe Anzeichen von kompositorischer Generalisierung, bei der das Modell erlernte Fähigkeiten kombiniert, um neue Probleme zu lösen.

Beispiele hierfür sind die Verwendung unbekannter Küchengeräte und die Ermöglichung für einen Roboter, Aufgaben wie das Falten von Wäsche ohne vorherige tasksspezifische Daten auszuführen.

Dies markiert einen Wandel gegenüber dem traditionellen Robotertraining, das auf das Sammeln von Daten und den Aufbau separater Modelle für jede Aufgabe angewiesen ist.

Im Gegensatz zu früheren Vision-Language-Action-Systemen, die

Im Gegensatz zu früheren Vision-Language-Action-Systemen, die Schwierigkeiten hatten, Fähigkeiten auf neue Weise zu kombinieren, kann π0.7 bestehende Fähigkeiten in neuen Kontexten ohne zusätzliches Fine-Tuning anwenden. Es generalisiert auch effektiver über verschiedene Roboter, Umgebungen und Aufgaben hinweg.

Diese Ergebnisse deuten auf einen Übergang von der aufgaben-spezifischen Schulung hin zu flexibleren, allgemeinzweckmäßigen Systemen, bei denen die Fähigkeiten effizienter skalieren, während die Modelle lernen, Wissen über verschiedene Domänen hinweg wiederzuverwenden und zu kombinieren.

Flexible KI-Systeme π0.7s breite Generalisierung resultiert daraus, wie es trainiert und eingegeben wird (prompted).

Anstatt sich auf eine einzige Datenquelle

Anstatt sich auf eine einzige Datenquelle zu verlassen, basiert das Modell auf einer Mischung von Eingaben, darunter mehrere Roboterplattformen, menschliche Demonstrationen und autonom gesammelte Episoden.

Anstatt diese Datensätze direkt zu kombinieren, wird das System mit reichhaltigen, multimodalen Prompts trainiert, die nicht nur die Aufgabe, sondern auch die Ausführungsdetails definieren.

Zu diesen Prompts können Textanweisungen, visuelle Unterziele, die Anordnungen von Objekten spezifizieren, und Parameter wie die Dauer der Aufgabe gehören.

Dieser zusätzliche Kontext hilft dem Modell,

Dieser zusätzliche Kontext hilft dem Modell, vielfältiges Verhalten und Strategien zu interpretieren, und ermöglicht es ihm, Wissen flexibler anzuwenden. Während der Inferenz kann das Modell standardmäßige Sprachanweisungen befolgen und gleichzeitig Anleitungen einbeziehen, wie gewünschte Strategien oder generierte visuelle Ziele.

Dies ermöglicht es ihm, sich in Echtzeit anzupassen und die Leistung zu verbessern, ohne neu trainiert werden zu müssen. Im Test zeigte das System die Fähigkeit, zu inferieren, wie man unbekannte Objekte benutzt, indem es begrenzte Vorbeispiele mit breiterem erlerntem Wissen kombiniert.

Mit minimaler Anleitung versuchte es neue Aufgaben, und mit strukturierten Schritt-für-Schritt-Anweisungen verbesserte sich die Leistung signifikant. Der Ansatz unterstreicht einen Wandel hin zum interaktiven Lernen, bei dem menschliches Feedback und Prompt-Design eine entscheidende Rolle für die Ergebnisse spielen.

Allerdings benötigt das System für mehrstufige

Allerdings benötigt das System für mehrstufige Aufgaben immer noch detaillierte Anleitungen und kann komplexe Anweisungen nicht autonom aus einem einzigen Befehl ausführen. Forscher weisen auch auf das Fehlen standardisierter Benchmarks hin, was eine unabhängige Validierung schwierig macht.

Die Ergebnisse sind noch in einem frühen Stadium, deuten aber auf anpassungsfähigere Robotersysteme hin, die Fähigkeiten über ihr ursprüngliches Training hinaus erweitern können.

Quelllink

Interesting Engineering – Originalartikel öffnen

Interne Verlinkungen

Technologie Archiv

Quellenprofil

Quelle und redaktionelle Angaben

Quelle: Interesting Engineering
Originaltitel: Robots could learn unseen tasks using a new breakthrough model
Canonical: https://interestingengineering.com/ai-robotics/us-ai-model-robots-unseen-tasks
Quell-URL: https://interestingengineering.com/ai-robotics/us-ai-model-robots-unseen-tasks

Ähnliche Inhalte

Roboter können mithilfe eines neuen Durchbruchmodells unbekannte Aufgaben erlernen

In unseren Experimenten sehen wir,

Experimente zeigen frühe Anzeichen von kompositorischer

Im Gegensatz zu früheren Vision-Language-Action-Systemen, die

Anstatt sich auf eine einzige Datenquelle

Dieser zusätzliche Kontext hilft dem Modell,

Allerdings benötigt das System für mehrstufige

Quelle und redaktionelle Angaben

Verwandte Themen und interne Verlinkung

E-Mail-übertragene Wurm-Angriffe bedrohen industrielle Steuerungssysteme erneut

Angriff auf TP-Link-Router mit Mirai-Malware durch Ausnutzung der Schwachstelle CVE-2023-33538

Vorhersage für 50 Jahre bestätigt: Dunkelheit schneller als Licht beobachtet

Wasserstofferzeugung aus Alkohol durch Wissenschaftler mittels Eisenkatalysator und UV-Licht