CoAgents erreicht die Kompetenz, indem es die Aufgaben der Werkzeugnutzung in drei spezialisierte Intelligenzen aufteilt:
- Basis-AgentVerantwortlich für die Übersetzung der Benutzerabsicht in ausführbare Anweisungen, Lösung des Problems "was zu tun ist".
- ausführender AgentSpezialisieren Sie sich auf den eigentlichen Aufruf von Tools/APIs und lösen Sie das "How to"-Problem.
- BeobachtungsagentenExtrahieren von strukturierten Informationen aus den zurückgegebenen Rohdaten, um das Problem "was ist das Ergebnis" zu lösen.
Die drei bilden einen geschlossenen Arbeitsablauf, der durch Rückmeldungen aus der Umgebung iterativ optimiert werden kann, wenn Ausführungsfehler auftreten. Im Fall von TMDB gibt der Benutzer beispielsweise "Finde Sci-Fi-Filme" ein, der Basisagent generiert API-Abfragebefehle, der Ausführungsagent ruft die /search-Schnittstelle auf und der Beobachtungsagent extrahiert Schlüsselfelder wie Titel/Bewertung aus den JSON-Ergebnissen. Diese Arbeitsteilung ermöglicht es LLM, komplexe Tools genauer zu nutzen.
Diese Antwort stammt aus dem ArtikelCoAgents: ein Rahmen für das Erlernen der Nutzung von Tools durch multi-intelligente ZusammenarbeitDie