O Youtu-agent é uma estrutura de inteligências de IA avançada e bem projetada, desenvolvida pelo Tencent Youtu Lab. Ele foi projetado especificamente para criar, executar e avaliar inteligências de IA autônomas, e seu principal recurso é que ele adota totalmente modelos de código aberto e obtém excelente desempenho sem depender de grandes modelos de código fechado. A estrutura foi validada em benchmarks rigorosos e obteve os melhores resultados em avaliações confiáveis, como WebWalkerQA e GAIA, usando a família de modelos de código aberto DeepSeek-V3. O Youtu-agent é altamente flexível e dimensionável, com uma arquitetura baseada noopenai-agents
A estrutura usa arquivos YAML para configuração e oferece suporte à execução assíncrona para lidar eficientemente com tarefas complexas. Para reduzir o limite de uso, a estrutura adota arquivos YAML para configuração e cria a função "meta-agente", que pode gerar automaticamente a configuração do corpo inteligente por meio do diálogo com o usuário, simplificando bastante o processo de desenvolvimento. No momento, a estrutura tem suporte integrado para análise de dados, gerenciamento de arquivos, geração de relatórios de pesquisa aprofundada, análise de teses e outros cenários funcionais práticos.
Lista de funções
- Excelente desempenhoPrecisão líder do setor em benchmarking de inteligências convencionais (por exemplo, WebWalkerQA e GAIA) usando apenas modelos de código aberto (por exemplo, série DeepSeek-V3).
- Suporte abrangente a código abertoA estrutura é profundamente otimizada para modelos de código aberto e foi projetada para reduzir os custos de desenvolvimento e implantação, permitindo que os usuários criem inteligências avançadas sem depender de modelos de código fechado caros.
- Cenários práticos incorporadosOferece funcionalidade pronta para uso que pode ser usada diretamente para lidar com tarefas comuns, como análise de dados CSV, revisão da literatura, organização e categorização de arquivos locais e pesquisa temática aprofundada.
- Arquitetura modular flexívelBaseado em
openai-agents
Construídos, os componentes principais (por exemplo, ambientes, kits de ferramentas, gerenciadores de contexto) suportam um alto grau de personalização e extensibilidade, permitindo a fácil integração de novos modelos e ferramentas. - Automação e simplicidade:
- Use o recurso simples e intuitivo
YAML
A documentação para definir e configurar as inteligências é bem estruturada e fácil de gerenciar. - A exclusiva "meta-inteligência" pode capturar automaticamente os requisitos e gerar arquivos de configuração por meio de um diálogo interativo com o usuário, reduzindo significativamente a complexidade de escrever manualmente o código e as configurações.
- Use o recurso simples e intuitivo
- Execução assíncrona eficienteA estrutura oferece suporte total a operações assíncronas, permitindo alto desempenho e execução eficiente de tarefas, e é particularmente adequada para cenários de avaliação e teste que exigem processamento simultâneo.
- Rastreamento e análise avançadosOTEL: incorporado além do OTEL convencional
DBTracingProcessor
Um sistema que permite a análise profunda das trajetórias de invocação de ferramentas de inteligências para depuração e otimização (a ser lançado).
Usando a Ajuda
A estrutura do Youtu-agent foi projetada para ser simples, de modo que os usuários possam começar a usá-la rapidamente e aplicá-la a cenários reais. Veja abaixo o procedimento detalhado de instalação e uso.
1. preparação e instalação do ambiente
Primeiro, você precisa clonar o repositório de código do projeto localmente a partir do GitHub e instalar as bibliotecas de dependência necessárias.
Etapa 1: clonar o repositório de código
Abra um terminal (ferramenta de linha de comando) e execute o seguinte comando git para baixar o código do projeto localmente:
git clone https://github.com/Tencent/Youtu-agent.git
Etapa 2: Insira o catálogo do projeto
cd Youtu-agent
Etapa 3: Instalar dependências
Uso do projetopyproject.toml
para gerenciar dependências, você pode usar opip
para realizar a instalação. Recomenda-se a instalação em um novo ambiente virtual para evitar conflitos de dependência com outros projetos.
# 创建并激活虚拟环境(推荐)
python -m venv venv
source venv/bin/activate # 在Windows上使用 `venv\Scripts\activate`
# 安装项目依赖
pip install .
Etapa 4: Configurar as variáveis de ambiente
Para que as inteligências possam chamar APIs externas (por exemplo, a API Big Model ou a API Search Tool), você precisa configurar variáveis de ambiente. O projeto fornece um arquivo de modelo de configuração.env.example
. Você precisa fazer uma cópia e renomeá-la.env
e, em seguida, preencha sua chave de API.
cp .env.example .env
Depois disso, use um editor de texto para abrir o arquivo.env
preencha algo comoDEEPSEEK_API_KEY
etc. o valor desejado.
2. Primeiros passos: executando uma inteligência de busca simples
Este exemplo o levará a executar uma inteligência básica com recursos de pesquisa na Web.
Etapa 1: Criar um perfil de corpo inteligente
existirconfigs/agents/
para criar um novo arquivo YAML, por exemplosample_tool.yaml
. Esse arquivo define o nome do Intelligence, seus comandos de sistema e as ferramentas que precisam ser carregadas.
# configs/agents/sample_tool.yaml
defaults:
- /model/base
- /tools/search@toolkits.search # 加载名为'search'的工具包
- _self_
agent:
name: simple-tool-agent
instructions: "你是一个乐于助人的助手,可以在网上搜索信息。"
Etapa 2: Escreva e execute um script Python
Crie um arquivo de script Python, por exemplorun_agent.py
e escreva o seguinte código. Esse código carregará o arquivo de configuração que você acabou de criar e iniciará as inteligências em diálogo com você.
import asyncio
from utu.agents import SimpleAgent
async def main():
# 通过指定配置文件名来初始化智能体
async with SimpleAgent(config="sample_tool.yaml") as agent:
# 与智能体进行对话
await agent.chat("今天北京的天气怎么样?")
# 运行主函数
asyncio.run(main())```
在终端中执行此脚本,智能体就会启动,调用搜索工具查询天气信息并给出回答。
```bash
python run_agent.py
3. função principal: geração automatizada de inteligências
Esse é um dos recursos mais exclusivos do Youtu-agent, que permite que você crie automaticamente uma configuração de inteligência conversando com uma "meta-inteligência", sem precisar escrever manualmente um arquivo YAML.
Etapa 1: Inicie o script do corpo da meta-inteligência
Execute o seguinte comando no terminal:
python scripts/gen_simple_agent.py
Etapa 2: Diálogo com a meta-inteligência
Quando o script for iniciado, ele começará a fazer perguntas como um auxiliar para entender as necessidades específicas das inteligências que você deseja criar, por exemplo:
- O que você quer que essa inteligência faça?
- De quais ferramentas ele precisa (por exemplo, pesquisa, leitura/gravação de arquivos, etc.)?
- Que instruções comportamentais você espera que ele siga?
Etapa 3: Geração automática de arquivos de configuração
Depois que você responder à pergunta, a meta-inteligência estará automaticamente na seçãogenerated/
para gerar um diretórioYAML
Arquivo de configuração.
Etapa 4: Execute o corpo inteligente recém-gerado
Você pode usar diretamente ocli_chat.py
para executar essa inteligência recém-gerada e experimentar o que ela pode fazer.
python scripts/cli_chat.py --stream --config generated/你生成的配置文件名.yaml
4. uso avançado: execução dos exemplos incorporados
O projeto está emexamples/
O catálogo fornece vários exemplos de tarefas complexas que podem ser executadas diretamente, como a pesquisa profunda.
Para executar o Deep Research Intelligence, basta executar o seguinte comando:
python -m examples.research.main
Essa inteligência realizará uma pesquisa on-line aprofundada sobre um tópico específico e, por fim, gerará um relatório abrangente. Você pode consultar esses códigos de exemplo para saber como criar aplicativos mais complexos.
cenário do aplicativo
- Análise automatizada de dados
O usuário pode instruir o corpo inteligente a analisar umCSV
Arquivo de tabela. O Intelligent Society lê automaticamente o conteúdo dos dados, realiza insights de dados e análises estatísticas e gera uma visualização com base nos resultados das análises.HTML
Formato do relatório. - Gerenciamento de documentos pessoais
Para arquivos que estão bagunçando seu computador, você pode dar comandos ao SmartBody, como "Renomeie todos os meus arquivos de projeto de acordo com o ano e o nome do projeto e classifique-os em pastas diferentes". O corpo inteligente pode executar automaticamente operações como renomear e mover arquivos para organizar o sistema de arquivos. - Pesquisa aprofundada sobre o assunto
Quando for necessário realizar uma pesquisa aprofundada em um campo desconhecido ou em um tópico específico, o corpo inteligente pode ser instruído a realizar essa tarefa. Ele coletará automaticamente uma grande quantidade de informações relevantes na Internet, lerá e refinará as informações principais, filtrará e integrará o conteúdo e, por fim, gerará um relatório de pesquisa abrangente com lógica clara e conteúdo detalhado. - Assistência para trabalhos acadêmicos
Os pesquisadores podem fornecer um ou mais artigos acadêmicos e instruir o corpo inteligente a analisá-los. O corpo inteligente pode analisar as ideias centrais, os métodos experimentais e as conclusões dos artigos e, com base nisso, pode localizar e organizar automaticamente as referências relevantes, ajudando o pesquisador a concluir rapidamente o trabalho de revisão da literatura.
QA
- O que é o Youtu-agent?
É uma estrutura para inteligências de IA desenvolvida pelo YouTuber Labs da Tencent, projetada com o objetivo de facilitar aos desenvolvedores o uso de modelos de linguagem grande de código aberto para criar, executar e avaliar programas de IA que possam concluir tarefas de forma autônoma. - Qual é a diferença entre o Youtu-agent e outras estruturas de corpos inteligentes?
Seu principal diferencial é o foco e a otimização de modelos de código aberto e o compromisso de fornecer soluções de baixo custo e alto desempenho. Além disso, seu exclusivo recurso de "meta-inteligência", que pode gerar automaticamente configurações de carroceria inteligentes por meio de diálogo, simplifica muito o processo de desenvolvimento. - Quais modelos de idiomas grandes são compatíveis?
A estrutura tem bom suporte e desempenho para modelos de código aberto representados pela série DeepSeek-V3. Ao mesmo tempo, sua arquitetura é compatível com o SDK openai-agents, que pode ser perfeitamente adaptado e acessado, incluindogpt-oss
Múltiplas APIs de modelo dentro. - Preciso escrever muito código para usar o Youtu-agent?
Não é necessário. Para as tarefas mais comuns, você só precisará passar por um simplesYAML
A configuração do arquivo pode ser configurada. Para necessidades mais personalizadas, seu recurso de "meta-inteligência" pode até mesmo gerar automaticamente arquivos de configuração para você por meio de diálogo, reduzindo ainda mais a barreira ao uso.