ChatGPT O Agent é uma ferramenta inteligente da OpenAI que integra recursos de manipulação da Web, análise de dados e diálogo. Ele ajuda os usuários a realizar tarefas complexas no computador, como navegar na Web, preencher formulários, analisar dados ou gerar apresentações de slides por meio de comandos de voz ou texto. Operador A capacidade de operar o site e os recursos de análise de informações da Deep Research, executados em um ambiente de computador virtual, garante a execução eficiente das tarefas. Os usuários podem controlar o progresso da tarefa, interromper ou redirecionar a qualquer momento. Ele suporta login seguro e acesso a dados de API, o que o torna adequado para indivíduos e empresas lidarem com suas tarefas diárias. No momento, ele está limitado aos usuários Pro, Plus e Team e estará disponível em julho de 2025 para usuários Enterprise e Education.
Lista de funções
- Navegue nos sites de forma inteligente: clique em links, preencha formulários e filtre o conteúdo para obter informações precisas.
- Análise e processamento de dados: execute o código, analise dados financeiros ou de mercado e gere relatórios.
- Geração de documentos: crie slides e tabelas editáveis adequados para apresentações ou organização de dados.
- API Quick Connect: obtenha dados financeiros em tempo real, resultados esportivos e muito mais.
- Login seguro: oferece suporte ao acesso a sites que exigem autenticação e protege a privacidade do usuário.
- Automação de tarefas: execute tarefas de várias etapas, como agendamento, compras ou pesquisa.
- Interação de voz e texto: controle da execução da tarefa por meio de diálogo ou comandos.
- Troca dinâmica de ferramentas: escolha a melhor ferramenta para a tarefa para aumentar a eficiência.
Usando a Ajuda
Instalação e uso
O ChatGPT Agent não requer uma instalação independente e é acessado diretamente pelo site da OpenAI (chatgpt.com) ou pelo aplicativo móvel ChatGPT (iOS e Android). Os usuários devem se registrar em uma conta da OpenAI e assinar um plano Pro, Plus ou Team. Após o login, clique no menu suspenso Ferramentas na tela do Chat e selecione "Modo Agente" para iniciá-lo. Os usuários corporativos e educacionais precisarão aguardar até julho de 2025 para o anúncio oficial da OpenAI.
Função Fluxo de operação
1. ativar o modo Agente
Faça login no chatgpt.com ou no aplicativo móvel, vá para a interface de bate-papo e clique em "Agent Mode" (Modo agente) na barra de ferramentas. A interface mudará para o ambiente de trabalho da inteligência, pronta para receber comandos de voz ou texto. Os usuários podem inserir tarefas como "Analisar três concorrentes e gerar slides" ou "Verificar meu calendário e resumir a reunião".
2. sites de navegação inteligente
O Agent oferece um navegador visual e um navegador de texto. O navegador visual imita as ações humanas ao clicar em links da Web, preencher formulários ou filtrar conteúdo. Por exemplo, se você digitar "Buy breakfast ingredients for four at Amazon" (Comprar ingredientes para o café da manhã para quatro pessoas na Amazon), o Agent navegará pelo site de compras, filtrará os produtos e solicitará que o usuário faça login com segurança para concluir a compra. Os navegadores de texto são mais eficientes para consultas rápidas, como obter preços de ações em tempo real ou resultados esportivos, e o Agent seleciona automaticamente a ferramenta certa para a tarefa.
3. análise e documentação de dados
O Agent oferece suporte ao processamento de dados complexos. Depois que o usuário digita "Analyse Nvidia's Q1 financial results and generate slides", o Agent busca os dados via API ou página da Web, executa o código para gerar os resultados da análise e produz slides do PowerPoint ou tabelas do Excel. O arquivo gerado pode ser baixado e editado, o que o torna adequado para apresentações. Os usuários podem verificar o progresso a qualquer momento e inserir "adicionar gráfico" ou "ajustar formato" para otimizar os resultados. O recurso de apresentação de slides está atualmente na versão beta e a formatação pode ser um pouco mais simples, mas os elementos são editáveis e flexíveis.
4. interação segura e controle do usuário
Ao acessar sites que exigem autenticação (por exemplo, Gmail, GitHub), o agente solicita que o usuário assuma o controle do navegador e faça login para garantir a segurança dos dados. Os usuários podem interromper uma tarefa a qualquer momento digitando "pause, check progress" para ver os resultados atuais ou fornecer instruções mais específicas para redirecionar. Por exemplo, "Obter arquivos do meu Google Drive e organizá-los em uma tabela" acionará o agente para chamar a API e concluir a tarefa. Quando a tarefa for concluída, o usuário poderá salvar os resultados ou continuar a otimização.
5. comandos de voz e texto
O Agent suporta entrada de voz para usuários móveis. No aplicativo ChatGPT, ative o modo de voz e diga uma tarefa, como "planejar um encontro de fim de semana", e o Agente pesquisará restaurantes ou eventos e gerará sugestões de viagem. A entrada de texto é adequada para tarefas complexas e, quanto mais detalhadas forem as instruções, mais precisos serão os resultados. Por exemplo, "Analise a participação de mercado de três empresas e gere um gráfico de barras" aciona a análise de dados e a geração de gráficos.
6. troca dinâmica de ferramentas
O agente pode alternar dinamicamente as ferramentas no meio de uma tarefa. Por exemplo, ao planejar uma viagem, ele pode primeiro obter informações de voo por meio de uma API, depois usar um navegador visual para navegar em sites de hotéis e, por fim, gerar um formulário de itinerário. Essa flexibilidade garante que as tarefas sejam concluídas de forma eficiente e com menos esforço manual.
7. conector e integração externa
O Agent é compatível com o conector OpenAI para acesso seguro aos dados do usuário, como arquivos do Google Drive ou informações de calendário. Os usuários precisam autorizar o conector somente leitura para que o Agent visualize os dados e execute tarefas como "organizar mensagens na caixa de entrada" ou "encontrar tempo livre para reuniões". O conector garante a segurança e a transparência dos dados.
Precauções de uso
- instruções clarasForneça descrições de tarefas específicas, por exemplo, "Analisar dados de mercado da Apple, Google, Samsung e gerar slides" é mais eficaz do que "Analisar concorrentes".
- estabilidade da redeAgente: requer uma conexão de rede estável para acessar um site ou uma API.
- gerenciamento de cotasComandos: 400 comandos por mês para usuários Pro, 50 comandos para usuários Plus e Team, com créditos adicionais disponíveis acima do limite.
- PrivacidadeO Agent não armazena senhas de usuários e exige login manual para operações confidenciais. Os usuários podem excluir os dados de navegação e fazer logout de todas as sessões do site nas configurações.
- Restrições BetaGeração de slides: A geração de slides está na versão Beta e pode não estar bem formatada, mas será otimizada no futuro.
operação de amostra
Tarefa 1: Gerar slides de análise da concorrência
- Faça login no chatgpt.com e entre no modo Agente.
- Entrada: "Analise os dados de mercado da Apple, Google e Samsung para gerar slides."
- O agente obtém dados por meio de APIs e páginas da Web e pode solicitar que o usuário faça login para acessar conteúdo pago.
- O agente executa a análise, gera uma apresentação de slides com gráficos e texto, e o link de download é exibido na interface.
- Os usuários podem inserir "Add more charts" (Adicionar mais gráficos) ou "Adjust format" (Ajustar formato) para otimizar os resultados.
Tarefa 2: Planejamento do programa
- Digite: "Verifique meu Google Agenda para recapitular as reuniões da próxima semana".
- O agente solicita que o usuário faça login em sua conta do Google para acessar os dados do calendário.
- O agente analisa o conteúdo da reunião e gera um resumo em conjunto com as notícias, como "Novos lançamentos de produtos discutidos na segunda-feira".
- Os usuários podem solicitar ao agente que agende uma resposta a um e-mail ou ajuste sua agenda.
cenário do aplicativo
- Análise de dados corporativos
Os analistas precisam gerar relatórios sobre a concorrência rapidamente. O agente pode navegar pelo site de dados de mercado, executar o código de análise e gerar slides com tabelas e gráficos, economizando tempo na compilação manual. - Automação de tarefas rotineiras
O agente pesquisa sites de compras ou de viagens, filtra as melhores opções, solicita que o usuário confirme a compra e simplifica o processo. - Suporte à pesquisa acadêmica
O agente acessa sites acadêmicos, reúne informações e gera formulários de resumo ou relatórios adequados para concluir pesquisas rapidamente. - Programação e gerenciamento de projetos
Os desenvolvedores precisam depurar código ou organizar arquivos de projeto. agent Obtenha código, execute comandos, gere documentação ou analise resultados por meio da API do GitHub.
QA
- O ChatGPT Agent é gratuito?
Somente usuários Pro, Plus e Team, não acessível a usuários gratuitos. 400 comandos por mês para usuários Pro, 50 para usuários Plus e Team, com créditos adicionais disponíveis. - Como você garante a segurança dos dados?
O Agent não armazena senhas de usuários e exige login manual para operações confidenciais. Os usuários podem excluir os dados de navegação e fazer logout de todas as sessões a qualquer momento. As tarefas são executadas de acordo com a Política de Segurança da OpenAI. - Qual é a complexidade de uma tarefa que um agente pode realizar?
O agente lida com tarefas de várias etapas, como coleta de dados, análise e geração de documentos. Ele seleciona dinamicamente as ferramentas para atender às necessidades de consultas simples e estudos aprofundados. - Como funciona o modo de voz?
Ative a entrada de voz no aplicativo móvel ChatGPT e descreva a tarefa. O agente executa ações com base em comandos de voz, adequados para cenários móveis. - Quais são as limitações da geração de slides?
Atualmente na versão beta, a formatação pode ser simples, mas há suporte para elementos editáveis. O refinamento e a funcionalidade da saída serão otimizados no futuro.