Princípios tecnológicos fundamentais da Optexity
O Optexity é um projeto de código aberto desenvolvido pela equipe do Optexity, cuja tecnologia principal está no uso de dados de demonstração operados por humanos para treinar modelos de IA. O projeto consegue isso por meio de três componentes principais: o ComputerGYM opera o ambiente de gravação, o AgentAI lida com a lógica de treinamento do modelo e o Playwright oferece suporte à automação da Web. A inovação dessa abordagem está na transformação das ações humanas em dados de treinamento estruturados, permitindo que a IA aprenda interações específicas da Web, como clicar em botões e preencher formulários.
O projeto já implementou um processo de treinamento completo: os usuários podem gravar demonstrações de operações, e o sistema converterá as trajetórias de operações em um formato de dados de treinamento, que será usado para ajustar o modelo por meio de ferramentas como o LLaMA-Factory. O projeto suporta uma variedade de arquiteturas de modelos convencionais, incluindo Gemini e vLLM, e é totalmente de código aberto, permitindo que os desenvolvedores ampliem e personalizem livremente a funcionalidade.
Essa resposta foi extraída do artigoOptexity: um projeto de código aberto para treinar a IA para realizar ações na Web com demonstrações humanasO































