A experiência de se comunicar com um amigo que sempre esquece o conteúdo da conversa e precisa começar do início todas as vezes é, sem dúvida, ineficiente e exaustiva. Entretanto, essa é exatamente a norma para a maioria dos sistemas de IA atuais. Eles são poderosos, mas geralmente não têm um ingrediente fundamental: a memória. Para criar sistemas que possam realmente aprender, evoluir e colaborar...
De chamadas de API para modelos de linguagem grandes (LLMs) a fluxos de trabalho agênticos autônomos e orientados por metas, há uma mudança fundamental no paradigma dos aplicativos de IA. A comunidade de código-fonte aberto desempenhou um papel fundamental nessa onda, gerando uma infinidade de IA focada em tarefas de pesquisa específicas ...
Saiba tudo sobre o aprendizado por reforço (RL) e como treinar seu próprio modelo de inferência do DeepSeek-R1 usando Unsloth e GRPO. Um guia completo do iniciante ao mestre. O que você aprenderá O que é RL? RLVR? PPO? GRPO? RLHF? RFT?...
Com o rápido desenvolvimento e a ampla aplicação de tecnologias de modelagem de linguagem em larga escala, seus possíveis riscos de segurança estão se tornando cada vez mais o foco da atenção do setor. Para enfrentar esses desafios, muitas das principais empresas de tecnologia, organizações de padronização e institutos de pesquisa do mundo criaram e lançaram suas próprias estruturas de segurança. Neste documento, analisaremos nove delas...
No campo de pesquisa de Modelagem de Linguagem Ampla (LLM), a capacidade de Leap-of-Thought do modelo, ou seja, a criatividade, não é menos importante do que a capacidade de raciocínio lógico representada pela Chain-of-Thought. No entanto, ainda há uma relativa falta de discussões aprofundadas e métodos de avaliação válidos para a criatividade do LLM, o que, em ...
Mastering Claude Code: Hands-on Agentic Coding Tips from the Front Lines O Claude Code é uma ferramenta de linha de comando para Agentic Coding. Por Codificação Agêntica, queremos dizer dar à IA um certo grau de autonomia, a capacidade de entender tarefas, planejar etapas e executar ações (como...
A família de modelos GPT-4.1 oferece melhorias significativas em codificação, aderência de instruções e recursos de processamento de contexto longo em relação ao GPT-4o. Especificamente, apresenta melhor desempenho em tarefas de geração e reparo de código, compreende e executa instruções complexas com mais precisão e pode lidar eficientemente com textos de entrada mais longos. Esse trabalho sugerido ...
1. INTRODUÇÃO Na atual explosão de informações, uma grande quantidade de conhecimento é armazenada na forma de tabelas em páginas da Web, na Wikipédia e em bancos de dados relacionais. No entanto, os sistemas tradicionais de perguntas e respostas geralmente têm dificuldades para lidar com consultas complexas em várias tabelas, o que se tornou um grande desafio no campo da inteligência artificial. Para enfrentar esse desafio, os pesquisadores ...
Como os recursos dos modelos de linguagem ampla (LLMs) estão evoluindo rapidamente, os testes de benchmark tradicionais, como o MMLU, estão gradualmente mostrando suas limitações para distinguir os melhores modelos. Com base apenas em questionários de conhecimento ou testes padronizados, tornou-se difícil medir de forma abrangente os recursos diferenciados dos modelos que são cruciais nas interações do mundo real, como inteligência emocional, criatividade e...
O desenvolvimento de modelos de linguagem grande (LLMs) está mudando rapidamente, e sua capacidade de raciocínio se tornou um indicador importante do nível de inteligência. Em particular, os modelos com recursos de raciocínio longos, como o o1 da OpenAI, DeepSeek-R1, QwQ-32B e Kimi K1.5, que simulam o processo de raciocínio profundo humano ao resolver problemas compostos...
INTRODUÇÃO Nos últimos anos, os Modelos de Linguagem Grande (LLMs) fizeram um progresso impressionante no campo da Inteligência Artificial (IA), e seus poderosos recursos de compreensão e geração de linguagem levaram a uma ampla gama de aplicações em vários domínios. No entanto, os LLMs ainda enfrentam muitos desafios ao lidar com tarefas complexas que exigem a invocação de ferramentas externas. Por exemplo, ...
O ecossistema Python sempre teve uma escassez de ferramentas de gerenciamento de pacotes e de ambiente, desde o clássico pip e virtualenv, passando pelo pip-tools e conda, até o moderno Poetry e PDM. Cada ferramenta tem sua própria área de especialização, mas elas geralmente tornam a cadeia de ferramentas de um desenvolvedor fragmentada e complexa. Agora, ...
INTRODUÇÃO Nos últimos anos, os sistemas multiinteligentes (MAS) têm atraído muita atenção no campo da inteligência artificial. Esses sistemas tentam resolver tarefas complexas e de várias etapas por meio da colaboração de várias inteligências de Modelo de Linguagem Grande (LLM). No entanto, apesar das grandes expectativas em relação aos MAS, seu desempenho em aplicações do mundo real não foi ...
Os modelos de linguagem grande (LLMs), como o Claude, não são criados por humanos que escrevem código de programação direto, mas são treinados com base em grandes quantidades de dados. No processo, os modelos aprendem suas próprias estratégias para resolver problemas. Essas estratégias estão ocultas nos bilhões de cálculos que o modelo realiza para gerar cada palavra para...
Recentemente, a Anthropic lançou uma nova ferramenta chamada "think", projetada para aprimorar os recursos do modelo Claude para a solução de problemas complexos. Neste artigo, examinaremos mais de perto a filosofia de design, o desempenho e a aplicação prática da ferramenta "think"...
Resumo Os sistemas de recuperação de informações são essenciais para o acesso eficiente a grandes coleções de documentos. Abordagens recentes usam modelos de linguagem ampla (LLMs) para melhorar o desempenho da recuperação por meio do aumento da consulta, mas geralmente dependem de técnicas caras de aprendizado supervisionado ou destilação que exigem recursos computacionais significativos e dados rotulados manualmente. Em ...
Os modelos de raciocínio de grande porte (LLMs) exploram vulnerabilidades quando têm a oportunidade. Pesquisas demonstraram que essas explorações podem ser detectadas com o uso de modelos de linguagem ampla (LLMs) para monitorar suas cadeias de pensamento (CoT). Punir os modelos por "pensamentos ruins" não impede a maior parte do comportamento inadequado, mas faz com que eles escondam suas intenções. ...
Histórico Um artigo recente intitulado Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning (arxiv.org/pdf...
O projeto GraphRAG tem como objetivo ampliar a gama de perguntas que os sistemas de IA podem responder em conjuntos de dados privados, explorando relações implícitas em textos não estruturados. Uma das principais vantagens do GraphRAG em relação ao RAG vetorial tradicional (ou "pesquisa semântica") é sua capacidade de responder a consultas globais em conjuntos de dados inteiros, como...