O NotebookLlama é uma ferramenta de código-fonte totalmente aberto, baseada na tecnologia LlamaCloud, projetada para ajudar os usuários a gerenciar documentos e gerar conteúdo de áudio semelhante a um podcast. É uma alternativa ao Google NotebookLM para pesquisadores, estudantes e usuários corporativos. Os usuários podem fazer upload de documentos, criar bases de conhecimento e extrair informações importantes por meio de análises inteligentes. O NotebookLlama também suporta a conversão de conteúdo de documentos em áudio com som natural, facilitando o acesso dos usuários às informações em cenários móveis. O projeto está hospedado no GitHub, com código transparente, forte apoio da comunidade e um processo de instalação claro, tornando-o adequado para entusiastas e profissionais de tecnologia.
Lista de funções
- Upload e gerenciamento de documentosSuporte para upload de documentos em vários formatos (por exemplo, PDF) para criar uma base de conhecimento individual ou de equipe.
- Extração e resumo de conhecimentoAnálise automática de documentos, extração do conteúdo principal e geração de resumos por meio da tecnologia LlamaCloud.
- Geração de áudioConverta o conteúdo do documento em áudio semelhante a um podcast com suporte para saída de fala natural.
- Código aberto e personalizávelCódigo-fonte: O código é totalmente aberto, os usuários podem modificar ou expandir a função de acordo com a demanda.
- Suporte a várias plataformasExecuta via Docker e Streamlit e suporta implementações locais ou na nuvem.
- Pesquisa inteligentePesquisa inteligente: fornece pesquisa inteligente com base no conteúdo do documento para localizar informações rapidamente.
Usando a Ajuda
Processo de instalação
Para usar o NotebookLlama, os usuários precisam primeiro concluir a instalação e a configuração. Abaixo estão as etapas detalhadas da instalação:
- Clonagem da base de código
Execute o seguinte comando no terminal para clonar o projeto NotebookLlama localmente:git clone https://github.com/run-llama/notebookllama
Vá para o catálogo de projetos:
cd notebookllama/
- Instalação de dependências
fazer uso deuv
instala os pacotes de dependência necessários:uv sync
Certifique-se de que você tenha o Python e o
uv
. Se você não o tiver, instale o Python 3.8 ou superior primeiro e passe o comandopip install uv
montagemuv
. - Configuração de chaves de API
O projeto requer três chaves de API: OpenAI, ElevenLabs e LlamaCloud. As etapas são as seguintes:- Abra o diretório do projeto no
.env.example
Documentação. - Obter a chave da API:
OPENAI_API_KEY
Faça login na plataforma OpenAI e acesse Account Settings (Configurações da conta) para gerar uma chave.ELEVENLABS_API_KEY
Obtenha-o na página Configurações do site da ElevenLabs.LLAMACLOUD_API_KEY
Visite o painel do LlamaCloud para obter a chave.
- Preencha a chave no campo
.env.example
e, em seguida, renomeie o arquivo:mv .env.example .env
- Abra o diretório do projeto no
- Executar o script de inicialização
Execute os seguintes comandos para criar o agente de indexação e extração do LlamaCloud:uv run tools/create_llama_extract_agent.py uv run tools/create_llama_cloud_index.py
- Início dos serviços
Inicie os serviços Postgres e Jaeger com o Docker:docker compose up -d
Inicie o servidor MCP:
uv run src/notebookllama/server.py
- Execução do aplicativo Streamlit
Inicia a interface de front-end do Streamlit:streamlit run src/notebookllama/Home.py
montagem
ffmpeg
(se ainda não estiver instalado) para dar suporte à funcionalidade de áudio:- No Ubuntu:
sudo apt-get install ffmpeg
- no macOS:
brew install ffmpeg
- No Ubuntu:
- Acesso a aplicativos
Abra seu navegador e acessehttp://localhost:8751/
Você pode começar a usar o NotebookLlama agora.
Funções principais
Carregamento de documentos e criação de base de conhecimento
- procedimento::
- Faça login na interface do Streamlit e clique no botão "Upload Document" (Carregar documento).
- Selecione PDF ou outro formato de documento compatível para fazer upload para o sistema.
- O sistema analisa automaticamente o conteúdo do documento e o incorpora à base de conhecimento.
- Recursos funcionais::
- Oferece suporte ao upload em lote, adequado para o processamento de grandes quantidades de material de pesquisa.
- O conteúdo do documento é indexado automaticamente para pesquisa e análise subsequentes.
Extração e resumo de conhecimento
- procedimento::
- Selecione o documento carregado na interface.
- Clique no botão "Extract Information" (Extrair informações) ou "Generate Summary" (Gerar resumo).
- O sistema analisa o documento e gera pontos-chave, resumos ou conteúdo de perguntas e respostas.
- Recursos funcionais::
- Análise inteligente baseada no LlamaCloud para extração precisa e concisa.
- Oferece suporte ao escopo de extração definido pelo usuário, por exemplo, extraindo apenas um determinado capítulo.
Geração de áudio
- procedimento::
- Selecione o documento ou o conteúdo do resumo para o qual você precisa gerar áudio.
- Clique no botão "Generate Podcast" (Gerar podcast) e o sistema chamará a API da ElevenLabs para converter texto em fala.
- Faça o download do arquivo de áudio gerado ou reproduza-o diretamente on-line.
- Recursos funcionais::
- O áudio é natural e suave, próximo ao efeito de um podcast humano.
- Oferece suporte à saída de fala em vários idiomas, adequada às necessidades de internacionalização.
Pesquisa inteligente
- procedimento::
- Digite uma palavra-chave ou pergunta na interface.
- O sistema retorna fragmentos de documentos ou respostas relevantes.
- Recursos funcionais::
- Os resultados da pesquisa são baseados no conteúdo do documento e são altamente precisos.
- Suporte a consultas complexas, como "resumir o tópico de um documento".
advertência
- Certifique-se de que a rede esteja estável e que as chamadas de API exijam uma conexão com a Internet.
- Se a geração de áudio falhar, verifique o
ffmpeg
Ele está instalado corretamente. - Atualize regularmente a base de código para obter os recursos mais recentes:
git pull origin main
.
cenário do aplicativo
- pesquisa acadêmica
Os pesquisadores podem fazer upload de artigos acadêmicos para extrair rapidamente as principais informações ou gerar resumos. O recurso de áudio é adequado para ouvir o conteúdo do artigo durante o trajeto para melhorar a eficiência. - Análise de negócios
Os usuários corporativos fazem upload de relatórios de mercado ou documentos internos para criar uma base de conhecimento. As funções inteligentes de pesquisa e resumo ajudam a localizar rapidamente os principais dados para auxiliar na tomada de decisões. - Aprendizagem educacional
Os alunos carregam livros didáticos ou apostilas para gerar resumos ou áudio para facilitar a revisão. O recurso de áudio é especialmente adequado para alunos auditivos. - criação de conteúdo
Os criadores de podcast podem converter artigos ou anotações em áudio para gerar rapidamente conteúdo de podcast e economizar tempo de gravação.
QA
- Quais formatos de documentos são compatíveis com o NotebookLlama?
Atualmente, é compatível com PDF, TXT e outros formatos comuns; no futuro, poderá expandir mais formatos. - Preciso pagar para usar a API?
Sim, as APIs para OpenAI, ElevenLabs e LlamaCloud exigem suas respectivas contas pagas. Os usuários precisarão se registrar e obter a chave por conta própria. - A implementação local exige hardware de alto desempenho?
Um computador doméstico típico (8 GB de RAM, CPU de 4 núcleos) poderá executá-lo, e uma implantação do Docker exigirá cerca de 10 GB de espaço em disco. - Qual é a qualidade do áudio para gerar a fala?
A voz, fornecida pela ElevenLabs, está próxima do nível de um locutor humano e é compatível com vários idiomas e tons.