Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito

O NotebookLlama é uma ferramenta de código-fonte totalmente aberto, baseada na tecnologia LlamaCloud, projetada para ajudar os usuários a gerenciar documentos e gerar conteúdo de áudio semelhante a um podcast. É uma alternativa ao Google NotebookLM para pesquisadores, estudantes e usuários corporativos. Os usuários podem fazer upload de documentos, criar bases de conhecimento e extrair informações importantes por meio de análises inteligentes. O NotebookLlama também suporta a conversão de conteúdo de documentos em áudio com som natural, facilitando o acesso dos usuários às informações em cenários móveis. O projeto está hospedado no GitHub, com código transparente, forte apoio da comunidade e um processo de instalação claro, tornando-o adequado para entusiastas e profissionais de tecnologia.

NotebookLlama: ferramenta de geração de áudio e gerenciamento de conhecimento de documentos de código aberto-1

 

Lista de funções

  • Upload e gerenciamento de documentosSuporte para upload de documentos em vários formatos (por exemplo, PDF) para criar uma base de conhecimento individual ou de equipe.
  • Extração e resumo de conhecimentoAnálise automática de documentos, extração do conteúdo principal e geração de resumos por meio da tecnologia LlamaCloud.
  • Geração de áudioConverta o conteúdo do documento em áudio semelhante a um podcast com suporte para saída de fala natural.
  • Código aberto e personalizávelCódigo-fonte: O código é totalmente aberto, os usuários podem modificar ou expandir a função de acordo com a demanda.
  • Suporte a várias plataformasExecuta via Docker e Streamlit e suporta implementações locais ou na nuvem.
  • Pesquisa inteligentePesquisa inteligente: fornece pesquisa inteligente com base no conteúdo do documento para localizar informações rapidamente.

 

Usando a Ajuda

Processo de instalação

Para usar o NotebookLlama, os usuários precisam primeiro concluir a instalação e a configuração. Abaixo estão as etapas detalhadas da instalação:

  1. Clonagem da base de código
    Execute o seguinte comando no terminal para clonar o projeto NotebookLlama localmente:

    git clone https://github.com/run-llama/notebookllama
    

    Vá para o catálogo de projetos:

    cd notebookllama/
    
  2. Instalação de dependências
    fazer uso de uv instala os pacotes de dependência necessários:

    uv sync
    

    Certifique-se de que você tenha o Python e o uv. Se você não o tiver, instale o Python 3.8 ou superior primeiro e passe o comando pip install uv montagem uv.

  3. Configuração de chaves de API
    O projeto requer três chaves de API: OpenAI, ElevenLabs e LlamaCloud. As etapas são as seguintes:

    • Abra o diretório do projeto no .env.example Documentação.
    • Obter a chave da API:
      • OPENAI_API_KEYFaça login na plataforma OpenAI e acesse Account Settings (Configurações da conta) para gerar uma chave.
      • ELEVENLABS_API_KEYObtenha-o na página Configurações do site da ElevenLabs.
      • LLAMACLOUD_API_KEYVisite o painel do LlamaCloud para obter a chave.
    • Preencha a chave no campo .env.example e, em seguida, renomeie o arquivo:
      mv .env.example .env
      
  4. Executar o script de inicialização
    Execute os seguintes comandos para criar o agente de indexação e extração do LlamaCloud:

    uv run tools/create_llama_extract_agent.py
    uv run tools/create_llama_cloud_index.py
    
  5. Início dos serviços
    Inicie os serviços Postgres e Jaeger com o Docker:

    docker compose up -d
    

    Inicie o servidor MCP:

    uv run src/notebookllama/server.py
    
  6. Execução do aplicativo Streamlit
    Inicia a interface de front-end do Streamlit:

    streamlit run src/notebookllama/Home.py
    

    montagem ffmpeg(se ainda não estiver instalado) para dar suporte à funcionalidade de áudio:

    • No Ubuntu:sudo apt-get install ffmpeg
    • no macOS:brew install ffmpeg
  7. Acesso a aplicativos
    Abra seu navegador e acesse http://localhost:8751/Você pode começar a usar o NotebookLlama agora.

Funções principais

Carregamento de documentos e criação de base de conhecimento

  • procedimento::
    1. Faça login na interface do Streamlit e clique no botão "Upload Document" (Carregar documento).
    2. Selecione PDF ou outro formato de documento compatível para fazer upload para o sistema.
    3. O sistema analisa automaticamente o conteúdo do documento e o incorpora à base de conhecimento.
  • Recursos funcionais::
    • Oferece suporte ao upload em lote, adequado para o processamento de grandes quantidades de material de pesquisa.
    • O conteúdo do documento é indexado automaticamente para pesquisa e análise subsequentes.

Extração e resumo de conhecimento

  • procedimento::
    1. Selecione o documento carregado na interface.
    2. Clique no botão "Extract Information" (Extrair informações) ou "Generate Summary" (Gerar resumo).
    3. O sistema analisa o documento e gera pontos-chave, resumos ou conteúdo de perguntas e respostas.
  • Recursos funcionais::
    • Análise inteligente baseada no LlamaCloud para extração precisa e concisa.
    • Oferece suporte ao escopo de extração definido pelo usuário, por exemplo, extraindo apenas um determinado capítulo.

Geração de áudio

  • procedimento::
    1. Selecione o documento ou o conteúdo do resumo para o qual você precisa gerar áudio.
    2. Clique no botão "Generate Podcast" (Gerar podcast) e o sistema chamará a API da ElevenLabs para converter texto em fala.
    3. Faça o download do arquivo de áudio gerado ou reproduza-o diretamente on-line.
  • Recursos funcionais::
    • O áudio é natural e suave, próximo ao efeito de um podcast humano.
    • Oferece suporte à saída de fala em vários idiomas, adequada às necessidades de internacionalização.

Pesquisa inteligente

  • procedimento::
    1. Digite uma palavra-chave ou pergunta na interface.
    2. O sistema retorna fragmentos de documentos ou respostas relevantes.
  • Recursos funcionais::
    • Os resultados da pesquisa são baseados no conteúdo do documento e são altamente precisos.
    • Suporte a consultas complexas, como "resumir o tópico de um documento".

advertência

  • Certifique-se de que a rede esteja estável e que as chamadas de API exijam uma conexão com a Internet.
  • Se a geração de áudio falhar, verifique o ffmpeg Ele está instalado corretamente.
  • Atualize regularmente a base de código para obter os recursos mais recentes:git pull origin main.

cenário do aplicativo

  1. pesquisa acadêmica
    Os pesquisadores podem fazer upload de artigos acadêmicos para extrair rapidamente as principais informações ou gerar resumos. O recurso de áudio é adequado para ouvir o conteúdo do artigo durante o trajeto para melhorar a eficiência.
  2. Análise de negócios
    Os usuários corporativos fazem upload de relatórios de mercado ou documentos internos para criar uma base de conhecimento. As funções inteligentes de pesquisa e resumo ajudam a localizar rapidamente os principais dados para auxiliar na tomada de decisões.
  3. Aprendizagem educacional
    Os alunos carregam livros didáticos ou apostilas para gerar resumos ou áudio para facilitar a revisão. O recurso de áudio é especialmente adequado para alunos auditivos.
  4. criação de conteúdo
    Os criadores de podcast podem converter artigos ou anotações em áudio para gerar rapidamente conteúdo de podcast e economizar tempo de gravação.

 

QA

  1. Quais formatos de documentos são compatíveis com o NotebookLlama?
    Atualmente, é compatível com PDF, TXT e outros formatos comuns; no futuro, poderá expandir mais formatos.
  2. Preciso pagar para usar a API?
    Sim, as APIs para OpenAI, ElevenLabs e LlamaCloud exigem suas respectivas contas pagas. Os usuários precisarão se registrar e obter a chave por conta própria.
  3. A implementação local exige hardware de alto desempenho?
    Um computador doméstico típico (8 GB de RAM, CPU de 4 núcleos) poderá executá-lo, e uma implantação do Docker exigirá cerca de 10 GB de espaço em disco.
  4. Qual é a qualidade do áudio para gerar a fala?
    A voz, fornecida pela ElevenLabs, está próxima do nível de um locutor humano e é compatível com vários idiomas e tons.
0Marcado
0Recomendado

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

caixa de entrada

Entre em contato conosco

voltar ao topo

pt_BRPortuguês do Brasil