O Zotero-arXiv-Daily é uma ferramenta de código aberto criada para ajudar os pesquisadores a obter automaticamente artigos arXiv recomendados relacionados à base de literatura do Zotero por meio do GitHub Actions. Os usuários simplesmente bifurcam o projeto no GitHub, configuram a chave da API do Zotero e o serviço de e-mail e recebem uma lista diária de novos artigos que correspondem aos seus interesses de pesquisa. A ferramenta gera resumos de artigos (TL;DR) usando IA, analisando a literatura no repositório do Zotero e envia os resultados das recomendações, classificados por relevância, para o endereço de e-mail do usuário. O projeto é executado gratuitamente dentro da cota de repositório público do GitHub Actions e não requer instalação de software adicional, o que o torna adequado para pesquisadores que precisam acompanhar a fronteira acadêmica.
Lista de funções
- Obtenha automaticamente novos artigos do arXiv e recomende artigos relevantes com base no conteúdo da biblioteca Zotero do usuário.
- A IA foi usada para gerar um breve resumo (TL;DR) de cada artigo para facilitar a triagem rápida.
- Oferece suporte a categorias personalizadas de artigos do arXiv, como IA, visão computacional, processamento de linguagem natural, etc.
- Envia artigos recomendados para as caixas de entrada de e-mail dos usuários por meio de uma execução automática diária do GitHub Actions.
- Suporte para obter documentos da área médica do medRxiv (é necessário configurar as variáveis de ambiente relevantes).
- Um modo de depuração (Test-Workflow) é fornecido para recuperar um número fixo de documentos a qualquer momento.
- Os resultados recomendados são classificados por relevância, levando em conta quando os artigos foram adicionados à biblioteca do Zotero.
- Suporte para filtragem de coleções de literatura indesejadas do Zotero para evitar recomendações irrelevantes.
Usando a Ajuda
Instalação e configuração
O Zotero-arXiv-Daily é executado por meio do GitHub Actions e não requer instalação de software local. Aqui está o processo de configuração detalhado:
- Armazém de garfos
entrevistashttps://github.com/TideDr/zotero-arxiv-daily
Para copiar o repositório para sua conta do GitHub, clique no botão "Fork" no canto superior direito.<你的用户名>/zotero-arxiv-daily
Existem formulários. - Obter a chave da API do Zotero
- Faça login no site do Zotero (
https://www.zotero.org
), vá para a página "Settings" (Configurações). - Na seção "API Key", gere uma nova chave de API para garantir o acesso de leitura.
- Copie a chave gerada e salve-a para uso posterior.
- Faça login no site do Zotero (
- Configuração das variáveis de ambiente do GitHub Actions
- Vá para o seu repositório Fork e clique em "Configurações" > "Segredos e variáveis" > "Ações" > "Novo segredo do repositório".
- Adicione as seguintes variáveis de ambiente:
ZOTERO_USER_ID
Seu ID de usuário do Zotero, que pode ser encontrado em Configurações do Zotero.ZOTERO_API_KEY
A chave da API do Zotero gerada na etapa anterior.ARXIV_QUERY
Categoria do artigo arXiv de destino, concatenada com "+", por exemplo.cs.AI+cs.CV+cs.NLP
(Consulte o site do arXiv para obter as abreviações das categorias).SMTP_SERVER
Endereço do servidor SMTP da caixa de correio (por exemplo, Gmail)smtp.gmail.com
).SMTP_PORT
Número da porta SMTP (por exemplo, para o Gmail)587
talvez465
).SENDER_EMAIL
Endereço de e-mail para o qual enviar o e-mail: O endereço de e-mail para o qual enviar o e-mail.SENDER_PASSWORD
Senha de autenticação para o serviço SMTP da caixa de correio (Observação: o Gmail precisa usar a "senha específica do aplicativo").RECEIVER_EMAIL
Endereço de e-mail para receber os resultados da recomendação.MAX_PAPER_NUM
Número máximo de documentos a serem recomendados por vez (é recomendável defini-lo como 5-10, pois a geração de TL;DR consome muito tempo).- Opcional:
MEDRXIV_DAYS
responder cantandoMEDRXIV_SUBJECTS
usado para ativar as recomendações de artigos do medRxiv.
- Salve todas as variáveis.
- Habilitação de GitHub Actions
- Vá para a guia "Actions" (Ações) do repositório Fork e ative os fluxos de trabalho.
- Por padrão, o ramo mestre (
main
) fluxo de trabalhoSend-emails-daily
Ele é executado automaticamente todos os dias, recuperando novos documentos publicados no dia anterior. - Pode ser acionado manualmente
Test-Workflow
Depuração para obter recomendações para 5 documentos fixos.
- Verifique os registros
- Consulte a guia Ações para ver o registro de execução do fluxo de trabalho. Se não houver novos documentos para um fim de semana ou feriado, o registro poderá mostrar "Nenhum novo documento encontrado".
Funções principais
- Recomendações do Daily Paper
A ferramenta busca novos artigos diariamente no feed Atom do arXiv, com base em resumos da biblioteca Zotero, usando o modelo SentenceTransformer (padrão)avsolatorio/GIST-small-Embedding-v0
) calcula a relevância. Os resultados da recomendação são classificados por pontuação e contêm o título do artigo, o autor, o resumo, o TL;DR gerado pela IA e o link de download para o endereço de e-mail configurado. O conteúdo do e-mail é organizado em formato HTML para exibir claramente as informações sobre cada artigo. - IA gera TL;DR
A TL;DR de cada artigo é gerada por um modelo de linguagem amplo e leva cerca de 70 segundos por artigo. Os usuários podem acessar a TL;DR por meio da páginaMAX_PAPER_NUM
Controle o número de recomendações para evitar tempos limite de execução.TL;DR Resuma sucintamente o conteúdo principal do documento para ajudar os usuários a determinar rapidamente se precisam ler em profundidade. - Suporte ao medRxiv
Ao definir oMEDRXIV_DAYS
(por exemplo7
(indicando os últimos 7 dias) eMEDRXIV_SUBJECTS
(por exemploClinical Research
), a ferramenta pode obter artigos médicos do medRxiv. Os resultados da recomendação são agrupados por fonte (arXiv e medRxiv) no e-mail para facilitar a leitura. - modo de depuração
Test-Workflow
Permite que o usuário execute o fluxo de trabalho a qualquer momento para recuperar 5 documentos fixos para testar se a configuração está correta. Os resultados da execução também são enviados para o endereço de e-mail e os registros podem ser visualizados no GitHub Actions.
advertência
- Certifique-se de que haja um número suficiente de artigos na biblioteca do Zotero (especialmente os que contêm resumos) para aumentar a precisão das recomendações.
- A configuração do SMTP precisa ser precisa, e é recomendável usar uma conta de e-mail que não seja usada com frequência para evitar problemas de segurança.
- Verifique regularmente o repositório Fork e faça o merge das atualizações upstream (
TideDra/zotero-arxiv-daily
) para novos recursos e correções. - O repositório público do GitHub Actions tem um limite de tempo de execução, e é recomendável que você defina um pequeno
MAX_PAPER_NUM
(por exemplo, 5) para garantir que o mandato seja cumprido.
cenário do aplicativo
- Pesquisadores acadêmicos acompanham os desenvolvimentos no campo
Os pesquisadores podem usar a ferramenta para receber recomendações diárias de novos artigos relacionados à sua direção de pesquisa (por exemplo, IA, Física), economizando o tempo de navegação manual no arXiv e compreendendo rapidamente o progresso das pesquisas mais recentes. - Os alunos preparam uma revisão da literatura
Os estudantes de pós-graduação podem usar a ferramenta para coletar os artigos mais recentes em campos relacionados, combinados com TL;DR gerados por IA para selecionar rapidamente a literatura valiosa para ajudar na redação da tese e na preparação da revisão. - Leitura ampliada para pesquisadores interdisciplinares
Pesquisadores interdisciplinares podem configurar várias categorias do arXiv (por exemplocs.AI+physics.astro-ph
), obtendo artigos recomendados em diferentes áreas e ampliando os horizontes de pesquisa. - Pesquisadores médicos seguem o medRxiv
Os pesquisadores da área de medicina podem usar o suporte do medRxiv para acessar pesquisas clínicas ou documentos relacionados à saúde pública e ficar a par dos desenvolvimentos médicos de ponta.
QA
- Como posso garantir que os artigos recomendados sejam relevantes para meus interesses de pesquisa?
A ferramenta calcula a relevância de novos artigos analisando os resumos de artigos na biblioteca do Zotero em conjunto com o modelo SentenceTransformer. Ela garante que a biblioteca do Zotero contenha artigos relevantes para a direção da pesquisa e elimina periodicamente a literatura irrelevante para melhorar a precisão da recomendação. - Por que não recebi um e-mail no fim de semana?
O arXiv geralmente não publica novos artigos nos fins de semana e feriados, e o registro pode mostrar "Nenhum artigo novo encontrado". Esse é um fenômeno normal, e as recomendações serão retomadas nos dias úteis. - Como faço para adicionar suporte ao medRxiv?
Defina a variável de ambiente GitHub Actions no arquivoMEDRXIV_DAYS
(por exemplo7
eMEDRXIV_SUBJECTS
(por exemploEpidemiology
) para ativar as recomendações de artigos do medRxiv. O e-mail exibirá os artigos do arXiv e do medRxiv separadamente. - E se o tempo de execução for muito longo?
A geração de TL;DR consome muito tempo e é recomendável que oMAX_PAPER_NUM
Defina-o como 5-10. Se o tempo limite persistir, tente diminuir o número de papéis ou usar o botãodev
Uma versão otimizada da ramificação. - Como faço para atualizar meu repositório para obter novos recursos?
Visitas regulareshttps://github.com/TideDr/zotero-arxiv-daily
verifique se há atualizações. Se houver novos recursos, faça o merge do repositório upstream em seu repositório Fork, conforme descrito na documentação do GitHub.