Zotero-arXiv-Daily ist ein Open-Source-Tool, das Forschern helfen soll, über GitHub-Aktionen automatisch empfohlene arXiv-Papiere zu erhalten, die mit der Zotero-Literaturdatenbank in Zusammenhang stehen. Benutzer müssen lediglich das Projekt auf GitHub forken, den Zotero-API-Schlüssel und den E-Mail-Dienst konfigurieren und erhalten dann täglich eine Liste neuer Veröffentlichungen, die ihren Forschungsinteressen entsprechen. Das Tool generiert mithilfe von KI Zusammenfassungen von Artikeln (TL;DR), indem es die Literatur im Zotero-Repository analysiert, und sendet die Ergebnisse der Empfehlungen, sortiert nach Relevanz, an die E-Mail-Adresse des Benutzers. Das Projekt läuft kostenlos im Rahmen des öffentlichen Repository-Kontingents von GitHub Actions und erfordert keine zusätzliche Software-Installation, so dass es für Forscher geeignet ist, die den Überblick über die akademischen Grenzen behalten müssen.
Funktionsliste
- Holen Sie sich automatisch neue Artikel von arXiv und empfehlen Sie relevante Artikel basierend auf dem Inhalt der Zotero-Bibliothek des Benutzers.
- Mithilfe von AI wurde eine kurze Zusammenfassung (TL;DR) jedes Papiers erstellt, um ein schnelles Screening zu ermöglichen.
- Unterstützt benutzerdefinierte arXiv-Papierkategorien wie AI, Computer Vision, Natural Language Processing usw.
- Versendet empfohlene Papiere an die E-Mail-Postfächer der Benutzer durch einen täglichen automatischen Lauf von GitHub Actions.
- Unterstützung für den Abruf medizinischer Fachartikel von medRxiv (entsprechende Umgebungsvariablen müssen konfiguriert werden).
- Es gibt einen Debugging-Modus (Test-Workflow), in dem jederzeit eine bestimmte Anzahl von Papieren abgerufen werden kann.
- Die empfohlenen Ergebnisse sind nach Relevanz sortiert, wobei berücksichtigt wird, wann die Dokumente in die Zotero-Bibliothek aufgenommen wurden.
- Unterstützung für die Filterung unerwünschter Zotero-Literatursammlungen, um irrelevante Empfehlungen zu vermeiden.
Hilfe verwenden
Installation und Konfiguration
Zotero-arXiv-Daily läuft über GitHub Actions und erfordert keine lokale Softwareinstallation. Hier ist der detaillierte Konfigurationsprozess:
- Lagerhaus für Gabeln
Interviewshttps://github.com/TideDr/zotero-arxiv-daily
Um das Repository in Ihr GitHub-Konto zu kopieren, klicken Sie auf die Schaltfläche "Fork" in der oberen rechten Ecke.<你的用户名>/zotero-arxiv-daily
Es gibt Formulare. - Zotero API-Schlüssel abrufen
- Melden Sie sich auf der Zotero-Website an (
https://www.zotero.org
), gehen Sie auf die Seite "Einstellungen". - Erzeugen Sie im Abschnitt "API-Schlüssel" einen neuen API-Schlüssel, um den Lesezugriff zu gewährleisten.
- Kopieren Sie den generierten Schlüssel und speichern Sie ihn zur späteren Verwendung.
- Melden Sie sich auf der Zotero-Website an (
- Konfigurieren der Umgebungsvariablen für GitHub-Aktionen
- Gehen Sie zu Ihrem Fork-Repository und klicken Sie auf "Einstellungen" > "Geheimnisse und Variablen" > "Aktionen" > "Neues Repository-Geheimnis".
- Fügen Sie die folgenden Umgebungsvariablen hinzu:
ZOTERO_USER_ID
Ihre Zotero-Benutzer-ID, die Sie in den Zotero-Einstellungen finden.ZOTERO_API_KEY
Zotero-API-Schlüssel: Der Zotero-API-Schlüssel, der im vorherigen Schritt erzeugt wurde.ARXIV_QUERY
: Zielkategorie des arXiv-Papiers, verkettet mit "+", z. B.cs.AI+cs.CV+cs.NLP
(Für die Abkürzungen der Kategorien siehe die arXiv-Website).SMTP_SERVER
Adresse des SMTP-Servers der Mailbox (z. B. Gmail)smtp.gmail.com
).SMTP_PORT
SMTP-Portnummer (z. B. für Gmail)587
vielleicht465
).SENDER_EMAIL
: Die E-Mail-Adresse, an die die E-Mail gesendet werden soll.SENDER_PASSWORD
Authentifizierungspasswort für den SMTP-Dienst der Mailbox (Hinweis: Gmail muss ein "anwendungsspezifisches Passwort" verwenden).RECEIVER_EMAIL
E-Mail-Adresse, um die Ergebnisse der Empfehlung zu erhalten.MAX_PAPER_NUM
Maximale Anzahl von Papieren, die auf einmal empfohlen werden können (es wird empfohlen, 5-10 zu wählen, da die Erstellung von TL;DR zeitaufwendig ist).- Optional:
MEDRXIV_DAYS
im Gesang antwortenMEDRXIV_SUBJECTS
um medRxiv-Paper-Empfehlungen zu ermöglichen.
- Speichern Sie alle Variablen.
- Aktivieren von GitHub-Aktionen
- Gehen Sie auf die Registerkarte "Aktionen" des Fork-Repository und aktivieren Sie Workflows.
- Standardmäßig wird der Master-Zweig (
main
) ArbeitsablaufSend-emails-daily
Es wird jeden Tag automatisch ausgeführt und ruft die am Vortag eingestellten neuen Beiträge ab. - Kann manuell ausgelöst werden
Test-Workflow
Fehlersuche, um Empfehlungen für 5 feste Papiere zu erhalten.
- Protokolle prüfen
- Auf der Registerkarte "Aktionen" finden Sie das Protokoll der Workflow-Ausführung. Wenn für ein Wochenende oder einen Feiertag keine neuen Papiere vorliegen, wird im Protokoll möglicherweise "Keine neuen Papiere gefunden" angezeigt.
Hauptfunktionen
- Empfehlungen für Tageszeitungen
Das Tool holt sich täglich neue Papers aus dem Atom-Feed von arXiv, basierend auf Abstracts aus der Zotero-Bibliothek, unter Verwendung des SentenceTransformer-Modells (Standard)avsolatorio/GIST-small-Embedding-v0
) berechnet die Relevanz. Die Empfehlungsergebnisse werden nach der Punktzahl sortiert und enthalten den Titel des Papiers, den Autor, die Zusammenfassung, das von der KI generierte TL;DR und den Download-Link an die konfigurierte E-Mail-Adresse. Der Inhalt der E-Mail ist im HTML-Format organisiert, um die Informationen zu jedem Papier übersichtlich darzustellen. - AI erzeugt TL;DR
Das TL;DR für jedes Papier wird von einem großen Sprachmodell generiert und dauert etwa 70 Sekunden pro Papier. Die Nutzer können den TL;DR über die WebsiteMAX_PAPER_NUM
Kontrollieren Sie die Anzahl der Empfehlungen, um Zeitüberschreitungen zu vermeiden.TL;DR fassen Sie den Kerninhalt des Papiers kurz zusammen, damit die Nutzer schnell feststellen können, ob sie sich vertiefen müssen. - medRxiv unterstützen
Durch die Einstellung derMEDRXIV_DAYS
(z.B..7
(mit Angabe der letzten 7 Tage) undMEDRXIV_SUBJECTS
(z.B..Clinical Research
), kann das Tool medizinische Arbeiten von medRxiv abrufen. Die Empfehlungsergebnisse werden in der E-Mail nach Quelle (arXiv und medRxiv) gruppiert, um das Lesen zu erleichtern. - Debug-Modus
Test-Workflow
Ermöglicht es dem Benutzer, den Workflow jederzeit auszuführen, um 5 festgelegte Papiere abzurufen und zu testen, ob die Konfiguration korrekt ist. Die Ergebnisse des Laufs werden auch an die E-Mail-Adresse gesendet und die Protokolle können auf GitHub Actions eingesehen werden.
caveat
- Stellen Sie sicher, dass sich in der Zotero-Bibliothek genügend Dokumente befinden (insbesondere solche, die Zusammenfassungen enthalten), um die Genauigkeit der Empfehlungen zu verbessern.
- Die SMTP-Konfiguration muss genau sein, und es wird empfohlen, ein E-Mail-Konto zu verwenden, das nicht häufig benutzt wird, um Sicherheitsprobleme zu vermeiden.
- Überprüfen Sie regelmäßig das Fork-Repository und führen Sie Upstream-Updates ein (
TideDra/zotero-arxiv-daily
) für neue Funktionen und Fehlerbehebungen. - Das öffentliche Repository von GitHub Actions hat ein Laufzeitlimit, und es wird empfohlen, dass Sie eine kleine
MAX_PAPER_NUM
(z. B. 5), um sicherzustellen, dass der Auftrag erfüllt wird.
Anwendungsszenario
- Akademische Forscher verfolgen die Entwicklungen auf diesem Gebiet
Forscher können das Tool nutzen, um täglich Empfehlungen für neue Veröffentlichungen zu erhalten, die mit ihrer Forschungsrichtung (z. B. KI, Physik) in Zusammenhang stehen. So sparen sie die Zeit, die sie für das manuelle Durchsuchen von arXiv aufwenden müssen, und können sich schnell über die neuesten Forschungsfortschritte informieren. - Studierende erstellen eine Literaturübersicht
Doktoranden können das Tool nutzen, um die neuesten Arbeiten in verwandten Bereichen zu sammeln, kombiniert mit KI-generierten TL;DR, um schnell wertvolle Literatur zu sichten, die beim Schreiben von Abschlussarbeiten und bei der Vorbereitung von Rezensionen hilft. - Erweiterte Lektüre für interdisziplinäre Forscher
Interdisziplinäre Forscher können mehrere arXiv-Kategorien konfigurieren (z. B.cs.AI+physics.astro-ph
), empfehlenswerte Arbeiten in verschiedenen Bereichen zu erhalten und den Forschungshorizont zu erweitern. - Medizinische Forscher folgen medRxiv
Forscher im Bereich der Medizin können mit Hilfe von medRxiv auf klinische Forschungsarbeiten oder Veröffentlichungen im Bereich der öffentlichen Gesundheit zugreifen und sich über die neuesten medizinischen Entwicklungen auf dem Laufenden halten.
QA
- Wie kann ich sicherstellen, dass die empfohlenen Arbeiten für meine Forschungsinteressen relevant sind?
Das Tool berechnet die Relevanz neuer Artikel durch die Analyse der Zusammenfassungen von Artikeln in der Zotero-Bibliothek in Verbindung mit dem SentenceTransformer-Modell. Es stellt sicher, dass die Zotero-Bibliothek Papiere enthält, die für die Forschungsrichtung relevant sind, und bereinigt regelmäßig irrelevante Literatur, um die Genauigkeit der Empfehlungen zu verbessern. - Warum habe ich über das Wochenende keine E-Mail erhalten?
arXiv veröffentlicht an Wochenenden und Feiertagen in der Regel keine neuen Arbeiten, und im Log kann die Meldung "No new papers found" erscheinen. Dies ist ein normales Phänomen, und die Empfehlungen werden an Wochentagen wieder aufgenommen. - Wie füge ich medRxiv-Unterstützung hinzu?
Setzen Sie die Umgebungsvariable GitHub Actions in der DateiMEDRXIV_DAYS
(z.B..7
undMEDRXIV_SUBJECTS
(z.B..Epidemiology
), um medRxiv-Paper-Empfehlungen zu aktivieren. In der E-Mail werden arXiv- und medRxiv-Papiere getrennt angezeigt. - Was ist, wenn die Laufzeit zu lang ist?
Die Erstellung von TL;DR ist zeitaufwendig und es wird empfohlen, dass dieMAX_PAPER_NUM
Stellen Sie den Wert auf 5-10. Wenn die Zeitüberschreitung immer noch auftritt, versuchen Sie, die Anzahl der Papiere zu verringern oder die Funktiondev
Eine optimierte Version des Zweigs. - Wie aktualisiere ich mein Repository für neue Funktionen?
Regelmäßige Besuchehttps://github.com/TideDr/zotero-arxiv-daily
prüfen Sie auf Aktualisierungen. Wenn es neue Funktionen gibt, führen Sie das Upstream-Repository in Ihr Fork-Repository ein, wie in der GitHub-Dokumentation beschrieben.