Durch die Verwendung der medizinischen Textverarbeitung von LangExtract kann dieses Ziel schnell erreicht werden. Die Schritte sind wie folgt:
- Eingabeaufforderung vorbereiten: explizite Angabe der zu extrahierenden Felder, z. B.
"Extract medication names, dosages, and administration routes from clinical notes."
- Eingabe von medizinischem Text: klinische Notizen mit Arzneimittelinformationen als Eingabe
- Rufen Sie die Extraktionsfunktion auf:
result = lx.extract(text, prompt=prompt, model="gemini-2.5-pro")
(Es wird empfohlen, das leistungsfähigere Pro-Modell zu verwenden)
Nach der Ausführung enthält die Ausgabe strukturierte Daten wie z. B.:{"entity": "Metformin", "dosage": "500 mg", "route": "orally"}
Für die Stapelverarbeitung speichern Sie als JSONL-Datei oder erzeugen Sie eine HTML-Visualisierungsdatei zur einfachen Anzeige. Für die Stapelverarbeitung speichern Sie als JSONL-formatierte Datei oder generieren Sie eine HTML-Visualisierungsdatei für eine einfache Anzeige.
Diese Antwort stammt aus dem ArtikelLangExtract: Open-Source-Tool zur Extraktion strukturierter Daten aus TextDie