O uso dos recursos de processamento de textos médicos do LangExtract pode atingir rapidamente esse objetivo. As etapas são as seguintes:
- Prepare prompt words: especifique explicitamente os campos a serem extraídos, por exemplo
"Extract medication names, dosages, and administration routes from clinical notes."
- Entrada de texto médico: notas clínicas contendo informações sobre medicamentos como entrada
- Chame a função de extração:
result = lx.extract(text, prompt=prompt, model="gemini-2.5-pro")
(Recomenda-se usar o modelo profissional de maior desempenho)
Após a execução, a saída conterá dados estruturados, como:{"entity": "Metformin", "dosage": "500 mg", "route": "orally"}
Para processamento em lote, salve como um arquivo JSONL ou gere um arquivo de visualização em HTML para facilitar a visualização. Para processamento em lote, salve como um arquivo formatado em JSONL ou gere um arquivo de visualização em HTML para facilitar a visualização.
Essa resposta foi extraída do artigoLangExtract: ferramenta de código aberto para extrair dados estruturados de textosO