O CycleResearcher é um ecossistema de pesquisa e revisão acadêmica orientado por IA de código aberto, projetado para melhorar a eficiência da pesquisa acadêmica por meio de ferramentas automatizadas. Ele consiste em três componentes principais: CycleResearcher para gerar artigos acadêmicos de alta qualidade, CycleReviewer para fornecer revisões acadêmicas detalhadas e DeepReviewer para simular vários revisores e autovalidação. Esse sistema acelera a descoberta científica e reduz os custos de mão de obra por meio de feedback de ciclo fechado entre pesquisa e revisão. Ele é compatível com vários modelos e conjuntos de dados e é adequado para pesquisadores, estudantes e desenvolvedores. Os usuários podem começar rapidamente por meio de instalação simples e chamadas de API, e é adequado para redação acadêmica, revisão de artigos e outros cenários.
Lista de funções
- Geração de papelCycleResearcher gera artigos acadêmicos com base em tópicos e referências fornecidos pelo usuário e oferece suporte a vários modelos (por exemplo, 12B, 72B, 123B).
- Revisor acadêmicoCycleReviewer: O CycleReviewer fornece uma análise detalhada dos artigos, produzindo classificações médias e decisões de aceitação/rejeição com uma taxa de precisão de 74,241 TP3T.
- Revisão multiperspectiva de manuscritosO DeepReviewer simula vários revisores e oferece três modos: Rápido, Padrão e Melhor, com suporte para pesquisa de conhecimento em segundo plano e autovalidação.
- Detecção de IAFerramenta AIDetector integrada que analisa se um documento foi gerado por IA e gera probabilidades e níveis de confiança.
- Pesquisa bibliográficaOpenScholar: o OpenScholar integra a funcionalidade de perguntas e respostas acadêmicas e oferece suporte à recuperação de literatura por meio da API do Semantic Scholar.
- Fácil de integrarBibliotecas Python: fornece bibliotecas Python e interfaces de API para os desenvolvedores incorporarem aos fluxos de trabalho existentes.
- Suporte a vários modelosSuporte a uma variedade de modelos pré-treinados, como Mistral, Llama3.1 e Qwen2.5, para atender a diferentes requisitos de desempenho.
Usando a Ajuda
Processo de instalação
O CycleResearcher é muito fácil de instalar, basta executar o seguinte comando em seu ambiente Python:
pip install ai_researcher
Certifique-se de que a versão do Python seja 3.8 ou superior. Se precisar usar o OpenScholar, você também precisará solicitar uma chave de API do Semantic Scholar e iniciar os serviços relevantes.
Instalação e inicialização do OpenScholar
- Solicitação de uma chave de API: Acesso API do Semantic Scholar Solicite uma chave.
- Iniciando o serviço de modelo::
cd OpenScholar chmod +x start_models.sh ./start_models.sh
- Iniciando o serviço de API::
python openscholar_api.py \ --s2_api_key YOUR_SEMANTIC_SCHOLAR_API_KEY \ --reranker_path OpenSciLM/OpenScholar_Reranker
- API de teste::
Envie perguntas usando a biblioteca de solicitações Python:import requests response = requests.post("http://localhost:38015/batch_ask", json={ "questions": ["检索增强语言模型在知识密集任务中的表现如何?"] }) print("OpenScholar 回答:", response.json()["results"][0]["output"])
Uso do CycleResearcher para gerar documentos
O CycleResearcher gera trabalhos acadêmicos com base em tópicos e referências específicos. Veja abaixo as etapas:
- Inicialização do modelo::
from ai_researcher import CycleResearcher from ai_researcher.utils import print_paper_summary researcher = CycleResearcher(model_size="12B")
O modelo 12B é usado por padrão e é adequado para a maioria das tarefas.
- Carregando referências::
Prepare o arquivo de referência no formato BibTeX (por exemplocycleresearcher_references.bib
) e depois ler:with open('cycleresearcher_references.bib', 'r') as f: references_content = f.read()
- Gerar uma tese::
Atribua tópicos e referências para gerar um documento:generated_papers = researcher.generate_paper( topic="AI Researcher", references=references_content, n=1 ) print_paper_summary(generated_papers[0])
O artigo gerado conterá uma estrutura completa de resumo, introdução e referências.
Revisão de manuscritos usando o CycleReviewer
O CycleReviewer oferece uma função de revisão automatizada adequada para avaliar rapidamente a qualidade de um documento.
- Inicialização do modelo::
from ai_researcher import CycleReviewer reviewer = CycleReviewer(model_size="8B")
- revisor::
suponha que...paper_text
É o conteúdo textual do documento a ser revisado que é executado:review_results = reviewer.evaluate(paper_text) print(f"平均评分: {review_results[0]['avg_rating']}") print(f"审稿决定: {review_results[0]['paper_decision']}")
O resultado consistiu em uma pontuação média e uma decisão de aceitar ou não, com uma precisão de 74,241 TP3T.
Revisão multiperspectiva com o DeepReviewer
O DeepReviewer oferece recursos de revisão mais sofisticados, com suporte a vários modos e vários revisores simulados.
- Inicialização do modelo::
from ai_researcher import DeepReviewer deep_reviewer = DeepReviewer(model_size="14B")
- Revisão do modelo padrão::
Simulação de 4 revisores:review_results = deep_reviewer.evaluate( paper_text, mode="Standard Mode", reviewer_num=4 ) for i, review in enumerate(review_results[0]['reviews']): print(f"审稿人 {i+1} 评分: {review.get('rating', 'N/A')}") print(f"审稿人 {i+1} 摘要: {review.get('summary', 'N/A')[:100]}...")
- Revisão do modelo ideal::
Possibilitando a busca e a autovalidação do conhecimento de base:review_results = deep_reviewer.evaluate( paper_text, mode="Best Mode", reviewer_num=6, enable_search=True, self_verification=True )
O modelo ideal é adequado para cenários que exigem uma análise aprofundada, fornecendo um feedback mais abrangente.
Detecção de conteúdo gerado por IA com o AIDetector
Detectar se o papel é gerado por IA:
from ai_researcher import AIDetector
detector = AIDetector(device='cpu')
detection_result = detector.analyze_paper(paper)
print(f"AI 生成概率: {detection_result['probability'] * 100:.2f}%")
print(f"置信度: {detection_result['confidence_level']}")
Consultando questões acadêmicas com o OpenScholar
O OpenScholar oferece suporte a perguntas e respostas acadêmicas baseadas em pesquisa, o que é ideal para encontrar rapidamente literatura ou responder a perguntas. Depois de executar o serviço de API, as perguntas são enviadas por meio de solicitações HTTP:
response = requests.post("http://localhost:38015/batch_ask", json={
"questions": ["如何提升语言模型在学术研究中的表现?"]
})
print(response.json()["results"][0]["output"])
advertência
- Seleção de modelosSelecione o modelo apropriado (por exemplo, 12B, 14B) de acordo com os requisitos da tarefa; modelos maiores são adequados para tarefas complexas.
- Chave da API: O OpenScholar requer a chave da API do Semantic Scholar, verifique se ela foi solicitada e configurada corretamente.
- Requisitos de hardware: O modo ideal do DeepReviewer requer alta capacidade de computação e a aceleração da GPU é recomendada.
- Suporte a conjuntos de dadosO sistema fornece conjuntos de dados, como Review-5K, Research-14K, etc., que podem ser usados para ajuste fino ou teste do modelo.
cenário do aplicativo
- Redação de trabalhos acadêmicos
Os pesquisadores podem usar o CycleResearcher para gerar rapidamente um primeiro rascunho de um artigo, incorporando referências para produzir um conteúdo estruturado adequado para ideias ou inspiração para o primeiro rascunho. - Revisão de documentos
Os organizadores de conferências acadêmicas ou editores de periódicos podem economizar tempo automatizando o processo de revisão com o CycleReviewer e o DeepReviewer, que simulam vários revisores para fornecer avaliações objetivas. - Respostas a perguntas acadêmicas
Estudantes e pesquisadores podem usar o OpenScholar para fazer perguntas sobre questões acadêmicas, obter acesso rápido a suporte bibliográfico ou responder a perguntas complexas. - Detecção de conteúdo de IA
Os editores de periódicos podem usar o AIDetector para verificar se os artigos enviados são gerados por IA, garantindo a integridade acadêmica. - pesquisa e desenvolvimento (P&D)
Os desenvolvedores podem usar a API do CycleResearcher para integrar-se aos fluxos de trabalho acadêmicos e criar ferramentas de pesquisa personalizadas.
QA
- Quais modelos são compatíveis com o CycleResearcher?
CycleResearcher-ML-12B, 72B, 123B, CycleReviewer-ML-Llama3.1-8B, 70B, 123B e DeepReviewer-7B, 14B são suportados, todos baseados em modelos pré-treinados convencionais. - Como escolher o modo de revisão do DeepReviewer?
Modo Rápido para feedback rápido, Modo Padrão para equilibrar precisão e velocidade e Modo Melhor para análise aprofundada. - O OpenScholar requer configuração adicional?
A chave da API do Semantic Scholar é necessária e os serviços de modelo e API são iniciados, conforme descrito no processo de instalação. - Qual é a qualidade dos documentos gerados?
O CycleResearcher-12B obteve uma classificação média de 5,36, que está próxima da classificação de 5,69 para artigos aceitos em conferências e é melhor do que outras ferramentas de IA. - Ele oferece suporte à geração de papel chinês?
Atualmente, os documentos estão principalmente em inglês, mas podem ser ajustados para oferecer suporte ao chinês, exigindo que o usuário forneça conjuntos de dados relevantes.