CycleResearcherは、自動化されたツールによって学術研究の効率を向上させるために設計された、オープンソースのAI駆動型学術研究とレビューのエコシステムです。高品質な学術論文を生成するCycleResearcher、詳細な学術レビューを提供するCycleReviewer、複数の査読者と自己検証をシミュレートするDeepReviewerの3つのコアコンポーネントで構成されています。このシステムは、研究とレビュー間のクローズドループフィードバックを通じて、科学的発見を加速し、人件費を削減します。複数のモデルとデータセットをサポートし、研究者、学生、開発者に適しています。ユーザーは簡単なインストールとAPIコールですぐに使い始めることができ、学術論文執筆、論文レビュー、その他のシナリオに適しています。
機能一覧
- ペーパー・ジェネレーションCycleResearcher : CycleResearcherは、ユーザーが提供したトピックと参考文献に基づいて学術論文を生成し、複数のモデル(12B、72B、123Bなど)をサポートしています。
- 学術評論家: CycleReviewerは論文の詳細なレビューを行い、74.24%の精度で平均評価と採否判定を出力します。
- 原稿の多角的レビューDeepReviewerは、複数のレビュアーをシミュレートし、Fast、Standard、Bestの3つのモードを提供します。
- AI検出論文がAIによって作成されたかどうかを分析し、確率と信頼度を出力するAIDetectorツールを内蔵。
- 文献検索OpenScholarは学術的なQ&A機能を統合し、Semantic Scholar APIを通じて文献検索をサポートします。
- 統合が容易開発者が既存のワークフローに組み込むためのPythonライブラリとAPIインターフェースを提供します。
- マルチモデル対応Mistral、Llama3.1、Qwen2.5など、さまざまな学習済みモデルをサポートしており、さまざまな性能要件を満たすことができます。
ヘルプの使用
設置プロセス
CycleResearcherのインストールは非常に簡単で、Python環境で以下のコマンドを実行するだけである:
pip install ai_researcher
Pythonのバージョンが3.8以上であることを確認してください。OpenScholarを使用する必要がある場合は、Semantic Scholar APIキーをリクエストし、関連するサービスを開始する必要があります。
OpenScholarのインストールと起動
- APIキーのリクエストアクセス セマンティック・スカラーAPI キーを申請する。
- モデルサービスの開始::
cd OpenScholar chmod +x start_models.sh ./start_models.sh
- APIサービスの開始::
python openscholar_api.py \ --s2_api_key YOUR_SEMANTIC_SCHOLAR_API_KEY \ --reranker_path OpenSciLM/OpenScholar_Reranker
- テストAPI::
Pythonリクエストライブラリを使って質問を送る:import requests response = requests.post("http://localhost:38015/batch_ask", json={ "questions": ["检索增强语言模型在知识密集任务中的表现如何?"] }) print("OpenScholar 回答:", response.json()["results"][0]["output"])
CycleResearcherを使って論文を作成する
CycleResearcherは、特定のトピックと参考文献に基づいて学術論文を作成します。以下はその手順です:
- モデルの初期化::
from ai_researcher import CycleResearcher from ai_researcher.utils import print_paper_summary researcher = CycleResearcher(model_size="12B")
12Bモデルはデフォルトで使用され、ほとんどの作業に適している。
- 参考文献の読み込み::
参考文献ファイルをBibTeX形式で用意する(例cycleresearcher_references.bib
)を読む:with open('cycleresearcher_references.bib', 'r') as f: references_content = f.read()
- 論文の作成::
トピックと参考文献を割り当て、論文を作成する:generated_papers = researcher.generate_paper( topic="AI Researcher", references=references_content, n=1 ) print_paper_summary(generated_papers[0])
作成された論文は、抄録、序論、参考文献からなる完全な構成となっている。
CycleReviewerを使用した原稿審査
CycleReviewerは、論文の質を迅速に評価するのに適した自動レビュー機能を提供します。
- モデルの初期化::
from ai_researcher import CycleReviewer reviewer = CycleReviewer(model_size="8B")
- 査読者::
とするとpaper_text
審査されるのは論文の本文である:review_results = reviewer.evaluate(paper_text) print(f"平均评分: {review_results[0]['avg_rating']}") print(f"审稿决定: {review_results[0]['paper_decision']}")
出力は平均スコアと採否判定からなり、精度は74.24%であった。
DeepReviewerによる多視点レビュー
DeepReviewerは、複数のモードと複数のシミュレートされたレビュアーをサポートし、より洗練されたレビュー機能を提供します。
- モデルの初期化::
from ai_researcher import DeepReviewer deep_reviewer = DeepReviewer(model_size="14B")
- 標準モデルのレビュー::
4人のレビュアーのシミュレーション:review_results = deep_reviewer.evaluate( paper_text, mode="Standard Mode", reviewer_num=4 ) for i, review in enumerate(review_results[0]['reviews']): print(f"审稿人 {i+1} 评分: {review.get('rating', 'N/A')}") print(f"审稿人 {i+1} 摘要: {review.get('summary', 'N/A')[:100]}...")
- 最適モデルのレビュー::
背景知識の検索と自己検証を可能にする:review_results = deep_reviewer.evaluate( paper_text, mode="Best Mode", reviewer_num=6, enable_search=True, self_verification=True )
最適なモデルは、綿密な分析を必要とするシナリオに適しており、より包括的なフィードバックを提供する。
AIDetectorによるAI生成コンテンツの検出
用紙がAIによって生成されたかどうかを検出する:
from ai_researcher import AIDetector
detector = AIDetector(device='cpu')
detection_result = detector.analyze_paper(paper)
print(f"AI 生成概率: {detection_result['probability'] * 100:.2f}%")
print(f"置信度: {detection_result['confidence_level']}")
OpenScholarで学術的な質問を照会する
OpenScholarは検索ベースの学術Q&Aをサポートしており、文献を素早く見つけたり質問に答えたりするのに理想的です。APIサービスを実行すると、質問がHTTPリクエストで送信されます:
response = requests.post("http://localhost:38015/batch_ask", json={
"questions": ["如何提升语言模型在学术研究中的表现?"]
})
print(response.json()["results"][0]["output"])
ほら
- モデルの選択タスクの要件に応じて適切なモデル(例:12B、14B)を選択する。
- APIキーOpenScholarにはSemantic Scholar APIキーが必要です。
- ハードウェア要件DeepReviewerの最適モードは高い計算能力を必要とするため、GPUアクセラレーションを推奨します。
- データセット・サポートReview-5K、Research-14Kなどのデータセットを提供し、モデルの微調整やテストに利用できる。
アプリケーションシナリオ
- 学術論文執筆
研究者は、CycleResearcherを使用して、論文の初稿を素早く作成し、参考文献を組み込んで、初稿のアイデアやインスピレーションに適した構造化されたコンテンツを作成することができます。 - 論文レビュー
学術会議の主催者やジャーナル編集者は、複数の査読者をシミュレートして客観的な評価を提供するCycleReviewerやDeepReviewerを使って査読プロセスを自動化することで、時間を節約することができます。 - 学術的な質問への回答
学生や研究者は、OpenScholarを使って学術的な問題について問い合わせたり、文献サポートに素早くアクセスしたり、複雑な質問に答えたりすることができます。 - AIコンテンツ検出
ジャーナル編集者はAIDetectorを使って、投稿された論文がAIによって作成されたものかどうかをチェックし、学術的な完全性を確保することができる。 - 研究開発
開発者は、CycleResearcherのAPIを使用して、学術ワークフローに統合し、カスタマイズされた研究ツールを構築することができます。
品質保証
- CycleResearcherの対応機種は?
CycleResearcher-ML-12B、72B、123B、CycleReviewer-ML-Llama3.1-8B、70B、123B、およびDeepReviewer-7B、14Bがサポートされており、これらはすべて主流の事前学習済みモデルに基づいています。 - DeepReviewerのレビューモードの選択方法を教えてください。
素早いフィードバックのファストモード、正確さとスピードのバランスのスタンダードモード、詳細な分析のベストモード。 - OpenScholarは追加の設定が必要ですか?
Semantic ScholarのAPIキーが必要であり、インストールプロセスで説明されているように、モデルとAPIサービスが開始されます。 - 作成された論文の質は?
CycleResearcher-12Bは平均評価5.36を達成し、これは学会採択論文の5.69に近く、他のAIツールよりも優れている。 - 中国語のペーパージェネレーションに対応していますか?
現在、論文は主に英語で書かれているが、中国語をサポートするように微調整することも可能で、その場合、ユーザーは関連するデータセットを提供する必要がある。