THESIS Agent 是一个开源的 AI 智能体工具,托管在 GitHub 上,旨在帮助用户更高效地完成学术论文写作。它通过自动化处理文献、分析数据和生成内容,减轻学术研究中的繁琐工作。项目基于先进的语言模型,结合多智能体协作技术,提供从文献整理到数据可视化的全流程支持。THESIS Agent 适合学生、研究人员和学术工作者使用,代码开放,允许用户根据需求定制功能。项目文档详细,社区活跃,适合有一定技术基础的用户快速上手。
功能列表
- 文献整理与分析:自动提取论文关键信息,生成摘要或关键词。
- 数据可视化:根据输入数据生成图表,如柱状图、折线图等。
- 自动化写作:辅助生成论文段落、引言或结论,减少手动撰写时间。
- 多智能体协作:多个 AI 智能体协同工作,分解复杂任务并高效执行。
- 代码生成与调试:自动生成代码片段,并支持调试以优化结果。
- 工具集成:支持与外部工具(如学术数据库)连接,增强数据处理能力。
使用帮助
安装流程
要使用 THESIS Agent,首先需要克隆 GitHub 仓库并配置运行环境。以下是详细的安装步骤:
- 克隆仓库:
在终端运行以下命令,将项目克隆到本地:git clone https://github.com/THESIS-AGENT/thesis-agent-demo.git cd thesis-agent-demo
- 安装依赖:
项目依赖 Python 3.11 及相关库。建议使用虚拟环境以避免冲突:python -m venv venv source venv/bin/activate # Windows 用户运行: venv\Scripts\activate pip install -r requirements.txt
- 配置环境变量:
项目需要 API 密钥(如 OpenAI 或其他语言模型)。在项目根目录创建.env
文件,添加以下内容:OPENAI_API_KEY=your_openai_api_key ANTHROPIC_API_KEY=your_anthropic_api_key
你需要从相应平台获取密钥,并确保网络连接稳定。
- 安装浏览器工具:
部分功能需要使用 Playwright 进行网页交互。运行以下命令安装:pip install playwright playwright install chromium --with-deps
- 运行示例:
安装完成后,运行示例脚本以验证环境配置:python examples/run_demo.py
示例脚本会展示文献分析和数据可视化的基本功能。
功能操作流程
文献整理与分析
THESIS Agent 的核心功能之一是自动处理学术文献。用户可以通过上传 PDF 文件或输入论文 URL 来启动分析。操作步骤如下:
- 在项目目录下,找到
scripts/analyze_literature.py
脚本。 - 修改脚本中的输入参数,例如:
input_file = "path/to/your/paper.pdf" output_format = "summary" # 可选:keywords, abstract
- 运行脚本:
python scripts/analyze_literature.py
- 输出结果会保存在指定文件夹,包含摘要、关键词或引用分析。结果以 Markdown 格式生成,便于直接插入论文。
数据可视化
THESIS Agent 支持根据输入数据生成图表,适合展示实验结果或统计数据。操作流程如下:
- 准备数据文件(如 CSV 格式),确保包含列名和数值。例如:
Year,Value 2020,100 2021,120 2022,150
- 在
scripts/visualize_data.py
中指定文件路径和图表类型:data_file = "data/sample.csv" chart_type = "bar" # 可选:line, pie, scatter
- 运行脚本:
python scripts/visualize_data.py
- 输出结果为交互式图表,保存在
output/charts/
目录,支持 HTML 格式查看。
自动化写作
自动化写作功能可以生成论文的引言、结论或段落草稿。操作步骤如下:
- 编辑
scripts/write_content.py
,设置写作任务:task = "generate_introduction" topic = "AI in academic research" word_count = 200
- 运行脚本:
python scripts/write_content.py
- 输出结果为 Markdown 文件,内容经过语言模型优化,符合学术写作规范。用户可进一步编辑以满足具体需求。
多智能体协作
THESIS Agent 使用多智能体框架分解复杂任务。例如,生成一篇完整论文可能涉及文献分析、智能体协作和内容生成。用户只需运行主脚本:
python main.py --task "write_full_paper" --topic "Machine Learning Trends"
系统会自动分配任务给不同智能体,生成最终文档。
工具集成
用户可以通过配置文件 config/tools.yaml
添加外部工具(如学术数据库 API)。示例配置:
tools:
- name: PubMed
api_key: your_pubmed_api_key
endpoint: https://api.pubmed.gov
运行后,系统会自动从 PubMed 检索相关文献并整合到分析中。
注意事项
- 确保网络连接稳定,部分功能需要访问在线 API。
- 检查 Python 版本和依赖库是否正确安装,避免运行时错误。
- 项目文档位于
docs/
目录,详细说明了高级功能和定制方法。
应用场景
- 学术论文写作
研究生或学者在撰写论文时,使用 THESIS Agent 整理文献、提取关键信息并生成草稿,节省时间并提高效率。 - 数据分析与展示
研究人员在实验后,使用工具将数据转化为直观的图表,用于论文或学术报告,提升成果的可视化效果。 - 跨学科研究支持
涉及多领域知识的研究项目,利用多智能体协作功能,快速整合不同学科的文献和数据。 - 教学辅助
教师使用 THESIS Agent 自动生成课程相关的参考资料或教学大纲,减轻备课压力。
QA
- THESIS Agent 支持哪些语言模型?
项目支持 OpenAI、Anthropic 和 Google 的语言模型。用户可在配置文件中指定模型,如 GPT-4 或 Claude-3.7。 - 是否需要编程经验?
需要基本的 Python 知识来安装和运行脚本。但文档详细,初学者可按步骤操作。 - 可以离线使用吗?
部分功能(如本地模型 Qwen)支持离线运行,但文献检索和 API 调用需要联网。 - 如何贡献代码?
用户可通过 GitHub 提交 Pull Request。建议先阅读CONTRIBUTING.md
文件,了解贡献指南。