安装par_scrape需要以下步骤和前提条件:
- 环境准备:
- Python 3.11或更高版本(通过
python --version
检查)。 - Git工具(用于克隆项目,Linux用户可通过
sudo apt install git
安装)。 - 推荐使用UV工具管理依赖,安装命令为:
curl -LsSf https://astral.sh/uv/install.sh | sh
(Linux/Mac)。
- Python 3.11或更高版本(通过
- 克隆项目:运行
git clone https://github.com/paulrobello/par_scrape.git
并切换到项目目录。 - 安装依赖:使用UV同步依赖(
uv sync
)或直接从PyPI安装(uv tool install par_scrape
)。 - 可选配置:如需使用Playwright,需单独安装浏览器(
playwright install chromium
)。 - API密钥配置:在
~/.par_scrape.env
文件中添加AI提供者的密钥(如OpenAI或Anthropic)。
注意:确保所有依赖项正确安装,否则可能影响功能使用。
本答案来源于文章《par_scrape:智能提取网页数据的爬虫工具》