par_scrape的智能数据提取功能通过整合多家人工智能提供者的模型实现,其核心机制和模型支持如下:
- workflow::
- 首先通过Selenium或Playwright获取网页内容。
- 将网页结构和用户指定的字段(如价格、标题)传递给AI模型。
- AI分析页面内容并返回结构化数据,工具再将其转换为指定输出格式。
- Supported AI models::
- OpenAI系列:如GPT-4o-mini等,需配置
OPENAI_API_KEY
The - Anthropic模型:需提供
ANTHROPIC_API_KEY
The - XAI(X.AI)方案:需设置
XAI_API_KEY
The
- OpenAI系列:如GPT-4o-mini等,需配置
Users can access the--model
参数灵活选择模型,例如:par_scrape --url "https://example.com" --model gpt-4o-mini
此外,工具还提供--prompt-cache
功能,可缓存AI提示以降低成本。
This answer comes from the articlepar_scrape: a crawler tool to intelligently extract data from web pagesThe