使用JigsawStack的网页抓取功能主要分为以下几个步骤:
- vorläufig:首先需要注册JigsawStack账号并获取API密钥
- Installieren des SDK:根据使用的编程语言安装对应的SDK。JavaScript用户执行npm i jigsawstack,Python用户执行pip install jigsawstack
- Initialisierung des SDK:使用API密钥初始化SDK,示例如下:
import { JigsawStack } from "jigsawstack";
const jigsaw = new JigsawStack({ apiKey: "你的密钥" }); - Aufrufen der API:准备网页URL和需要提取的元素提示(prompts),调用ai_scrape接口。示例如下:
const result = await jigsaw.web.ai_scrape({
url: "https://news.ycombinator.com/show",
element_prompts: ["post title", "post points"]
}); - Ergebnis:API会返回结构化数据,如:
{
"post title": ["New AI Tool Released"],
"post points": ["150"]
}
使用技巧:element_prompts中指定的提取内容描述越简洁准确,效果会越好。建议先从简单提取测试,再逐步完善提示词。
Diese Antwort stammt aus dem ArtikelJigsawStack: für eine breite Palette kleiner, dedizierter KI-Modell-APIsDie