平台提供4种主流集成方式,开发者可根据技术栈灵活选择:
- 原生知识库对接:
- 在”Integrate”界面选择预置平台(OpenAI Storage/Dify Datasets)
- 输入目标平台的API Key(需事先申请)
- 设置字段映射关系(自动匹配或手动调整)
- API调用:
- 获取平台提供的唯一Endpoint
- 通过POST请求获取最新数据(支持按时间/关键词过滤)
- 返回示例:
{"status": 200, "data": [{"title": "...", "embedding": [...]}]}
- Webhook推送:配置通知地址,当定时任务完成时自动触发数据同步
- 文件导出再导入:下载JSON-LD格式文件(包含语义标签),通过LangChain等框架加载
对于定制化需求,建议:
- 使用”customKeys”参数定义业务专用字段(如客户所属行业)
- 结合”自然语言提取”功能动态调整数据结构(”下次请包含作者职称”)
- 在Dify等平台中创建Web App时,直接引用数据集作为context来源
所有集成方式均保留数据血缘关系,可追溯原始文件和修改记录,满足企业审计要求。
本答案来源于文章《Supametas.AI:提取非结构化数据为LLM高可用数据》