A plataforma oferece quatro métodos de integração principais, que os desenvolvedores podem escolher com flexibilidade de acordo com a pilha de tecnologia:
- Base de conhecimento nativa Docking::
- Selecione a plataforma pré-configurada (OpenAI Storage/Dify Datasets) na tela Integrate (Integrar).
- Digite a chave de API da plataforma de destino (é necessário um aplicativo prévio)
- Configuração de relações de mapeamento de campo (correspondência automática ou ajuste manual)
- Chamada de API::
- Obtenha o endpoint exclusivo fornecido pela plataforma
- Obtenha os dados mais recentes por meio de solicitação POST (suporta filtragem por hora/palavra-chave)
- Retornar ao exemplo:
{"status": 200, "data": [{"title": "...", "embedding": [...]}]}
- Webhook PushConfigure o endereço de notificação para acionar automaticamente a sincronização de dados quando uma tarefa programada for concluída
- Exportação e reimportação de arquivosDownload de arquivos no formato JSON-LD (contendo tags semânticas), carregados por meio de estruturas como LangChain
Para necessidades de personalização, é recomendado:
- Use o parâmetro "customKeys" para definir campos específicos do negócio (por exemplo, setor do cliente).
- Ajuste dinâmico da estrutura de dados em conjunto com a função de "extração de linguagem natural" ("Da próxima vez, inclua o título do autor")
- Referir-se diretamente ao conjunto de dados como a fonte de contexto ao criar um aplicativo da Web em plataformas como a Dify
Todos os métodos de integração mantêm a linhagem de dados, a rastreabilidade dos documentos originais e os registros de modificação, além de atender aos requisitos de auditoria corporativa.
Essa resposta foi extraída do artigoSupametas.AI: extração de dados não estruturados em dados altamente disponíveis do LLMO