Estratégias de otimização de instruções em linguagem natural
Com base na experiência real de testes, é fornecida a seguinte metodologia para melhorar a precisão da geração de SQL:
- expressão estruturada::
Use o modelo "[ação] + [objeto] + [condição] + [qualificação]", por exemplo
“estatísticos(Ação) Formulário de pedido(Objeto) Quarto trimestre de 2023 no(Condições) As 5 principais vendas por província(qualificado)" - Evitar termos ambíguos::
Substitua o termo vago "novos usuários" por "os últimos 50 usuários registrados" para garantir que a ferramenta gere os "novos usuários" mais recentes.ORDER BY register_time DESC LIMIT 50 - Os campos são especificados explicitamente::
Quando campos específicos forem necessários, indique explicitamente "query user's id, name and last_login time" em vez de simplesmente "look up user information". - Consultas complexas em etapas::
Para consultas de correlação de várias tabelas, você pode primeiro entender a estrutura "exibindo os campos de correlação das tabelas de pedidos e usuários" e, em seguida, criar uma consulta completa.
Quando os resultados não forem os esperados, é recomendável usar o/modelAo alternar modelos de linguagem diferentes (por exemplo, do Gemini para o GPT-4), há diferenças na compreensão da linguagem natural entre os modelos.
Essa resposta foi extraída do artigoDbRheo-CLI: ferramenta de linha de comando para manipulação de bancos de dados e análise de dados usando linguagem naturalO





























