Fase de instalação:
- Preparação ambientalPython 3.8+ e PyTorch 1.13.1+ (ambiente de GPU CUDA 11.7 recomendado)
- Instalação::
pip install graphg(instalação do PyPI)
talvezgit clonecódigo-fonte posteriormentepip install -r requirements.txt - Configuração da APIConfiguração de parâmetros-chave, como SYNTHESIZER_MODEL, no arquivo .env
Processos operacionais:
- Prepare-se para entrarProduzir arquivos de texto compatíveis no formato JSONL (consulte os recursos/exemplos)
- Parâmetros de configuraçãoEditar graphgen_config.yaml para definir a profundidade da amostragem, o estilo de geração, etc.
- Geração de execução::
Método de linha de comando:python -m graphg --config configs/graphgen_config.yaml
ou por meio depython webui/app.pyIniciando a interface de visualização do Gradio - Obter saídaExibição dos pares JSONL Q&A gerados no diretório especificado em output_dir.
advertênciaA primeira execução leva de 5 a 10 minutos para inicializar o gráfico de conhecimento; os dispositivos de GPU podem acelerar o processamento de relações multihop; recomenda-se começar a validar o ambiente com dados de demonstração.
Essa resposta foi extraída do artigoGraphGen: ajuste fino de modelos de linguagem usando gráficos de conhecimento para gerar dados sintéticosO































