Medidas de proteção de dados de treinamento na nuvem
Observação ao treinar na plataforma RunPod/Modal:
- transmissão criptografada::
- Use SFTP para fazer upload de conjuntos de dados em vez de arrastar e soltar diretamente
- existir
.env
Configuração de arquivosHF_TOKEN
Excluir o histórico de comandos imediatamente após
- Gerenciamento de armazenamento::
- Implementado após a conclusão do treinamento
shred -u dataset/*
Excluir completamente o arquivo de origem - Habilite a função
Ephemeral Storage
Modo de armazenamento temporário
- Implementado após a conclusão do treinamento
- isolamento ambiental::
- Criação de um ambiente virtual Python dedicado (venv)
- aprovar (um projeto de lei ou inspeção etc.)
nvidia-smi
Monitore o acesso anômalo à GPU
Recomendações adicionais:
1. uso de dados confidenciaisopenssl
pacote criptografado
2. preferir provedores de serviços em nuvem com certificação ISO 27001
Essa resposta foi extraída do artigoKit de ferramentas de IA da Ostris: Difusão estável com o kit de ferramentas de treinamento de modelos FLUX.1O