Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito
Posição atual:fig. início " Respostas da IA

Como obter e usar o conjunto de dados de destilação chinês DeepSeek-R1?

2025-09-05 1.7 K

Diretrizes para acessar e usar o conjunto de dados

O processo de uso do conjunto de dados de destilação chinês DeepSeek-R1 pode ser dividido nas seguintes etapas:

Métodos de aquisição

  1. Acesso às plataformas Hugging Face ou ModelScope
  2. Pesquisar por "Chinese-DeepSeek-R1-Distill-data-110k"
  3. Selecione o formato apropriado (por exemplo, JSON, CSV, etc.) para fazer o download do conjunto de dados

Carregamento e uso

  • Preparação ambientalBibliotecas Python e de conjuntos de dados precisam ser instaladas
  • Carregamento básico::
    from datasets import load_dataset
    dataset = load_dataset("Congliu/Chinese-DeepSeek-R1-Distill-data-110k")
    
  • Visualização de dadosInformações básicas podem ser visualizadas por meio de print(dataset) e print(dataset['train'][0])

Pré-processamento e treinamento

Recomenda-se usar as bibliotecas de ferramentas relacionadas ao Transformer (por exemplo, os transformadores do Hugging Face) para o pré-processamento de dados e o treinamento do modelo. O conjunto de dados foi normalizado, mas o processamento adicional ainda pode ser realizado, dependendo dos requisitos específicos da tarefa.

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

voltar ao topo