Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito

Um tutorial para ensinar a pessoa comum a entender e usar corretamente o DeepSeek-R1

DeepSeek-R1 Nada de especial em comparação com outros modelos grandes, sua surpresa é ver o processo de pensamento ou a excelente expressão chinesa. Se você já usou ChatGPT Se você está se sentindo insípido, então a surpresa trazida pelo DeepSeek-R1 pode ser uma ilusão. Se você estiver ocupado com crianças e entregas todos os dias, não há necessidade de prestar atenção ao DeepSeek, pois você não obterá nada além de uma perda de tempo.

contextos

Informações importantes sobre o DeepSeek-R1; se você não souber, pode ignorá-las. O DeepSeek-R1 nasceu de uma conhecida empresa de investimentos quantitativos, a "Mirage Quantitative", cujo nome completo é "Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co.", fundador Liang Wenfeng.

O DeepSeek lançou o modelo de inferência "DeepSeek-R1-Lite" em 20 de novembro de 2024,可以在用户界面开启“深度思考”使用。但是 DeepSeek-R1-Lite 使用一个较小的基座模型训练,得到的关注较少,而 DeepSeek-R1 使用了较大的基座模型“DeepSeek-V3-Base”训练而来,整体能力得到了很大提升。因此 DeepSeek-R1-Lite 就是 DeepSeek-R1 2个月前的预览版。这么着急公布给用户体验…

Em 20 de janeiro, Leung Man-fung participou e discursou em uma importante "reunião" e, no mesmo dia, emitiu a seguinte declaração. Relatório técnico do DeepSeek-R1,这种巧合好像哪吒爆火一样背后不知道有什么故事…

O motivo dos primeiros fogos de artifício do DeepSeek-R1 foi principalmente na área técnica, pois ele abriu relatórios técnicos sobre como usar GPUs de baixo custo (custo de GPU de US$ 5.576.000, oAqui está uma visão diferente)复现”o1“的,并且他的并发能力很高,用更少的硬件资源既可运行超大规模的“推理模型”。简单点解释就是把大模型的价格打下来了,让人人都用得起更好的大模型。

二次出圈是各类新闻报道向网民轰炸,像哪吒爆火一样…

Três vezes fora do círculo é a automídia com a onda de "dinheiro" quente, então vemos em uma variedade de grupos: 360 line DeepSeek-R1, ensiná-lo a implantar localmente o DeepSeek-R1, Universidade de Tsinghua para ensiná-lo a usar o DeepSeek-R1

Estamos agora no estágio final: DeepSeek-R1 para todos, e devemos ter recebido notícias sobre ele em empresas estatais, empresas centrais e até mesmo nas ruas de distritos e condados.

 

Onde usar o DeepSeek-R1

我询问过很多人,可能连DeepSeek-R1网址都找不到,有些人是因为官网卡,寻找其他提供 DeepSeek-R1 模型的服务,但你了解的可能都不对…

 

Canais de uso oficial

Seu site oficial é: https://chat.deepseek.com/ Não há versão de cliente para PC, o APP para celular vai para as principais lojas de aplicativos e procura por "DeepSeek".

Outros canais de uso

Atualmente, muitas ferramentas de IA integram o DeepSeek-R1, embora sua qualidade de saída não seja a mesma, recomendamos apenas uma ferramenta que esteja próxima do original para evitar dificuldades na escolha:

Tencent Yuanbao: https://yuanbao.tencent.com/ Também fornecemos o APP, pesquise "Yuanbao" no site oficial e nas principais lojas de aplicativos para fazer o download.

Lembre-se de marcar as seguintes opções ao usar a versão da Web:

教会普通人正确认识并使用 DeepSeek-R1 的教程-1

 

Instalação do DeepSeek-R1 em computadores locais e telefones celulares

Em primeiro lugar, a GPU de seu computador atende aos requisitos deInstalação do DeepSeek-R1 Requisitos mínimos? Se você não tiver nenhuma ideia sobre GPUs, não considere uma instalação local.

Instalação do PC DeepSeek-R1

Recomendado Ollama Para a instalação, o URL é: https://ollama.com/ , os modelos relevantes que podem ser instalados estão aqui: https://ollama.com/search?q=deepseek-r1 , se você precisar de um tutorial detalhado para a instalação, a instalação e o uso locais não são recomendados.

Por exemplo, uma placa de vídeo 3060, que mal consegue executar o modelo 14B (versão oficial destilada), pode ser instalada copiando o seguinte comando:

教会普通人正确认识并使用 DeepSeek-R1 的教程-1

Se a configuração do seu computador for "alta" e você quiser fazer a implantação localmente, recomendamos os seguintes instaladores locais com um clique

A instalação local requer uma certa base técnica. Aqui fornecemos o pacote de instalação local com um clique do DeepSeek-R1 e da interface de bate-papo:Guia para evitar as armadilhas: Pacote de instalação do Taobao DeepSeek R1 com upsell pago? Ensine a você a implantação local gratuitamente (com o instalador de um clique)

 

Se você tiver uma configuração de computador "baixa" e quiser fazer a implementação localmente, recomendamos as seguintes opções de implementação na nuvem

Implementação privada sem GPUs locais DeepSeek-R1 32B

 

Instalação do DeepSeek-R1 em telefones celulares

Delineie o foco!Quando você instala o DeepSeek-R1 em seu telefone celular, seu objetivo é baixar o aplicativo oficial ou executar o modelo DeepSeek-R1 localmente em seu telefone celular? Se quiser apenas usá-lo em seu telefone celular e não quiser executá-lo localmente em seu telefone celular, você pode baixá-lo procurando por "DeepSeek" ou "Tencent Yuanbao" na loja de aplicativos, ambos disponíveis on-line. O que se segue é apenas um método para executar o modelo DeepSeek-R1 localmente em seu telefone celular.

Desvantagens de instalar o DeepSeek-R1 localmente em seu telefone celular:O modelo instalado tem capacidade limitada para redigir textos simples de forma inteligente, reunir e resumir informações.

Se você decidir instalar:Instalação local dos modelos DeepSeek-R1 em telefones celulares, para modelos IOS e Android Premium

PocketPal AI:iOS和Android设备离线使用的小型语言模型聊天工具-1

 

Para que serve o DeepSeek-R1

O DeepSeek-R1 é muito bom e pode fazer muitas coisas, começar por eliminação, entender Para que o DeepSeek-R1 não serve. Gerei cerca de 5.000 perguntas para o DeepSeek-R1 (versão completa) e obtive alguma experiência para sua referência:

1. a pergunta errada gera alucinação Resposta: R1As alucinações são piores que as do ChatGPT. E é inerentemente difícil para uma pessoa comum fazer perguntas de R1 que serão corretamente "perguntadas", portanto, as respostas que você obtém geralmente são alucinatórias.

教会普通人正确认识并使用 DeepSeek-R1 的教程-1

2. inadequado para tarefas de pesquisa relacionadas a questões de cronogramaO problema está em três pontos: (1) o conhecimento treinado pelo modelo grande tem uma defasagem, (2) mesmo no modo de rede, o "pensamento profundo" é limitado pelo número de informações recuperadas, pois é uma recuperação única das informações da rede e não pode coletar informações completas sobre o problema da linha do tempo, e (3) o pensamento é interferido pelo excesso de contexto (consulte 3).

教会普通人正确认识并使用 DeepSeek-R1 的教程-1

 

3. o pensamento profundo é facilmente distraído pelo contextoEm um problema semelhante, a ativação da pesquisa na Web leva à obtenção de resultados piores porque introduz muitas informações da Web e confunde o processo de raciocínio. Esse é um problema sério.

教会普通人正确认识并使用 DeepSeek-R1 的教程-1

 

4.Como uma instrução clara de questionamento pode sofrer interferência do "pensamento profundo".Pensamento: O pensamento ignora a "diretriz principal" em favor de outros contextos, levando à dispersão gradual do pensamento e ao tempo excessivo de espera pelo pensamento.

Vamos dar uma olhada em como uma instrução de tarefa muito simples, com muito pouco contexto, pode ser corrompida pelo "pensamento", com o DeepSeek à esquerda e o ChatGPT à direita.

教会普通人正确认识并使用 DeepSeek-R1 的教程-1

 

教会普通人正确认识并使用 DeepSeek-R1 的教程-1

 

5) Se você estiver apenas procurando informações, o Google e o Baidu poderão obter melhores resultados.Se você quiser obter mais informações dos resultados da pesquisa, é mais eficiente usar um mecanismo de pesquisa. O R1 não o ajudará a analisar um grande número de páginas da Web de informações, porque ele o ajuda a pesquisar uma quantidade limitada de informações, pode se lembrar de uma quantidade limitada de informações, especialmente a capacidade de julgar os resultados da pesquisa como certos ou errados é ainda mais limitada, será um monte de resultados de pesquisa para ajudá-lo a raciocinar e, em seguida, fornecer a resposta.

教会普通人正确认识并使用 DeepSeek-R1 的教程-1

 

Cenários complexos, como escrever um artigo, coleta de informações de "dados", organização, a necessidade de várias rodadas de coleta de informações, várias rodadas de raciocínio (a operação manual também tem a mesma lógica), R1 é apenas uma rodada de coleta de informações e raciocínio, não pode resolver os problemas sistemáticos complexos de uma só vez. Quando você sabe disso, pode tentar reunir manualmente as informações relevantes, resumi-las e, em seguida, enviá-las ao R1 para análise.

 

Usando o DeepSeek-R1 corretamente

Atenção:Mesmo que você não use o modelo DeepSeek-R1, quando usar outros modelos, adicione uma frase "Vamos pensar passo a passo" na frente da pergunta, e os outros modelos ainda lhe darão um processo de pensamento detalhado. Entretanto, o nível de detalhes do raciocínio e a resposta final podem não ser tão bons quanto o DeepSeek-R1.

De fato, as técnicas para usar o DeepSeek-R1 não são muito diferentes de outros modelos, com apenas alguns detalhes a serem considerados.

 

1) Se você não estiver satisfeito com a complexidade da pergunta ou com a resposta que obtiver depois de ativar a pesquisa, tente desativar o "Deep Thinking". Depois de desativá-lo, usei o modelo V3, que ainda é muito bom.

教会普通人正确认识并使用 DeepSeek-R1 的教程-1

2) Use instruções simples e o Deep Think o ajudará a pensar!

Correto:Traduza para mim.

Erro:Ajude-me a traduzir para o chinês, use palavras que correspondam aos hábitos dos usuários chineses para traduzir, termos importantes precisam ser mantidos no idioma original, a tradução deve prestar atenção ao layout.

Mais exemplos de erros:

1) Tenho aqui um relatório de pesquisa de mercado muito importante, com muito conteúdo e muitas informações. Espero que você o leia com cuidado e atenção, pense profundamente sobre ele e depois o analise. Quais são as tendências de mercado mais importantes desse relatório? Seria melhor listar as três tendências mais importantes e explicar por que você acha que elas são as mais importantes.

2) Aqui estão alguns exemplos de diagnóstico de doenças: [Exemplo 1], [Exemplo 2] Agora, diagnostique a doença que o paciente pode estar sofrendo com base nas seguintes informações do registro médico. [Colar informações do histórico médico].

 

3. use comandos complexos para ativar o "pensamento profundo" (não é recomendável criar comandos complexos sem alguma experiência, pois comandos complexos e com muito contexto podem confundir o modelo R1).

Correto:Ajude-me a traduzir para o chinês, use palavras que correspondam aos hábitos dos usuários chineses para traduzir, termos importantes precisam ser mantidos no idioma original, a tradução deve prestar atenção ao layout.

Erro:Traduza para mim.

 

Observação: Para analisar os conflitos decorrentes de 2 e 3 de forma dialética, comece tentando comandos simples e, quando a resposta não atender a um requisito específico, aumente as condições do comando de forma apropriada.

 

Teste-se com o texto a seguir

**# How does better chunking lead to high-quality responses?
**If you’re reading this, I can assume you know what chunking and RAG are. Nonetheless, here is what it is, in short.**
**LLMs are trained on massive public datasets. Yet, they aren’t updated afterward. Therefore, LLMs don’t know anything after the pretraining cutoff date. Also, your use of LLM can be about your organization’s private data, which the LLM had no way of knowing.**
**Therefore, a beautiful solution called RAG has emerged. RAG asks the LLM to ** answer questions based on the context provided in the prompt itself** . We even ask it not to answer even if the LLM knows the answer, but the provided context is insufficient.**
**How do we get the context? You can query your database and the Internet, skim several pages of a PDF report, or do anything else.**
**But there are two problems in RAGs.**
* **LLM’s **context windows sizes** are limited (Not anymore — I’ll get to this soon!)**
* **A large context window has a high ** signal-to-noise ratio** .**
**First, early LLMs had limited window sizes. GPT 2, for instance, had only a 1024 token context window. GPT 3 came up with a 2048 token window. These are merely the **size of a typical blog post** .**
**Due to these limitations, the LLM prompt cannot include an organization’s entire knowledge base. Engineers were forced to reduce the size of their input to the LLM to get a good response.**
**However, various models with a context window of 128k tokens showed up. This is usually **the size of an annual report** for many listed companies. It is good enough to upload a document to a chatbot and ask questions.**
**But, it didn’t always perform as expected. That’s because of the noise in the context. A large document easily contains many unrelated information and the necessary pieces. This unrelated information drives the LLM to lose its objective or hallucinate.**
**This is why we chunk the documents. Instead of sending a large document to the LLM, we break it into smaller pieces and only send the most relevant pieces.**
**However, this is easier said than done.**
**There are a million possible ways to break a document into chunks. For instance, you may break the document paragraph by paragraph, and I may do it sentence by sentence. Both are valid methods, but one may work better than the other in specific circumstances.**
**However, we won’t discuss sentence and paragraph breaks, as they are trivial and have little use in chunking. Instead, we will discuss slightly more complex ones that break documents for RAGs.**
**In the rest of the post, I’ll discuss a few chunking strategies I’ve learned and applied.********

4. os quadros de palavras-chave permanecem pós-efetivos

Adquirir o hábito de inserir boas palavras-chave requer apenas as quatro condições a seguir: [personagem] [ação a ser executada pelo modelo maior] [objetivo da missão] [contexto da missão] (o contexto da missão não é necessário)

Exemplo:Desempenhar o papel de um especialista em redação oficial.Ajude-me a escrever um relatório sobre meu discurso na "Conferência do Funcionário do Ano". O discurso deve ter cerca de 5 minutos e deve ser sincero e modesto.O nome da minha empresa é PetroChina, o nome do meu supervisor é Li Fugui, trabalho na exploração de petróleo e ganhei o prêmio porque fui votado em segundo lugar pelos funcionários.

教会普通人正确认识并使用 DeepSeek-R1 的教程-1

 

5. aprenda a permitir que os grandes modelos o ajudem a fazer perguntas; boas perguntas levam a boas respostas

Voltando ao ponto "4", os exemplos de prompts dados, você vê algum problema?

As descrições não são detalhadas o suficiente para redigir um relatório que não possa ser usado diretamente, e a dificuldade que a maioria das pessoas tem com modelos grandes é que elas não conseguem fazer perguntas ou não querem se dar ao trabalho de acrescentar perguntas ao cérebro.

O problema é, na verdade, bastante simples. Antes de construir uma pergunta perfeita, aprenda a fazer o modelo geral para ajudá-lo a refinar seu questionamento.

教会普通人正确认识并使用 DeepSeek-R1 的教程-1

 

6. fazer perguntas para serem direcionadas, ou fazer com que o processo de pensamento do R1 seja direcionado, é um método muito antigo que não se aplica apenas ao R1

Os métodos a seguir normalmente não precisam ser usados em um modelo de inferência como o R1 para serem usados, mas são específicos do problema e, se o seu problema for muito direcionado, você poderá incluir alguns dos métodosDescrever contextos logicamente simples e curtos.

Prompt_ID Tipo Sentença de gatilho Chinês
101 CoT Let’s think step by step. Pensamos passo a passo.
201 PS Let’s first understand the problem and devise a plan to solve the problem. Then, let’s carry out the plan to solve the problem step by step. Primeiro, vamos entender o problema e fazer um plano para resolvê-lo. Em seguida, vamos resolver o problema passo a passo, de acordo com o plano.
301 PS+ Let’s first understand the problem, extract relevant variables and their corresponding numerals, and devise a plan. Then, let’s carry out the plan, calculate intermediate variables (pay attention to correct numeral calculation and commonsense), solve the problem step by step, and show the answer. Primeiro, vamos entender o problema, extrair as variáveis relevantes e seus valores correspondentes e, em seguida, criar um plano. Em seguida, execute o plano, calcule as variáveis intermediárias (prestando atenção ao processamento adequado de números e ao bom senso), resolva o problema passo a passo e exiba a resposta.
302 PS+ Let’s first understand the problem, extract relevant variables and their corresponding numerals, and devise a complete plan. Then, let’s carry out the plan, calculate intermediate variables (pay attention to correct numerical calculation and commonsense), solve the problem step by step, and show the answer. Primeiro, vamos entender o problema, extrair as variáveis relevantes e seus valores correspondentes e criar um plano completo. Em seguida, executar o plano, calcular as variáveis intermediárias (prestando atenção aos cálculos numéricos corretos e ao bom senso), resolver o problema passo a passo e exibir a resposta.
303 PS+ Let’s devise a plan and solve the problem step by step. Vamos fazer um plano e resolver o problema um passo de cada vez.
304 PS+ Let’s first understand the problem and devise a complete plan. Then, let’s carry out the plan and reason problem step by step. Every step answer the subquestion, “does the person flip and what is the coin’s current state?”. According to the coin’s last state, give the final answer (pay attention to every flip and the coin’s turning state). 首先,让我们理解问题并制定一个完整的计划。然后,执行计划并逐步解决问题。每一步回答子问题,“人是否翻转,硬币当前状态是什么?”. 根据硬币的最后状态,给出最终答案(注意每次翻转和硬币的翻转状态)。
305 PS+ Let’s first understand the problem, extract relevant variables and their corresponding numerals, and make a complete plan. Then, let’s carry out the plan, calculate intermediate variables (pay attention to correct numerical calculation and commonsense), solve the problem step by step, and show the answer. Primeiro, vamos entender o problema, extrair as variáveis relevantes e seus valores correspondentes e criar um plano completo. Em seguida, executar o plano, calcular as variáveis intermediárias (prestando atenção aos cálculos numéricos corretos e ao bom senso), resolver o problema passo a passo e exibir a resposta.
306 PS+ Let’s first prepare relevant information and make a plan. Then, let’s answer the question step by step (pay attention to commonsense and logical coherence). Primeiro, vamos preparar as informações relevantes e fazer um plano. Em seguida, responda às perguntas passo a passo (prestando atenção ao bom senso e à consistência lógica).
307 PS+ Let’s first understand the problem, extract relevant variables and their corresponding numerals, and make and devise a complete plan. Then, let’s carry out the plan, calculate intermediate variables (pay attention to correct numerical calculation and commonsense), solve the problem step by step, and show the answer. Primeiro, vamos entender o problema, extrair as variáveis relevantes e seus valores correspondentes e criar um plano completo. Em seguida, executar o plano, calcular as variáveis intermediárias (prestando atenção aos cálculos numéricos corretos e ao bom senso), resolver o problema passo a passo e exibir a resposta.

 

7. desambiguação de perguntas

É importante descartar ativamente possíveis ambiguidades nas perguntas com base na experiência, pois os grandes modelos de raciocínio estão dispostos a ajudá-lo a "supor" perguntas, como o exemplo errado mencionado anteriormente, em que a pergunta errada leva à suposição errada e à resposta errada.

教会普通人正确认识并使用 DeepSeek-R1 的教程-1

 

8. escolha entre o comprimento da entrada e a profundidade do raciocínio.

As entradas muito longas inibem o raciocínio e difundem os problemas de raciocínio, e as entradas curtas fortalecem o raciocínio e mantêm o foco, o que é mutuamente exclusivo.

 

9. controle o formato do conteúdo de saída

Consulte "4", a estrutura de palavras-chave. A última seção poderia adicionar [Output Format] para restringir o formato do conteúdo de saída do modelo grande.

Há dois tipos de formatos de conteúdo de saída de controle:

1. composição tipográfica

Exemplo 1: Saída usando formatação markdown e layout de conteúdo

Exemplo 2: O artigo de saída pode ser colado no Word para uso

2.Modelo

Exemplo 1: Gerar um artigo a ser dividido em três partes: introdução, explicação e resumo

Exemplo 2:Prompt: resumos de bate-papos em grupo, anotações de reuniões, como conversas em várias rodadas

 

Leitura ampliada sobre o DeepSeek-R1

DeepSeek-R1 WebGPU: Execute o DeepSeek R1 1.5B localmente em seu navegador!

Tifa-DeepsexV2-7b-MGRPO: um modelo que oferece suporte à interpretação de papéis e a diálogos complexos, com desempenho superior a 32b (com instalador de um clique)

Implementação de uma base de conhecimento local/API baseada no DeepSeek-R1 e acesso ao WeChat BOT

Recomendação oficial do DeepSeek: um guia para ferramentas práticas de IA com integração do DeepSeek R1

DeepSeek R1 Jailbreak: uma tentativa de burlar os censores do DeepSeek

Treine seu próprio modelo de inferência do DeepSeek R1 com o Unsloth

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

caixa de entrada

Entre em contato conosco

voltar ao topo

pt_BRPortuguês do Brasil