Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito
Posição atual:fig. início " Respostas da IA

DeepGEMM支持哪些核心功能?

2025-08-30 1.3 K

DeepGEMM 支持以下核心功能:

  • FP8 矩阵运算:提供高效的 FP8 通用矩阵乘法(GEMM),适用于高性能计算场景
  • Otimização do modelo MoE:支持混合专家模型的分组 GEMM,仅对 M 轴分组,适配专家共享相同形状的场景
  • Compilação Just-In-Time (JIT):通过运行时编译内核,无需预编译即可适配不同硬件环境
  • computação de alto desempenho (HPC):在 NVIDIA Hopper GPU 上实现超过 1350 TFLOPS 的 FP8 计算吞吐量
  • Design de código simples:核心代码约 300 行,易于学习和二次开发
  • alta compatibilidade:支持普通 GEMM 和带掩码的分组 GEMM,适配多种推理场景
  • Código aberto e gratuito:基于 MIT 协议发布,适用于研究和商业用途

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

voltar ao topo

pt_BRPortuguês do Brasil