AkashChat支持哪些主流大语言模型？各有什么特点？

2025-08-30

1.5 K

AkashChat当前支持的主流模型可分为三类：

一、超大规模模型
1. ラマ3.1 405B：参数规模4050亿，擅长复杂逻辑推理和多轮对话，但响应速度较慢（约15 tokens/秒）
2. ディープシーク R1 671B：当前平台最大模型，中文处理能力突出，特别适合技术文档生成

二、均衡型模型
1. Llama 3.3 70B：速度与性能平衡的最佳选择（22 tokens/秒），推荐日常使用
2. QwQ-32B：采用混合专家架构，在代码生成任务上表现优异

三、轻量级模型
1. ミストラル-7B：响应极快（27 tokens/秒），适合实时交互场景
2. Meta-Llama-3-1-8B：内存占用小，可在低配设备运行

セレクションの推奨初次使用者推荐从Llama 3.3 70B开始体验，开发者可重点测试QwQ-32B的代码能力，移动端用户考虑Mistral-7B。所有模型均采用FP8量化，在保持精度的同时降低计算开销。

クイック照会ステーションAIツール