智谱 GLM-5 大语言模型|智谱 GLM-5 大语言模型是什么- AI工具箱，AI研究室

国家：

中国

公司：

国内公司

版本：

网页版, App, API

访问：

可直接访问

难度：

待评估

收费标准：

较低

免费额度：

免费基础版

单次价格：

较低

适用人群：

待确定

用户评价：

关于智谱 GLM-5 大语言模型的详细信息需要进一步采集

智谱 GLM-5 是智谱 AI 推出的新一代旗舰大语言模型，复用 DeepSeek-V3 的 DSA 稀疏注意力架构，参数量达 745B，强化多模态能力，性能大幅提升，推动公司市值短期暴涨 200%。

一、主要功能

DSA 稀疏注意力架构

复用 DeepSeek-V3 的 DeepSeek Sparse Attention（DSA）技术，通过两阶段稀疏筛选：先由轻量索引器快速打分，仅对 Top-K 高分 Token 执行完整注意力计算，大幅降低算力消耗与推理时延，几乎不损失精度。
MoE 混合专家架构

采用 78 层隐藏层、256 个专家模块的 MoE 架构，每次推理仅激活 8 个专家（约 440 亿参数），稀疏度控制在 5.9% 以内，在 745B 总参数量下实现高效计算。
多 Token 预测（MTP）技术

一次性输出多个连续 Token，显著提升生成效率，适配长文本、长代码等高吞吐场景。
多模态融合模块

新增视频编码与图文对齐模块，将视觉、视频信息与文本语义统一建模，实现跨模态理解与生成。
在线反馈优化机制

引入 “强化学习 + 人类监督” 闭环，任务执行偏差可自动即时纠错（耗时＜10 秒），并通过脱敏行业数据离线迭代，持续提升性能。
国产芯片深度适配

支持昇腾 910B、寒武纪思元 590 等 40 余款国产芯片，在 8 卡昇腾 910B 集群上实现高效推理，适配国产化部署需求。