智谱 GLM-5 是智谱 AI 推出的新一代旗舰大语言模型,复用 DeepSeek-V3 的 DSA 稀疏注意力架构,参数量达 745B,强化多模态能力,性能大幅提升,推动公司市值短期暴涨 200%。

一、主要功能

  1. 超强文本理解与生成

    支持最高 202K token 超长上下文窗口,在创意写作、文案生成、小说创作、演讲稿撰写等场景表现出色,风格灵活、逻辑严谨。

  2. 卓越编程能力

    支持多语言代码生成、调试、优化与复杂项目开发,可生成完整网站、游戏等功能代码,工具调用准确率高,适配智能体开发流程。

  3. 深度逻辑推理

    可处理复杂数学、逻辑难题,具备自主任务拆解、多步骤执行与纠错能力,智能体协作能力大幅提升。

  4. 多模态能力强化

    弥补 DeepSeek 纯文本架构短板,新增视频理解、图文跨模态分析能力,可融合文本、图像、视频信息进行综合处理。

  5. 高效推理与动态优化

    采用稀疏计算与多 Token 预测(MTP)技术,推理速度快、算力消耗低;支持在线反馈优化,通过真实数据持续迭代,越用越精准。

  6. 行业场景适配

    开放企业级 API,覆盖制造、医疗、金融、建筑、教育、交通 6 大行业,已落地三一重工、协和医院、中国平安等龙头企业应用。

二、技术原理

  1. DSA 稀疏注意力架构

    复用 DeepSeek-V3 的 DeepSeek Sparse Attention(DSA)技术,通过两阶段稀疏筛选:先由轻量索引器快速打分,仅对 Top-K 高分 Token 执行完整注意力计算,大幅降低算力消耗与推理时延,几乎不损失精度。

  2. MoE 混合专家架构

    采用 78 层隐藏层、256 个专家模块的 MoE 架构,每次推理仅激活 8 个专家(约 440 亿参数),稀疏度控制在 5.9% 以内,在 745B 总参数量下实现高效计算。

  3. 多 Token 预测(MTP)技术

    一次性输出多个连续 Token,显著提升生成效率,适配长文本、长代码等高吞吐场景。

  4. 多模态融合模块

    新增视频编码与图文对齐模块,将视觉、视频信息与文本语义统一建模,实现跨模态理解与生成。

  5. 在线反馈优化机制

    引入 “强化学习 + 人类监督” 闭环,任务执行偏差可自动即时纠错(耗时<10 秒),并通过脱敏行业数据离线迭代,持续提升性能。

  6. 国产芯片深度适配

    支持昇腾 910B、寒武纪思元 590 等 40 余款国产芯片,在 8 卡昇腾 910B 集群上实现高效推理,适配国产化部署需求。

三、应用场景

  1. 企业智能办公

    自动生成报告、合同、方案,智能分析数据,辅助决策,提升办公效率。

  2. 软件开发与 IT 运维

    代码生成、调试、漏洞修复,智能运维与系统优化,加速产品开发迭代。

  3. 内容创作与媒体

    新闻稿、文案、小说、剧本创作,视频脚本生成与内容审核,降低创作成本。

  4. 金融服务