阿里 Qwen3-Max-Thinking 是参数破万亿、在数学竞赛与真实交易双线封王的大模型推理引擎。
1 主要功能
1.1 数学推理
1.1 数学推理
- 支持 AIME、HMMT 等国际奥赛级题库,可完成证明、计算、几何、组合等多题型。
- 内置“链式思考”模式,逐步输出推导过程,方便教学与验证。
1.2 金融决策
- 接入实时行情,利用强化学习自动构建多空策略,已验证 22.3% 年化收益。
- 提供风险敞口分析与止损建议,可输出可执行的交易脚本。
1.3 代码生成与调试
- 根据自然语言描述生成 Python/C++ 代码,自动补全、纠错、复杂度分析。
- 支持一键单元测试与性能剖析,适合算法竞赛与工程落地。
1.4 多模态理解
- 读图识题:直接输入手写或打印数学题,可识别公式并给出解答。
- 图表→交易信号:将 K 线图、订单簿截图转为结构化数据并生成策略。
2 技术原理
2.1 超大规模预训练
2.1 超大规模预训练
- 1.2T 参数 MoE(混合专家)结构,每次推理仅激活 12% 子网络,降低算力。
2.2 数学增强语料
- 额外注入 500B tokens 的数学论文、竞赛题解、形式化证明库(Lean、Isabelle)。
2.3 强化学习后训练
- 采用 GRPO(Group Relative Policy Optimization)算法,以“得分”而非“模仿”为目标,显著提升解题准确率。
