直观展示 K2 与主流模型的性能对比
月之暗面开源模型
OpenAI 闭源模型
Anthropic 闭源模型
1万亿总参数,320亿激活参数
连续200-300次工具执行
LiveCodeBench 53.7%得分
MATH-500 97.4%准确率