Kimi K2 能力对比分析

直观展示 K2 与主流模型的性能对比

Kimi K2

月之暗面开源模型

智能体能力
编程能力
数学推理
工具使用
1T参数 | 开源商用

GPT-4.1

OpenAI 闭源模型

智能体能力
编程能力
数学推理
工具使用
闭源API | 付费使用

Claude 4

Anthropic 闭源模型

智能体能力
编程能力
数学推理
工具使用
闭源API | 付费使用

基准测试得分对比

Kimi K2 核心特性

MoE架构

1万亿总参数,320亿激活参数

工具调用

连续200-300次工具执行

编程能力

LiveCodeBench 53.7%得分

数学推理

MATH-500 97.4%准确率