Model Rankings

See the best-performing models based on Artificial Analysis benchmarks

Rank	Model Name	Model Creator	Intelligence	Parameters	Context Window	Price	Output Speed
🥇	GLM-5.2 (max)Top 1	Z AI	51	753B	1.00M	$0.9	140 tokens/s
🥈	MiniMax-M3	MiniMax	44	428B	1.00M	$0.2	99 tokens/s
🥉	DeepSeek V4 Pro (Reasoning, Max Effort)	DeepSeek	44	1.6KB	1.00M	$0.2	92 tokens/s
4	Kimi K2.6	Kimi	43	1.0KB	256k	$0.7	80 tokens/s
5	MiMo-V2.5-Pro	Xiaomi	42	1.0KB	1.00M	$0.2	52 tokens/s
6	Kimi K2.7 Code	Kimi	42	1.0KB	256k	$0.7	62 tokens/s
7	Nex-N2-Pro	Nex AGI	41	397B	262k	$0.5	80 tokens/s
8	DeepSeek V4 Pro (Reasoning, High Effort)	DeepSeek	41	1.6KB	1.00M	$0.2	85 tokens/s
9	DeepSeek V4 Flash (Reasoning, Max Effort)	DeepSeek	40	284B	1.00M	$0.1	110 tokens/s
10	GLM-5.1 (Reasoning)	Z AI	40	744B	200k	$0.9	69 tokens/s
11	MiMo-V2.5	Xiaomi	40	310B	1.00M	$0.1	87 tokens/s
12	GLM-5 (Reasoning)	Z AI	40	744B	200k	$0.7	70 tokens/s
13	MiniMax-M2.7	MiniMax	38	230B	205k	$0.2	46 tokens/s
14	Kimi K2.5 (Reasoning)	Kimi	38	1.0KB	256k	$0.6	45 tokens/s
15	Nemotron 3 Ultra 550B A55B (Reasoning)	NVIDIA	38	550B	262k	$0.6	172 tokens/s
16	DeepSeek V4 Flash (Reasoning, High Effort)	DeepSeek	37	284B	1.00M	$0.1	-
17	Qwen3.6 27B (Reasoning)	Alibaba	37	27.8B	262k	$0.9	59 tokens/s
18	GLM-5.1 (Non-reasoning)	Z AI	35	744B	200k	$0.9	57 tokens/s
19	Kimi K2.6 (Non-reasoning)	Kimi	35	1.0KB	256k	$0.7	67 tokens/s
20	GLM-4.7 (Reasoning)	Z AI	34	357B	200k	$0.7	125 tokens/s
21	Qwen3.5 27B (Reasoning)	Alibaba	34	27.8B	262k	$0.5	82 tokens/s
22	Qwen3.5 397B A17B (Reasoning)	Alibaba	34	397B	262k	$0.9	50 tokens/s
23	MiniMax-M2.5	MiniMax	34	230B	205k	$0.3	241 tokens/s
24	Hy3-preview (Reasoning)	Tencent	34	295B	256k	$0.1	158 tokens/s
25	DeepSeek V3.2 (Reasoning)	DeepSeek	33	685B	128k	$0.2	-
26	MiMo-V2-Flash (Feb 2026)	Xiaomi	33	309B	256k	$0.1	97 tokens/s
27	Kimi K2 Thinking	Kimi	33	1.0KB	256k	$0.8	124 tokens/s
28	GLM-5 (Non-reasoning)	Z AI	32	744B	200k	$0.7	58 tokens/s
29	Qwen3.5 122B A10B (Reasoning)	Alibaba	32	125B	262k	$0.7	145 tokens/s
30	Qwen3.5 397B A17B (Non-reasoning)	Alibaba	32	397B	262k	$0.9	52 tokens/s
31	Qwen3.6 35B A3B (Reasoning)	Alibaba	32	36B	262k	$0.4	173 tokens/s
32	MiniMax-M2.1	MiniMax	31	230B	205k	$0.4	206 tokens/s
33	DeepSeek V4 Pro (Non-reasoning)	DeepSeek	31	1.6KB	1.00M	$0.2	91 tokens/s
34	MiMo-V2-Flash (Reasoning)	Xiaomi	31	309B	256k	$0.1	95 tokens/s
35	Ring-2.6-1T	InclusionAI	31	1.0KB	262k	$0.5	130 tokens/s
36	Mistral Medium 3.5	Mistral	30	128B	256k	$1.2	123 tokens/s
37	Step 3.7 Flash	StepFun	30	198B	262k	$0.2	392 tokens/s
38	Kimi K2.5 (Non-reasoning)	Kimi	29	1.0KB	256k	$0.8	43 tokens/s
39	Gemma 4 31B (Reasoning)	Google	29	30.7B	256k	-	35 tokens/s
40	Qwen3.5 27B (Non-reasoning)	Alibaba	29	27.8B	262k	$0.5	89 tokens/s
41	Command A+	Cohere	29	218B	192k	-	159 tokens/s
42	Qwen3.6 27B (Non-reasoning)	Alibaba	29	27.8B	262k	$0.9	60 tokens/s
43	Qwen3.5 35B A3B (Reasoning)	Alibaba	29	36B	262k	$0.4	163 tokens/s
44	DeepSeek V4 Flash (Non-reasoning)	DeepSeek	29	284B	1.00M	$0.1	112 tokens/s
45	MiniMax-M2	MiniMax	28	230B	205k	$0.4	108 tokens/s
46	Qwen3.5 122B A10B (Non-reasoning)	Alibaba	28	125B	262k	$0.7	160 tokens/s
47	MiMo-V2.5-Pro (Non-reasoning)	Xiaomi	28	1.0KB	1.00M	$0.6	58 tokens/s
48	GLM-4.7 (Non-reasoning)	Z AI	27	357B	200k	$0.7	118 tokens/s
49	DeepSeek V3.1 Terminus (Reasoning)	DeepSeek	26	685B	128k	$1.7	-
50	Hy3-preview (Non-reasoning)	Tencent	26	295B	256k	$0.1	127 tokens/s
51	Ling-2.6-1T	InclusionAI	26	1.0KB	262k	$0.5	-
52	Gemma 4 26B A4B (Reasoning)	Google	26	25.2B	256k	$0.1	-
53	Step 3.5 Flash	StepFun	26	196B	256k	$0.1	195 tokens/s
54	DeepSeek V3.2 Exp (Reasoning)	DeepSeek	25	685B	128k	$0.2	-
55	NVIDIA Nemotron 3 Super 120B A12B (Reasoning)	NVIDIA	25	120.6B	1.00M	$0.3	253 tokens/s
56	GLM-4.6 (Reasoning)	Z AI	25	357B	200k	$0.7	54 tokens/s
57	Qwen3.5 9B (Reasoning)	Alibaba	25	9.65B	262k	$0.1	51 tokens/s
58	Gemma 4 31B (Non-reasoning)	Google	25	30.7B	256k	$0.2	52 tokens/s
59	K-EXAONE (Reasoning)	LG AI Research	25	236B	256k	-	-
60	MiMo-V2-Flash (Non-reasoning)	Xiaomi	25	309B	256k	$0.1	97 tokens/s
61	DeepSeek V3.2 (Non-reasoning)	DeepSeek	25	685B	128k	$0.5	-
62	Trinity Large Thinking	Arcee AI	24	399B	512k	$0.2	202 tokens/s
63	Qwen3.6 35B A3B (Non-reasoning)	Alibaba	24	36B	262k	$0.6	180 tokens/s
64	gpt-oss-120b (high)	OpenAI	24	117B	131k	$0.2	309 tokens/s
65	Kimi K2 0905	Kimi	24	1.0KB	256k	$0.8	30 tokens/s
66	Qwen3.5 35B A3B (Non-reasoning)	Alibaba	23	36B	262k	$0.4	188 tokens/s
67	GLM-4.6 (Non-reasoning)	Z AI	23	357B	200k	$0.8	52 tokens/s
68	EXAONE 4.5 33B	LG AI Research	23	34.4B	262k	-	-
69	GLM-4.7-Flash (Reasoning)	Z AI	23	31.2B	200k	$0.1	103 tokens/s
70	Qwen3 235B A22B 2507 (Reasoning)	Alibaba	22	235B	256k	$0.6	67 tokens/s
71	DeepSeek V3.2 Speciale	DeepSeek	22	685B	128k	-	-
72	HyperNova 60B 2605	Multiverse Computing	22	58.7B	131k	$0.1	393 tokens/s
73	Gemma 4 12B (Reasoning)	Google	22	12B	256k	$0.1	125 tokens/s
74	DeepSeek V3.1 Terminus (Non-reasoning)	DeepSeek	21	685B	128k	$0.3	-
75	DeepSeek V3.2 Exp (Non-reasoning)	DeepSeek	21	685B	128k	$0.2	-
76	Nemotron Cascade 2 30B A3B	NVIDIA	21	31.6B	1.00M	-	-
77	Apriel-v1.5-15B-Thinker	ServiceNow	21	15B	128k	-	-
78	Qwen3 Coder Next	Alibaba	21	79.7B	256k	$0.4	134 tokens/s
79	DeepSeek V3.1 (Non-reasoning)	DeepSeek	21	685B	128k	$0.7	-
80	Mistral Small 4 (Reasoning)	Mistral	21	119B	256k	$0.2	187 tokens/s
81	DeepSeek V3.1 (Reasoning)	DeepSeek	21	685B	128k	$0.7	-
82	Qwen3 VL 235B A22B (Reasoning)	Alibaba	21	235B	262k	$1.4	56 tokens/s
83	North Mini Code	Cohere	21	30B	256k	-	66 tokens/s
84	Apriel-v1.6-15B-Thinker	ServiceNow	21	15B	128k	-	-
85	Qwen3.5 9B (Non-reasoning)	Alibaba	20	9.65B	262k	-	-
86	Gemma 4 26B A4B (Non-reasoning)	Google	20	25.2B	256k	$0.2	49 tokens/s
87	Qwen3.5 4B (Reasoning)	Alibaba	20	4.66B	262k	$0.0	31 tokens/s

Rank

Model Name

Model Creator

Intelligence

Parameters

Context Window

Price

Output Speed

🥇

GLM-5.2 (max)Top 1

Z AI

753B

1.00M

$0.9

140 tokens/s

🥈

MiniMax-M3

MiniMax

428B

1.00M

$0.2

99 tokens/s

🥉

DeepSeek V4 Pro (Reasoning, Max Effort)

DeepSeek

1.6KB

1.00M

$0.2

92 tokens/s

Kimi K2.6

Kimi

1.0KB

256k

$0.7

80 tokens/s

MiMo-V2.5-Pro

Xiaomi

1.0KB

1.00M

$0.2

52 tokens/s

Kimi K2.7 Code

Kimi

1.0KB

256k

$0.7

62 tokens/s

Nex-N2-Pro

Nex AGI

397B

262k

$0.5

80 tokens/s

DeepSeek V4 Pro (Reasoning, High Effort)

DeepSeek

1.6KB

1.00M

$0.2

85 tokens/s

DeepSeek V4 Flash (Reasoning, Max Effort)

DeepSeek

284B

1.00M

$0.1

110 tokens/s

GLM-5.1 (Reasoning)

Z AI

744B

200k

$0.9

69 tokens/s

MiMo-V2.5

Xiaomi

310B

1.00M

$0.1

87 tokens/s

GLM-5 (Reasoning)

Z AI

744B

200k

$0.7

70 tokens/s

MiniMax-M2.7

MiniMax

230B

205k

$0.2

46 tokens/s

Kimi K2.5 (Reasoning)

Kimi

1.0KB

256k

$0.6

45 tokens/s

Nemotron 3 Ultra 550B A55B (Reasoning)

NVIDIA

550B

262k

$0.6

172 tokens/s

DeepSeek V4 Flash (Reasoning, High Effort)

DeepSeek

284B

1.00M

$0.1

Qwen3.6 27B (Reasoning)

Alibaba

27.8B

262k

$0.9

59 tokens/s

GLM-5.1 (Non-reasoning)

Z AI

744B

200k

$0.9

57 tokens/s

Kimi K2.6 (Non-reasoning)

Kimi

1.0KB

256k

$0.7

67 tokens/s

GLM-4.7 (Reasoning)

Z AI

357B

200k

$0.7

125 tokens/s

Qwen3.5 27B (Reasoning)

Alibaba

27.8B

262k

$0.5

82 tokens/s

Qwen3.5 397B A17B (Reasoning)

Alibaba

397B

262k

$0.9

50 tokens/s

MiniMax-M2.5

MiniMax

230B

205k

$0.3

241 tokens/s

Hy3-preview (Reasoning)

Tencent

295B

256k

$0.1

158 tokens/s

DeepSeek V3.2 (Reasoning)

DeepSeek

685B

128k

$0.2

MiMo-V2-Flash (Feb 2026)

Xiaomi

309B

256k

$0.1

97 tokens/s

Kimi K2 Thinking

Kimi

1.0KB

256k

$0.8

124 tokens/s

GLM-5 (Non-reasoning)

Z AI

744B

200k

$0.7

58 tokens/s

Qwen3.5 122B A10B (Reasoning)

Alibaba

125B

262k

$0.7

145 tokens/s

Qwen3.5 397B A17B (Non-reasoning)

Alibaba

397B

262k

$0.9

52 tokens/s

Qwen3.6 35B A3B (Reasoning)

Alibaba

36B

262k

$0.4

173 tokens/s

MiniMax-M2.1

MiniMax

230B

205k

$0.4

206 tokens/s

DeepSeek V4 Pro (Non-reasoning)

DeepSeek

1.6KB

1.00M

$0.2

91 tokens/s

MiMo-V2-Flash (Reasoning)

Xiaomi

309B

256k

$0.1

95 tokens/s

Ring-2.6-1T

InclusionAI

1.0KB

262k

$0.5

130 tokens/s

Mistral Medium 3.5

Mistral

128B

256k

$1.2

123 tokens/s

Step 3.7 Flash

StepFun

198B

262k

$0.2

392 tokens/s

Kimi K2.5 (Non-reasoning)

Kimi

1.0KB

256k

$0.8

43 tokens/s

Gemma 4 31B (Reasoning)

Google

30.7B

256k

35 tokens/s

Qwen3.5 27B (Non-reasoning)

Alibaba

27.8B

262k

$0.5

89 tokens/s

Command A+

Cohere

218B

192k

159 tokens/s

Qwen3.6 27B (Non-reasoning)

Alibaba

27.8B

262k

$0.9

60 tokens/s

Qwen3.5 35B A3B (Reasoning)

Alibaba

36B

262k

$0.4

163 tokens/s

DeepSeek V4 Flash (Non-reasoning)

DeepSeek

284B

1.00M

$0.1

112 tokens/s

MiniMax-M2

MiniMax

230B

205k

$0.4

108 tokens/s

Qwen3.5 122B A10B (Non-reasoning)

Alibaba

125B

262k

$0.7

160 tokens/s

MiMo-V2.5-Pro (Non-reasoning)

Xiaomi

1.0KB

1.00M

$0.6

58 tokens/s

GLM-4.7 (Non-reasoning)

Z AI

357B

200k

$0.7

118 tokens/s

DeepSeek V3.1 Terminus (Reasoning)

DeepSeek

685B

128k

$1.7

Hy3-preview (Non-reasoning)

Tencent

295B

256k

$0.1

127 tokens/s

Ling-2.6-1T

InclusionAI

1.0KB

262k

$0.5

Gemma 4 26B A4B (Reasoning)

Google

25.2B

256k

$0.1

Step 3.5 Flash

StepFun

196B

256k

$0.1

195 tokens/s

DeepSeek V3.2 Exp (Reasoning)

DeepSeek

685B

128k

$0.2

NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

NVIDIA

120.6B

1.00M

$0.3

253 tokens/s

GLM-4.6 (Reasoning)

Z AI

357B

200k

$0.7

54 tokens/s

Qwen3.5 9B (Reasoning)

Alibaba

9.65B

262k

$0.1

51 tokens/s

Gemma 4 31B (Non-reasoning)

Google

30.7B

256k

$0.2

52 tokens/s

K-EXAONE (Reasoning)

LG AI Research

236B

256k

MiMo-V2-Flash (Non-reasoning)

Xiaomi

309B

256k

$0.1

97 tokens/s

DeepSeek V3.2 (Non-reasoning)

DeepSeek

685B

128k

$0.5

Trinity Large Thinking

Arcee AI

399B

512k

$0.2

202 tokens/s

Qwen3.6 35B A3B (Non-reasoning)

Alibaba

36B

262k

$0.6

180 tokens/s

gpt-oss-120b (high)

OpenAI

117B

131k

$0.2

309 tokens/s

Kimi K2 0905

Kimi

1.0KB

256k

$0.8

30 tokens/s

Qwen3.5 35B A3B (Non-reasoning)

Alibaba

36B

262k

$0.4

188 tokens/s

GLM-4.6 (Non-reasoning)

Z AI

357B

200k

$0.8

52 tokens/s

EXAONE 4.5 33B

LG AI Research

34.4B

262k

GLM-4.7-Flash (Reasoning)

Z AI

31.2B

200k

$0.1

103 tokens/s

Qwen3 235B A22B 2507 (Reasoning)

Alibaba

235B

256k

$0.6

67 tokens/s

DeepSeek V3.2 Speciale

DeepSeek

685B

128k

HyperNova 60B 2605

Multiverse Computing

58.7B

131k

$0.1

393 tokens/s

Gemma 4 12B (Reasoning)

Google

12B

256k

$0.1

125 tokens/s

DeepSeek V3.1 Terminus (Non-reasoning)

DeepSeek

685B

128k

$0.3

DeepSeek V3.2 Exp (Non-reasoning)

DeepSeek

685B

128k

$0.2

Nemotron Cascade 2 30B A3B

NVIDIA

31.6B

1.00M

Apriel-v1.5-15B-Thinker

ServiceNow

15B

128k

Qwen3 Coder Next

Alibaba

79.7B

256k

$0.4

134 tokens/s

DeepSeek V3.1 (Non-reasoning)

DeepSeek

685B

128k

$0.7

Mistral Small 4 (Reasoning)

Mistral

119B

256k

$0.2

187 tokens/s

DeepSeek V3.1 (Reasoning)

DeepSeek

685B

128k

$0.7

Qwen3 VL 235B A22B (Reasoning)

Alibaba

235B

262k

$1.4

56 tokens/s

North Mini Code

Cohere

30B

256k

66 tokens/s

Apriel-v1.6-15B-Thinker

ServiceNow

15B

128k

Qwen3.5 9B (Non-reasoning)

Alibaba

9.65B

262k

Gemma 4 26B A4B (Non-reasoning)

Google

25.2B

256k

$0.2

49 tokens/s

Qwen3.5 4B (Reasoning)

Alibaba

4.66B

262k

$0.0

31 tokens/s