# MAI-Thinking-1 评测成绩引质疑

- 来源：Ethan Mollick (@emollick)
- 发布时间：2026-06-03 04:28
- AIHOT 分数：38
- AIHOT 链接：https://aihot.virxact.com/items/cmpx3nsa600caslckggvzuoiu
- 原文链接：https://x.com/emollick/status/2061907785768489127

## AI 摘要

仅从分数很难判断 MAI-Thinking-1 有多好（比如 GPQA 和 Terminal Bench 2.0 的分数低得奇怪）
但微软在模型发布后很难让人试用（这是许多微软 AI 产品的通病），所以我不太清楚。不过数据低于 Meta Spark。

## 正文

It is difficult to know how good MAI-Thinking-1 is from the scores alone （like weirdly low GPQA &amp； Terminal Bench 2.0）

But Microsoft makes it really hard to try its models upon release （a general issue with many Microsoft AI products）， so I dunno. Stats below Meta Spark， though.
