Gemini 3.1 Pro评测：Google终于在推理赛道扳回一城（ZDNET）

海外评测编译 2026年04月24日 11 阅读

Gemini 3.1 Pro在GPQA Diamond达到94.3%，MATH-500达到96.1%，均领先GPT-5.2和Opus 4.6。

核心优势

与Google Workspace深度集成，Deep Think模式处理最困难推理任务。Google Antigravity开发平台SWE-bench达76.2%。

创意写作和情感表达逊于Claude；复杂Agent任务稳定性不如GPT-5.4。

编译来源：ZDNET (2026)