Gemini 3.1 Pro评测:Google终于在推理赛道扳回一城(ZDNET)
Gemini 3.1 Pro在GPQA Diamond达到94.3%,MATH-500达到96.1%,均领先GPT-5.2和Opus 4.6。
核心优势
与Google Workspace深度集成,Deep Think模式处理最困难推理任务。Google Antigravity开发平台SWE-bench达76.2%。
不足
创意写作和情感表达逊于Claude;复杂Agent任务稳定性不如GPT-5.4。
编译来源:ZDNET (2026)