Gemini 3.1 Pro在GPQA Diamond达到94.3%,MATH-500达到96.1%,均领先GPT-5.2和Opus 4.6。

核心优势

与Google Workspace深度集成,Deep Think模式处理最困难推理任务。Google Antigravity开发平台SWE-bench达76.2%。

不足

创意写作和情感表达逊于Claude;复杂Agent任务稳定性不如GPT-5.4。

编译来源:ZDNET (2026)