用同一个"搭建电商网站"任务测试三大框架:

对比

  • AutoGen——微软出品,多Agent对话最强,调试难,Free
  • CrewAI——角色定义直觉,流程清晰,上手最快,Free+$30/月Cloud
  • OpenHands——编程场景最强(SWE-bench开源最高),Free

通用Agent→CrewAI(最简单);研究探索→AutoGen;编程任务→OpenHands。都在快速迭代中。

编译来源:The New Stack (2026)