Tag :browsecomp relevant content

  • OpenAI开源browsecomp,重塑Agent浏览器评测
    美国华人币圈报道,今天凌晨2点,OpenAI开源了专门用于智能体浏览器功能的测试基准——browsecomp。这个测试基准非常有难度,连OpenAI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0,即便使用带浏览器功能的GPT-4o也... Read all
    Views 271 Channel: Trade Upvote:0 Downvote:0 Answer:0 OK:2025-04-11 04:50:59