OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp

头条3个月前发布 editorw
65 0 0

4月11日财经报道,今天凌晨2点,OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度,连OpenAI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0,即便使用带浏览器功能的GPT-4o也只有1.9%。但OpenAI**发布的Agent模型Deep Research准确率高达51.5%,在自主搜索、信息整合、准确性校准方面非常**。

4月11日财经报道,美国比特币现货ETF昨日遭遇7.72亿美元巨额净流出,创近三个月**单日资金撤离。其中,贝莱德IBIT**出现4.6亿美元单日净流出,灰度GBTC资金外流加速,达2.1亿美元。 分析师指出,特朗普政府拟对中国商品加征125%关税的预期,引发市场对通胀复燃的担忧,促使部分机构投资者转向传统避险资产。

4月11日财经报道,比特币早期开发者、Blockstream CEO Adam Back近日表示,美国监管进展(如比特币现货ETF获批)已为全球大型机构投资者提供了明确的合规投资路径。他指出,当前机构资金入场“仅是开端”,随着传统金融基础设施(如托管、衍生品)的完善,比特币将迎来更大规模的机构配置。

© 版权声明

相关文章

暂无评论

暂无评论...