首届AI实盘投资大赛:阿里千问20%收益率夺冠,DeepSeek第二,美国四大模型均亏损

https://www.guancha.cn/economy/2025_11_04_795780.shtml

北京时间11月4日消息,由第三方机构Nof1于10月18日发起的AI大模型实时投资比赛“Alpha Arena”,历时17天,在今日落下帷幕。

阿里千问Qwen凭借一波精准操盘,以超20%的收益率夺冠,拿下本轮AI实盘投资大赛冠军。

DeepSeek位列第二,两款中国模型包揽冠亚军,成为全场唯二盈利的大模型。而美国四大顶尖模型全部亏损,GPT-5亏损超60%垫底。

该项投资比赛集合Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4等全球六大顶尖模型。

AI大模型的综合性能越来越强,如何评估大模型在真实、动态、竞争激烈的环境中的决策水平,是当下AI竞技场最受人关注的领域。

美国人工智能研究实验室nof1.ai发布的“Alpha Arena”(阿尔法竞技场),向六大顶尖模型提供1万美元及金融市场的实时价格及各类指标数据,让大模型在真实市场中用真金白银进行投资比赛,全程没有人工干预 ,模型进行自主决策和交易,是AI处理实时变动的现实世界任务的真实评测,也因此成为近期最火热的AI大赛。

竞赛采用统一输入方式,所有模型接收相同的市场数据和提示词,交易记录、持仓和账户价值实时公开,以保证比赛的公平性和透明度。此外,Nof1还允许AI模型“聊天互动”,让它们在模拟对话中辩论市场走势,展示决策逻辑,最终根据盈亏情况决出冠军。

比赛一开始,六大模型还都表现得挺克制,互相观望、谨慎试水。

此后的初期阶段,DeepSeek v3.1一直处于领先位置,也让这场比赛广受国际关注。曾经能够与之“一战”的是马斯克旗下的Grok 4,其通过激进的投资策略,一度把与DeepSeek v3.1的差距缩短到1美元的位置。

不过,10月21日至22日成为了“转折点”,这两日里,Grok 4和Claude Sonnet 4.5的收益大幅下滑,由盈转亏,10月22日当日,六个大模型的收益率更是一度全部告负。

但此时,DeepSeek v3.1和Qwen3-Max自动改写了投资策略,在其他4个大模型持续亏损的情况下脱颖而出,净值曲线波动上涨,Qwen3-Max更是趁机一度超过DeepSeek v3.1。

截至北京时间11月4日早上比赛结束,阿里千问最后超越DeepSeek,Qwen以超20%的收益率获胜;DeepSeek实现盈利,位列第二。

而美国的Claude 4.5 Sonnet、Grok 4、Gemini 2.5 Pro和GPT-5四大模型均亏损,Gemini 2.5 Pro和GPT-5亏损尤为明显,截至最终持仓总市值仅为初始资金的三四成,GPT-5亏损超62%垫底。

赛后,赛事主办方Alpha Arena的创办人Jay Azhang忙着为阿里千问Qwen模型策略及表现打call点赞,并祝贺阿里千问最终赢得冠军。

根据全球知名的大模型API三方聚合平台OpenRouter在7月公布的榜单,来自中国的DeepSeek和阿里通义千问跻身全球前五。其中,通义千问以10.4%的市场份额,超越OpenAI的4.7%,位列第四。

OpenRouter推文显示,当下成长最快前10大模型中,有9个是开源的。其中,Qwen3-Coder调用量以近500亿Tokens高居第一,通义千问包揽前三,并在前十中占据五席。

而在今年9月,零一万物CEO李开复曾公开表示,DeepSeek对中国AI发展的核心贡献在于推动了开源生态的形成。“如果十年后,我们回顾DeepSeek怎么让中国没有落后于美国,答案并非其技术能力本身,而是它带来了中国(大模型)开源时代。”

李开复提到,自DeepSeek开源以来,国内多家企业相继开源大模型,形成了“既开源、又比拼速度”的良性竞争局面。他认为,开源模式高度契合中国企业的学习特性,有望助力中国在AI领域缩小与美国的差距。

有行业人士指出,阿里千问和DeepSeek在实战中的优秀表现,证明了中国模型在解决实际问题的强大潜力,AI对于场景的深刻理解,将成为大模型落地和未来全球AI竞赛的关键。

#DeepSeek##深度求索##阿里巴巴#
全部评论

相关推荐

01-28 16:12
中南大学 Java
几年前还没有chatgpt的时候,刷题真的是很痛苦。刷不出来只能看题解,题解有几个问题:第一个是每次看的写题解的人都不一样,很难有一个统一的思路;第二个也是最重要的是,题解只提供了作者自己的思路,但是没有办法告诉你你的思路哪里错了。其实很少有错误的思路,我只是需要被引导到正确的思路上面去。所以传统题解学习起来非常困难,每次做不出来难受,找题解更难受。但是现在chatgpt能做很多!它可以这样帮助你 -1. 可以直接按照你喜欢的语言生成各种解法的题解和分析复杂度。2. 把题和你写的代码都发给它,它可以告诉你 你的思路到底哪里有问题。有时候我发现我和题解非常接近,只是有一点点🤏想错了。只要改这一点点就是最优解。信心倍增。3. 如果遇到不懂的题解可以一行一行询问为什么要这样写,chatgpt不会嫌你烦。有时候我觉得自己的range写错了,其实那样写也没错,只是chat老师的题解有一点优化,这个它都会讲清楚。4. 它可以帮你找可以用同类型解法来做的题。然后它可以保持解法思路不变,用一个思路爽刷一个类型的题。如果题目之间思路又有变化,它会告诉你只有哪里变了,其他的地方还是老思路。5. 它也可以直接帮你总结模板,易错点。经过chat老师的指导,我最大的改变是敢刷题了。之前刷题需要先找某一个人写的算法题repo,然后跟着某一个人他的思路刷他给的几个题。如果想写别的题,套用思路失败了,没有他的题解,也不知道到底哪里错了;看别人的题解,思路又乱了。这个问题在二分查找和dp类型的题里面特别常见。但是现在有chat老师,他会针对我的代码告诉我我哪里想错了,应该怎么做;还按照我写代码的习惯帮我总结了一套属于我的刷题模板。每天写题全是正反馈!
明天不下雨了:那我建议可以用 chatgpt atlas 或者 dia 去刷,也可以用 chrome 加个 ai 插件去刷 左边刷题右边 chat 效果很好
AI时代的工作 VS 传...
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务