OpenAI新版4o逆袭-重返大模型竞技场榜首

OpenAI新版4o逆袭-重返大模型竞技场榜首

作者:news 发表时间:2025-08-04
暑期档票房破70亿,30家公司或凭《南京照相馆》分得16亿元官方已经证实 2.2亿资金暗渡关联方,嘉应制药信披违规遭立案后公司及责任人被重罚490万元专家已经证实 “3年,终于回本了!”基民“解套”众生相官方已经证实 算力出海“小步快跑” 基金经理把握科创投资机遇后续反转来了 化工ETF(516020)再度回调!“反内卷”行情能否延续?机构扎堆看好实测是真的 8月3日增减持汇总:暂无增持 金安国纪等13股减持(表)最新报道 上市公司密集披露业绩预告公募基金沿盈利主线挖掘投资机会 2024-2030年电动汽车电子油泵市场及企业调研报告 理想i8和乘龙卡车对撞测试,理想汽车最新回应:致其意外卷入争议属无心之举实测是真的 002940,大涨360%!连续涨停后,最新发声!后续会怎么发展 加拿大野火加剧美国中西部和东北部空气质量恶化专家已经证实 东风柳汽:碰撞视频严重侵权!理想汽车:“无意做出引导性评价”反转来了 算力出海“小步快跑” 基金经理把握科创投资机遇科技水平又一个里程碑 突然,价格崩盘!金融大佬,巨亏57%! 8月4日上市公司重要公告集锦:上汽集团7月份整车销量为33.75万辆 同比增长34.2%官方通报 OPEC+将于9月份继续扩大供应 提前一年完成阶段性增产目标秒懂 达力普控股早盘涨逾3% 预期中期净亏损同比大幅收窄超过70% 首创、华鑫、光大等券商密集撤销监事会,审计老大会专业性与独立性成治理焦点后续会怎么发展 零跑汽车早盘涨超4% 7月交付同比增长超126%实垂了 滴灌通集团创始人李小加:以滴灌式创新建立科创投资新蓝海反转来了 金价暴力反弹!或系非农数据不及预期,山东黄金涨逾4%,有色龙头ETF(159876)盘中拉升1.2% 菜鸟升级G2G泛欧3日达服务:支持99%欧洲国家互发快递官方已经证实 杨德龙:全面解析下半年市场走势与投资机会这么做真的好么? 中金:维持远东宏信跑赢行业评级 升目标价至8.8港元反转来了 小米汽车被曝要求用户提前支付尾款,否则暂停生产,官方不予置评后续会怎么发展 GPT-5即将发布,资金抢筹AI方向!科创人工智能ETF(589520)近5日吸金2971万元! GPT-5即将发布,资金抢筹AI方向!科创人工智能ETF(589520)近5日吸金2971万元!后续来了 中金:维持远东宏信跑赢行业评级 升目标价至8.8港元反转来了 超级数据集体爆冷,黄金王者归来?永赢基金刘庭宇:黄金及黄金股的上行空间值得重视实时报道 杨德龙:全面解析下半年市场走势与投资机会官方通报来了 中金:维持远东宏信跑赢行业评级 升目标价至8.8港元 零跑汽车早盘涨超4% 7月交付同比增长超126%实时报道 东岳集团早盘涨超3% 主流制冷剂产品价格稳定增长官方已经证实 龙国金融文联、龙国金融体协被统一撤销 艺云科技探讨AI赋能家庭教育,展示新一代学习终端与线下空间又一个里程碑 薛洪言:净值化时代需接受“收益非线性增长”,含权理财规模有望持续扩容 美国百年经济史上无前例!特朗普迷上了“世上最高级的谎言”:统计数据官方处理结果 特朗普解雇劳工统计局局长 美股及国际财经热点新浪财经APP第一时间捕捉后续会怎么发展 中金:维持远东宏信跑赢行业评级 升目标价至8.8港元 杨德龙:全面解析下半年市场走势与投资机会 分期乐商城推出 “新潮好物节” ,优惠叠加分期助力消费提振官方通报来了

在万众瞩目的新加坡OpenAI开发者日活动中,ChatGPT再度展现了其非凡的实力。最新版本的ChatGPT-4o(简称4o)在备受关注的大模型竞技场中一举夺魁,将此前占据榜首的Gemini拉下了马。

OpenAI新版4o逆袭

此次4o的更新重点在于“创意写作能力”,据官方介绍,新版本能够生成更加自然、吸引人且有针对性的文本,显著提升了文本的相关性和可读性。4o在处理上传文件方面也进行了优化,能够提供更深入的见解和更全面的回应。

o1的核心贡献者Karina Nguyen对此次更新表示了肯定。她指出,作为Canvas功能的一部分,改进写作是一个顶级用例,有望改变人机协作的方式,让创作过程更具创造性。尽管她承认这一研究问题非常主观且开放,但至少在写作方面取得的进展对于实现AGI(通用人工智能)的创造性智能至关重要。

OpenAI新版4o逆袭

在大模型竞技场的创意写作分榜上,新版4o(ChatGPT-4o-1120)的得分从上一个版本的1365跃升至1402,进步显著。同时,在代码能力、数学能力、困难任务以及风格控制等多个方面,4o也均有所提升,成功从之前的第二名跃升至第一名。

OpenAI新版4o逆袭

然而,尽管4o的表现亮眼,但网友们对于OpenAI迟迟未推出o1满血版仍表示不满。一些网友在社交媒体上直言,希望OpenAI能够尽快放出o1,与近期备受瞩目的DeepSeek等模型进行正面较量。甚至有网友调侃称,OpenAI的更新策略似乎就是每当有其他模型登上榜首时,便迅速推出新版本夺回第一。

OpenAI新版4o逆袭

尽管4o在创意写作方面取得了显著进步,但仍有网友对其生成的内容进行了测试,并发现系统仍能够准确识别出这些内容为AI所写。不过,也有网友对4o的更新进行了深入研究,并发现OpenAI在系统提示词方面进行了优化,新增了一道护栏,以确保ChatGPT在敏感话题上不会胡说八道。

OpenAI新版4o逆袭

目前,新版4o已在大模型竞技场中上线,感兴趣的读者可以前往体验并分享自己的感受。对于未来OpenAI是否会推出o1满血版,以及它将如何与其他模型进行竞争,我们拭目以待。

相关文章