DeepSeek最强对手来了！阿里巴巴放出重磅炸弹

美国7月份制造业采购经理指数报49.8 初步数据为49.5后续反转 美国劳动力市场5月和6月报告出现 “超出正常水平” 的向下修正这么做真的好么？ 最新进展 中信博：聘任证券事务代表实垂了 洽洽食品：累计回购公司股份1033192股实垂了 澳弘电子：公司不存在逾期担保的情况 短期健康险上半年赔付率观察：超六成险企不足50%，但有1412%“赔穿”，也有负值“倒赚” 亚马逊财报发布后股价下跌7% 洽洽食品：累计回购公司股份1033192股太强大了 国防军工意外领跌，512810放量失守10日线，人气逆市高涨！资金连日进场，开始埋伏阅兵行情？ 紫金矿业加纳金矿10亿美元收购价全部付清，但金矿并购战车未停 香港法院要求宗馥莉保全18亿美元信托，三子女证据曝光后续反转 佩洛西股票回报率达70% 美国白宫指责：有内幕 央企重组大动作！601088，拟购入13家公司 紫金矿业加纳金矿10亿美元收购价全部付清，但金矿并购战车未停后续会怎么发展 亚马逊财报发布后股价下跌7%科技水平又一个里程碑 就业引擎熄火，美联储还能“稳住”吗？实时报道 珠江股份定增提交注册拟募集资金7.38亿元最新进展 支持消费品以旧换新，今年第四批690亿元资金将于10月下达 网传汪林朋“绝笔信”为假 下半年“龙国首都市小客车指标”今起申报，常见问题官方答疑又一个里程碑 湖南金融监管局核准王澄长沙银行永州分行副行长任职资格官方通报 亚通股份（600692）被警示，股民索赔可期是真的吗？ 摩根大通将与苹果达成合作协议 iPhone 15为新机让路跌至谷底价致敬！ 网传汪林朋“绝笔信”为假这么做真的好么？ 炬申股份可转债被受理将于深交所上市 湖南金融监管局核准王澄长沙银行永州分行副行长任职资格实测是真的 中船应急（300527）被预处罚，股民索赔可期是真的吗？ Coinbase营收逊色，交易收入大跌39%，盘后股价重挫逾11%太强大了 IPO首日暴涨250%！美股软件新股Figma有何来头？官方已经证实 南京新百（600682）被警示，股民索赔可期 金风科技秦皇岛50万千瓦海上风电项目获批！秒懂 聚焦低空经济产业全景！华泰柏瑞中证通用航空主题ETF公告发售后续会怎么发展 天津全力推动港产城深度融合塑造高质量发展新优势 光伏设备板块走强捷佳伟创涨停后续反转 亚马逊电话会：AWS遇AI电力瓶颈！自研芯片成突围关键，性价比领先30%-40%学习了 港股物流板块多股走强，中通快递涨超9%官方通报来了 德林控股早盘高开逾4% 公司与Asseto订立认购协议后续来了 创新药概念反复走强众生药业等多股涨停最新报道 ST应急跌停，跌幅19.98%官方通报来了 英特尔计划分拆 NEX 部门后，消息称长期客户爱立信考虑成为少数股东 理想汽车高管再回应对撞争议：MEGA都能拿到中保研3G+碰撞成绩，i8？so easy 曝iPhone17全系涨价 iPhone 15跌至谷底价冰火两重天！学习了 天津全力推动港产城深度融合塑造高质量发展新优势后续来了 药师帮发盈喜后涨超5% 预计中期股东应占利润不少于7000万元是真的吗？ 发挥金融优势精准对接服务龙国民生银行济南分行助力强省会建设反转来了 零跑汽车：7月交付50129台同比增长超126%官方已经证实 快讯：恒指低开0.12% 科指跌0.09% AI概念股活跃蔚来涨超8%是真的？ 港股物流板块多股走强，中通快递涨超9%反转来了 软通计算机与安恒信息达成战略合作，共筑网络安全与信创产业新生态专家已经证实

自DeepSeek火爆全球之后，国产开源大模型的开发热潮一浪高过一浪。如今，DeepSeek诞生以来最强的对手，它来了！

今日凌晨3点30，阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布，比DeepSeek更小的尺寸，性能比肩全球最强开源推理模型。据了解，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时，千问QwQ-32B还大幅降低了部署使用成本，在消费级显卡上也能实现本地部署。

目前，阿里已采用宽松的Apache2.0协议，将千问QwQ-32B模型向全球开源，所有人都可免费下载及商用。同时，用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前，QwQ-32B-Preview已经在（chat.qwen.ai）官网上线。

据通义千问Qwen团队介绍，近期的研究表明，强化学习可以显著提高模型的推理能力。例如，DeepSeek-R1通过整合冷启动数据和多阶段训练，实现了最先进的性能，使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习（RL）对大语言模型的智能的提升作用的最好研究例证。规模上，QwQ-32B是一款仅有320亿参数的模型，其性能却可与具备6710 亿参数（其中370亿被激活）的DeepSeek-R1媲美。

另外，Qwen团队还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。测试结果显示，在测试数学能力的AIME24评测集上，以及评估代码能力的 LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek-R1。

此外，Qwen团队还通过展示了一段简短的示例代码，说明如何通过API使用 QwQ-32B。Qwen团队表示，我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响，阿里巴巴港股大涨6.7%，截稿前报138.6港元，总市值2.63万亿港元。