DeepSeek最强对手来了！阿里巴巴放出重磅炸弹

宜搜科技战略投资Lightnet，锁定正大集团全球资源RWA核心入口 轨交设备行业财务总监CFO观察：九州一轨李秀清收到1次警示函 2024年薪酬为94万元较前一年下跌62%官方已经证实 华力创通：重大合同履行情况及存货情况将在半年度报告中披露后续会怎么发展 总裁联播+政企双补，红星美凯龙818大促超级直播携9大品牌引爆全域流量实测是真的 《关于金融支持新型工业化的指导意见》解读创金合信基金罗水星：加速制造业产业升级 数智融合为天津高质量发展注入新动能科技水平又一个里程碑 日本政治困境加剧给预算编制与加息时机蒙上阴影后续来了 沸腾！暴涨近170%！龙国，创造历史！科技水平又一个里程碑 高盛测算美国关税成本：截至6月“美国企业承担64%、消费者22%，出口商14%”，到10月“消费者将承担67%”官方通报 日本政治困境加剧给预算编制与加息时机蒙上阴影官方已经证实 惠誉授予广州地铁离岸人民币债券A评级专家已经证实 燃气行业董秘观察：胜通能源宋海贞42岁为行业最年期薪酬为30万元为行业垫底 轨交设备行业财务总监CFO观察：今创集团胡丽敏仅为大专学历 2024年年薪为80万元超行业平均水平科技水平又一个里程碑 数智融合为天津高质量发展注入新动能是真的吗？ 6年后专利战火重燃华为在德国起诉“非洲之王”传音控股学习了 降息3次？！美联储，大消息！后续反转来了 6年后专利战火重燃，华为在德国起诉“非洲之王”传音控股 从“跟跑”到“领跑” 中天科技高速光模块实现跨越式发展 “教育消费者”？百果园紧急澄清实垂了 硅宝科技：部分高管拟合计减持不超0.02%公司股份后续会怎么发展 【东北通信】康普25Q2电话会要点 【东北通信】康普25Q2电话会要点秒懂 002898，“大换血”！ “教育消费者”？百果园紧急澄清 【东北通信】康普25Q2电话会要点 【东北通信】康普25Q2电话会要点太强大了 赛轮集团与龙国一拖开展业务合作交流 包装高收入群体骗取银行消费贷！数十人被判刑专家已经证实 硅宝科技：部分高管拟合计减持不超0.02%公司股份科技水平又一个里程碑 北方“桑拿天”即将返场高温、台风、强降雨又要凑齐了后续会怎么发展 0811热点追踪：停产靴子落地，碳酸锂开盘即涨停官方处理结果 【中银宏观：宏观和大类资产配置周报（2025.8.10）】本周沪深300指数上涨1.23%后续来了 锂业股早盘上涨天齐锂业涨逾13%赣锋锂业涨逾11%是真的吗？ 【市场聚焦】玉米：延续弱势最新进展 本周澳洲联储利率决议或引爆行情，澳元多头还有机会吗？实测是真的 消息称英伟达和AMD对华出口AI芯片获批，但15%收入需上缴美政府最新进展 贵金属板块开盘走低西部黄金、赤峰黄金跌超4%学习了 【宏观】出口对经济支撑有力——2025年7月进出口数据点评后续来了 能源金属板块大幅高开，永杉锂业竞价涨停 国信证券4.93%限售股即将解禁深投控持股60个月期满 好想你：推出四大战略新品构建全场景健康食品生态是真的？ 严惩！上市公司CFO内幕交易被罚！官方通报 英伟达概念板块领跌，下跌1.04% 中创新航早盘涨近4% 与广汽高域签署长期战略合作协议后续会怎么发展 CPO板块开盘走强生益电子涨超10%后续会怎么发展 华夏银行高管自愿增持计划暂未实施，承诺将按期完成

自DeepSeek火爆全球之后，国产开源大模型的开发热潮一浪高过一浪。如今，DeepSeek诞生以来最强的对手，它来了！

今日凌晨3点30，阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布，比DeepSeek更小的尺寸，性能比肩全球最强开源推理模型。据了解，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时，千问QwQ-32B还大幅降低了部署使用成本，在消费级显卡上也能实现本地部署。

目前，阿里已采用宽松的Apache2.0协议，将千问QwQ-32B模型向全球开源，所有人都可免费下载及商用。同时，用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前，QwQ-32B-Preview已经在（chat.qwen.ai）官网上线。

据通义千问Qwen团队介绍，近期的研究表明，强化学习可以显著提高模型的推理能力。例如，DeepSeek-R1通过整合冷启动数据和多阶段训练，实现了最先进的性能，使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习（RL）对大语言模型的智能的提升作用的最好研究例证。规模上，QwQ-32B是一款仅有320亿参数的模型，其性能却可与具备6710 亿参数（其中370亿被激活）的DeepSeek-R1媲美。

另外，Qwen团队还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。测试结果显示，在测试数学能力的AIME24评测集上，以及评估代码能力的 LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek-R1。

此外，Qwen团队还通过展示了一段简短的示例代码，说明如何通过API使用 QwQ-32B。Qwen团队表示，我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响，阿里巴巴港股大涨6.7%，截稿前报138.6港元，总市值2.63万亿港元。