新闻资讯

清晨重磅!阿里发布并开源Qwen3,无缝集成思考模式、多语言、便于Agent调用

  来源:华尔街见闻

  阿里巴巴周一发布并开源通义千问3.0(Qwen3)系列模型,并称其在数学和编程等多个方面均可与DeepSeek的性能相媲美。与其他主流模型相比,Qwen3还显著降低了部署成本。阿里表示,Qwen3无缝集成两种思考模式,支持119种语言,便于Agent调用。

  性能媲美DeepSeek R1、OpenAI o1,全部开源

  Qwen3系列包括两个专家混合 (MoE) 模型和另外六个模型。阿里巴巴表示,最新发型的旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相比,表现出极具竞争力。

  此外,被称为“专家混合”(MoE,Mixture-of-Experts)模型的Qwen3-30B-A3B的激活参数数量是QwQ-32B的10%,表现更胜一筹,甚至像Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能。这类系统模拟人类解决问题的思维方式,将任务划分为更小的数据集,类似于让一组各有所长的专家分别负责不同部分,从而提升整体效率。

  同时,阿里巴巴还开源了两个MoE模型的权重:拥有2350多亿总参数和220多亿激活参数的Qwen3-235B-A22B,以及拥有约300亿总参数和30亿激活参数的小型MoE 模型Qwen3-30B-A3B。此外,六个Dense模型也已开源,包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B,均在Apache 2.0许可下开源。

  “混合型”模型,两种思考模式

  阿里巴巴表示,Qwen 3系列是“混合型”模型,既可以花时间“推理”以解决复杂问题,也可以快速回答简单请求,分别叫做“思考模式”和“非思考模式”。“思考模式”中的推理能力使得模型能够有效地进行自我事实核查,类似于OpenAI的o3模型,但代价是推理过程中的延迟时间较高。

  Qwen团队在博客文章中写道:

这种灵活性使用户能够根据具体任务控制模型进行“思考”的程度。例如,复杂的问题可以通过扩展推理步骤来解决,而简单的问题则可以直接快速作答,无需延迟。

至关重要的是,这两种模式的结合大大增强了模型实现稳定且高效的“思考预算”控制能力。如上文所述,Qwen3展现出可扩展且平滑的性能提升,这与分配的计算推理预算直接相关。

这样的设计让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。

  训练数据量是Qwen2.5的两倍,便于Agent调用

  阿里巴巴表示,Qwen3系列支持119种语言,并基于近36万亿个token(标记)进行训练,使用的数据量是Qwen2.5的两倍。Token是模型处理的基本数据单元,约100万个token相当于75万英文单词。阿里巴巴称,Qwen3的训练数据包括教材、问答对、代码片段等多种内容。

  据介绍,Qwen3预训练过程分为三个阶段。在之一阶段(S1),模型在超过30万亿个token上进行了预训练,上下文长度为4K token。这一阶段为模型提供了基本的语言技能和通用知识。

  在第二阶段(S2),训练则通过增加知识密集型数据(如 STEM、编程和推理任务)的比例来改进数据集,随后模型又在额外的5万亿个token上进行了预训练。在最后阶段则使用高质量的长上下文数据将上下文长度扩展到32K token,确保模型能够有效地处理更长的输入。

  阿里巴巴表示,由于模型架构的改进、训练数据的增加以及更有效的训练 *** ,Qwen3 Dense基础模型的整体性能与参数更多的Qwen2.5基础模型相当。例如,Qwen3-1.7B/4B/8B/14B/32B-Base分别与Qwen2.5-3B/7B/14B/32B/72B-Base 表现相当。特别是在 STEM、编码和推理等领域,Qwen3 Dense基础模型的表现甚至超过了更大规模的Qwen2.5 模型。对于Qwen3 MoE基础模型,它们在仅使用10%激活参数的情况下达到了与Qwen2.5 Dense基础模型相似的性能,显著节省了训练和推理成本。

  而在后训练阶段,阿里使用多样的的长思维链数据对模型进行了微调,涵盖了数学、代码、逻辑推理和 STEM 问题等多种任务和领域,为模型配备基本的推理能力。然后通过大规模强化学习,利用基于规则的奖励来增强模型的探索和钻研能力。

  阿里巴巴表示,Qwen3在调用工具(tool-calling)、执行指令以及复制特定数据格式等能力方面表现出色,推荐用户使用Qwen-Agent来充分发挥Qwen3的Agent能力。Qwen-Agent内部封装了工具调用模板和工具调用解析器,大大降低了代码复杂性。

  除了提供下载版本外,Qwen3还可以通过Fireworks AI、Hyperbolic等云服务提供商使用。

  目标仍对准AGI

  OpenAI、谷歌和Anthropic近期也陆续推出了多款新模型。OpenAI近日表示,也计划在未来几个月发布一款更加“开放”的模型,模仿人类推理方式,这标志着其策略出现转变,此前DeepSeek和阿里巴巴已经率先推出了开源AI系统。

  目前,阿里巴巴正以Qwen为核心,构建其AI版图。今年2月,首席执行官吴泳铭表示,公司目前的“首要目标”是实现通用人工智能(AGI)——即打造具备人类智力水平的AI系统。

  阿里表示,Qwen3代表了该公司在通往通用人工智能(AGI)和超级人工智能(ASI)旅程中的一个重要里程碑。展望未来,阿里计划从多个维度提升模型,包括优化模型架构和训练 *** ,以实现几个关键目标:扩展数据规模、增加模型大小、延长上下文长度、拓宽模态范围,并利用环境反馈推进强化学习以进行长周期推理。

  开源社区振奋

  阿里Qwen3的发布让AI社区感到激动,有网友献上经典Meme:

  有网友说,

在我的测试中,235B在高维张量运算方面的表现相当于Sonnet。

这是一个非常出色的模型,

感谢你们。

  有网友对Qwen3赞不绝口:

如果不是亲眼看到屏幕上实时生成的tokens,我根本不会相信那些基准测试结果。???? 简直像魔法一样????

  而开源AI的支持者则更加兴奋。有网友说:

“有了一个开源32B大模型,性能跟Gemini 2.5 Pro不相上下。”

“我们彻底杀回来了!”

  网友感谢阿里积极推动开源:

  市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

  • 收盘:道指收跌700点 科技股拖累纳指下跌3%
  • 外媒:“一把椅子”引发争议,法国一政党领袖要求“马克龙辞职”
  • 【光明时评】期待公共图书馆有更多“打开方式”
  • 地方新闻精选 | 游客在大理古城170克手机称出340克 酒店保洁员调包住客1.9万港币获刑
  • 降本拉高净利,营收增速仅1.9%!老白干酒开启“省钱模式”
  • 【深度】广西“渴”水:钱是大难题
  • GDP萎缩与通胀高企使美联储陷入两难境地
  • 韩文秀:三大风险已得到有效控制
  • 程序员危险了?微软CEO称公司三成代码由AI编写
  • 青年如何打破“千人一面”,创造属于自己的文化观?
  • 转口贸易和非美贸易仍将对我国出口形成支撑|宏观晚6点
  • 25岁的AI创业者:保持平常心,不会有任何一家公司猝死在新技术的出现上|在春天许一个愿望⑫
  • 【专访】世界经济论坛专家:气候变化愈加紧迫,中国在全球脱碳进程中将扮演重要角色
  • 泽连斯基:美乌矿产协议将提交乌拉达批准
  • 沐瞳和朝夕光年被曝将整体打包上市,字节跳动否认
  • 沃尔玛态度转变:恢复中国供应商出货,美国客户承担关税成本
  • 2024年以来深交所支持民企发行公司债券融资近2000亿元
  • 中国港能拟配发合共7.18亿股资本化股份
  • 4月17日美股成交额前20:联合健康大砍财测,股价重挫22%
  • 六大行一季报营收、利润表现分化,股价为何齐刷刷回调?
  • 佩斯科夫:俄美总统会晤正在筹备中,未设定停火最后期限
  • 神舟十九号载人飞行任务取得圆满成功
  • 证券从业者热衷考公考编,一年多来2.4万人退出
  • 荣耀发布MagicBook Pro 16 2025系列笔记本,售价5039.2元起
  • 因室友电瓶燃爆致全身90%烧伤,杜均浩父亲最新发声:孩子常常照镜子发呆落泪
  • 北京理工大学再发通报:撤销宫某教授职称,解除聘用关系
  • 尊界S800将首次实车公开亮相上海车展
  • 操纵市场、“霸凌者”,特朗普遭痛批
  • 在关税议题上被晾一边,纳瓦罗在白宫越来越不受欢迎
  • 冯德莱恩谈欧美关系:我们所熟悉的西方已不复存在
  • 中国游戏在俄罗斯获得爆发式增长
  • 大尺度色情语聊、撮合卖淫嫖娼!一些交友软件暗藏“桃色陷阱”
  • 和机器人一起逛龙华庙会
  • 河南省鹤壁市人大常委会副主任李杰接受审查调查
  • 西安银行:咸阳分行因金融借款合同纠纷提起诉讼 涉及借款本金7.3亿元
  • 美财长暗示:90天内无法完成与主要贸易伙伴的关税协议
  • 昨夜今晨国际财经热点一览_2025年5月3日_财经新闻
  • 跟着习主席看世界|走进越南:与中国山水相连同志加兄弟
  • 对话智元合伙人姚卯青:具身智能淘汰赛即将开启
  • 大风橙色预警中的北京:各部门全力保障城市正常运行
  • 一季度我国金条及金币消费量同比增长近三成,黄金首饰消费却降了26.85%
  • 报道:联合国在资金危机中考虑重大改革
  • 稀土管制难倒特斯拉人形机器人“擎天柱”,马斯克:“正与中国协商”
  • 竞彩湃|拜仁冲冠战役或有冷门,大巴黎留力欧冠半决赛
  • 视频|中国乳业反向输出,在北美悄然走红
  • 与莫迪交谈后 马斯克重启访问印度的计划
  • 有一天,我们将感谢这场笨拙的人机赛跑
  • 特朗普,终结美国人的「消费自由」?
  • 大风天柴锅做饭无人看管北京两村民被罚
  • 新闻1+1丨“龟速”行驶要治理,还要治什么?
  • IPO雷达|15年间四冲上市,做中药饮片的新荷花盈利能力大幅下滑
  • 特朗普药品关税或抬高美国患者的药价 而生产回流美国并不容易
  • 特朗普启动审查程序 拟对芯片和药品进口加征关税
  • 伊朗外长:美伊第二轮谈判将于下周六举行
  • 美债的坏消息!首家日本大型寿险公布年度投资规划:大力购买日本超长债,考虑缩减外债
  • 开发国内首个泌尿专科智能体,医生们将临床经验转变为知识图谱
  • 先锋基金董事长、副总经理同时变更
  • 险资新动向!债券“南向通”扩容待开闸
  • 再不买周大福,可能就要买不起了
  • 多米尼加俱乐部屋顶坍塌事故死亡人数升至232人
  • 摩根士丹利基金陈修竹:从新能源汽车到人形机器人 中国智造的万亿级产业跃迁
  • 跨境电商敦煌网在美下载量飙升,如何接住美国用户的“流量”?
  • 1000元/克!黄金 还能买吗?
  • 电商“仅退款”将全面取消,退款不退货交由商家处理
  • 特朗普第二个任期百日:Dollar General股价表现跻身前三甲
  • 涉嫌严重违纪违法,证监会副主席王建军任上被查
  • 民营经济促进法草案将提请三审:推进严格规范公正文明执法
  • Meta一季度净利增长三成:上调全年资本支出,受关税影响亚洲出口电商广告支出减少
  • 专访|200余起诉讼,特朗普上台100天,美国已进入宪政危机
  • 马上评|“阿大葱油饼”回归,上海美食的人间烟火故事
  • 申万宏源研究所迎新所长,首席策略分析师王胜获升任
  • 亚太地区逆势增长,集装箱运输提前迎来旺季
  • 东鹏饮料一季度净利增近五成,电解质饮料收入增超两倍
  • 随着美元走弱,全球央行如履薄冰 —— 是否要让本币贬值
  • 乌美签署矿产协议备忘录,美国坚持优先拿走开采收益
  • 美大学建“私人联盟”对抗政府:学校已存在300年,特朗普才上任3个月
  • 关税摩擦下体外诊断行业震荡,上游原料迎来国产化窗口期
  • 特朗普疯狂骂街,“解雇鲍威尔”交易初见雏形!
  • 【光明时评】县域经济发展需要更高含“绿”量
  • 何立峰会见美国英伟达公司总裁黄仁勋:欢迎美资企业深耕中国市场
  • 跨国汽车零部件巨头开始主动争抢中国客户 | 2025上海车展
  • 明日起北京这些公园恢复开放
  • 永辉超市“反向抹零”遭质疑,门店:“四舍五入”是系统自动设定
  • 70后供销合作总社理事会原副主任侯顺利任中国融通外部董事
  • 国元证券:“对等”关税博弈后 内需将成经济稳定锚
  • 72小时冷静期——信用市场制定出特朗普时代生存法则
  • 现货黄金突破3300美元!信用卡、消费贷“炒金”冒头
  • 大模型“六小虎”变阵
  • 特朗普:“百分之百”相信能与欧盟达成贸易协议
  • 人民日报:外贸新动能加快培育
  • 金科股份:持有的金科服务5468万股将进行第二次拍卖
  • 乖宝宠物成年营收最高的国产宠物粮上市公司
  • 广汽冯兴亚:首款L3车型将于四季度上市
  • 被控15年受贿3.43亿,西藏自治区原党委书记吴英杰当庭认罪悔罪
  • 英国一季度零售销售增长1.6%,为四年来最大增幅
  • 创业失败的95后:从抖音转战小红书,我决定再试一次 | 在春天许一个愿望⑪
  • 具身智能赛道前景可期 三大运营商集体布局
  • 欧洲3月份新车销量增长2.8%,纯电销量飙升23.6%
  • 鲁比奥称短期无法达成协议美方可能退出俄乌谈判,美媒爆:美施压对象主要是乌克兰
  • 阿联酋总统与俄罗斯总统通电话,讨论加强双边关系
  • ETF日报:AI可能延续其去年来的趋势,继续成为今年的投资主线之一
  • 对话智元合伙人姚卯青:具身智能淘汰赛即将开启
  • 或因关税遭“血洗”,美国共和党人开始担忧中期选举
  • 水杨酸护肤头部品牌博乐达陷“内斗”,天猫旗舰店已停运
  • 关键词: