
林俊旸夜发文“告别”千问,在AI圈中引起山地风云,也让“周浩”这个名字参加公众视线。
2026年1月,周浩低调加入阿里,站不是通义实验室,而是先挂靠在夸克。
在夸克少顷过渡之后,周浩飞速转入通义实验室,接替同日去职的后历练厚爱东谈主郁博文,讲演线径直拉到阿里云 CTO、通义实验室厚爱东谈主周靖东谈主。
周浩本科毕业于科学时间大学,2019年在威斯康星大学麦迪逊分校获得机器学习与筹备机视觉向的博士学位,随后在Meta作念了段AI基础推敲,蕴蓄了大限制模子历练的工程劝诫。
的确让他成名的地是DeepMind。
自从加入DeepMind以后,周浩在那边路升至主任推敲科学(Senior Staff Research Scientist),这是谷歌推敲体系中少数东谈主能涉及的别。
同期周浩也成为了Gemini强化学习与自我矫正(RL & Self-Improvement)团队的厚爱东谈主。
从Gemini 1.5到现如今的Gemini 3 Pro,周浩参与了谷歌旗舰大模子中枢的研发责任。
那么周浩能为千问带来什么?
谜底藏在他昔日几年在DeepMind里作念的事情里。
01
周浩有什么本?
2023年,在Gemini 1.0的时间陈述中,周浩担任“Gemini App Factuality Co-Lead”(Gemini APP事实联厚爱东谈主)这职位,他的中枢职责是保险Gemini面向C端用户的输出事实准确,输出的信息准确、可靠,不会“本矜重地瞎掰八谈”。
说白了便是让模子从后历练到落地,总计历程里减少幻觉。
个模子不错在学术benchmark上跑出漂亮的分数,但要是它在复兴“今天天气怎样样”时造谣数据,在法律问答时援用不存在的法条,那这个模子便是灾荒。
传统的作念法是过后检测。也便是让模子先生成谜底,然后用另个系统去给仍是生成好的谜底进行考据。
但这种法资本、蔓延大,何况很难消散总计场景。
周浩和团队在Gemini上作念的事实责任,是从模子历练和强化学习的泉源首先。
通过联想门的励函数和历练策略,让模子在生成每个token的时候,就内化了“事实准确”这个管制。
这不是通俗地让模子记着多学问,而是让模子学会诀别“我知谈的事实”和“我不笃定的测”,在不笃定的时候主动镌汰置信度,以致拒复兴,而不是硬着头皮瞎编。
这套事实保险体系的果,体当今了Gemini的施行发达上。
时间陈述中指出,Gemini Ultra在MMLU(大限制多任务讲话意会)基准测试中获得了90.04的准确率,成为个越东谈主类水平(89.8)的AI模子。
MMLU涵盖数学、物理、历史、法律、医学、伦理等 57 个学科域无锡钢绞线用途,是忖度模子学问广度和准确的基准。
焦虑的是,时间陈述极端强调Gemini模子在事实关连任务上展现出“exceptionally strong performance on factuality”(在事实面发达畸形强壮),这径直考据了周浩团队在期骗层面事实保险责任的成。
要是说在Gemini 1.0时期,周浩处治的是“怎样让AI知道到不实”,那么到了2024年,周浩算作中枢孝顺者参与的VideoPrism,它处治的便是“怎样让AI看懂”。
这篇论文本色上是构建了个基础编码器,大略处理从科学到监控摄像等种种内容。
以前的AI“看”,其实是把拆成帧帧的图片分别看,就像把部电影剪成几千张截图然后逐张分析。它能认出画面里有什么,但根底不懂“前后发生了什么”。
VideoPrism则是让AI意会里的时辰流动。比如看段作念菜,它不仅知谈“这是个厨房、有个东谈主、有口锅”,还能意会“这个东谈主先切菜、然后热油、然后下锅炒”这个动作序列。
VideoPrism的中枢念念路是将大限制-文本对数据与纯数据结,通过两阶段历练,让模子同期学会语义意会和视觉细节。
阶段用对比学习让模子学会匹配和文本形色,二阶段用掩码自编码让模子学会预测中被庇荫的部分。
这个联想让VideoPrism大略从两种互补的信号中学习。文本形色提供语义信息,内容提供视觉动态信息。
在33个意会基准测试中,VideoPrism在31个上达到了能,何况用的是同个冻结模子,险些不需要针对不同任务作念适配。
这个责任被径直家具化参加谷歌的多模态体系,是Gemini意会才能的时间基石之。
周浩一样亦然Gemini 3.0的要害孝顺者(Key Contributor)。在这个模子上,他具体厚爱的是多法子强化学习(Multi-step RL),翻译成东谈主话,便是让模子在处治复杂问题时,大略进行多轮念念考、有筹商、施行、反念念的链式理才能。
Gemini DeepThink(度念念考模式)和DeepResearch(度推敲)等便是因此而来的。
无为的AI复兴问题,是“想步、说步”。你问它个复杂问题,它重新到尾生成遍谜底就完结,半途不会停驻来质疑我方。
周浩作念的事,是让AI学会“语气想好几步”。
AI会先拆解问题、制定筹划,然后步步施行,每走步齐回头查验“这步走对了吗?下步该怎样走?”。
这么来,Gemini的DeepResearch就不错帮你自动搜索几十个网页,再综搜索限度,给你写出份有逻辑的推敲陈述。而不是像其他大模子样,把搜索限度语气“喷”出来,因为它真实是在步时事念念考和有筹商。
周浩的推敲阶梯启示有条澄澈的干线。
从开动让AI我方显著什么是错的,再让AI知道到时辰序列这个综合认识,后通过多法子强化学习让AI学会有筹商和反念念。
跟着时辰的移,AI能意会的事物越来越复杂,也越来越能处治真实的用户需求。
有酷好的是,这个发展轨迹,适值便是千问接下来要走的路。
02
千问刚刚完成次时间跃迁
在我看来无锡钢绞线用途,周浩的推敲向,与Qwen 3.5 仍是走到的时间节点,酿成了度的“卡槽对接”。
Qwen 3.5在2026年2月发布,这是千问系列的新旗舰版块。它接受了混架构,结了Gated DeltaNet和寥落混(MoE)两种时间。
旗舰模子Qwen3.5-397B-A17B总参数目为3970亿,但每次理只激活170亿参数,这么的联想大略让它在保捏能的同期,资本镌汰了60,微辞量普及了8倍。
手机号码:15222026333虽说Qwen 3.5在架构和预历练上仍是作念到了全国水准,但它的后历练阶段却不够出。尤其是如何让模子的确学会理、反念念、自我纠错,这恰是千问的短板。
早在2025年5月的Qwen 3时间陈述中,钢绞线厂家Qwen团队就仍是明确暗示,自后历练阶段的强化学习“聚焦于数学和编程任务”,并在瞻望部分坦承“筹划加多强化学习算力,极端强调基于环境响应的agent强化学习系统”。
这个短板在benchmark上看得了了。
在多个能体现度理和复杂任务才能的测试中,Qwen 3.5-397B永久过时于同期发布的Gemini 3.1 Pro。
比如在GPQA Diamond(科学学问理)上,Gemini 3.1 Pro得分是94.3,Qwen 3.5只消88.4。在SWE-bench Verified(代码任务)上,Gemini 3.1 Pro达到 80.6,Qwen 3.5则是76.4。在MMLU系列测试中,Gemini 3.1 Pro的多讲话版块得分92.6,Qwen 3.5的MMLU-Pro是87.8。
两者的差距,就围聚在需要多步有筹商、器具调用与自我纠错的复杂任务上。
周浩的推敲服从刚好能补上了这个缺口。它不需要罕见的东谈主工标注数据,不需要给模子灌注多学问,就能让模子遒劲到不实在哪。
何况周浩主的多法子强化学习,也弥补了Qwen在多步有筹商上的不及。
另外,Qwen 3.5仍是具备了agent的基础才能。
2026年1月,千问App接入淘宝、支付宝、德舆图、飞猪,达成了“句话点外、订机票、叫出租”。用户不错说“帮我订张未来往北京的机票,预算2000以内,带行李额”,系统会自动比价、荐航班、跳转支付、完成出票。
但这些还相比初,像是把多个API串起来调用,而不是的确的多法子理。
要是航班取消了,AI能不可我方发现问题并切换案?要是用户说“帮我安排个周末去杭州的行程”, AI能不可我方拆解成订票、订旅店、有筹商阶梯、荐餐厅这系列子任务,然后步步施行?这些齐需要强的自我纠错和多法子有筹商才能。
此前在林俊旸的主下,Qwen 3.5还达成了原生多模态。这是种从预历练阶段开动,就把文本、图像、 token混在起进行历练的模式。
它能处理1344x1344分辨率的图片,以及60秒的片断。
这套架构和周浩在VideoPrism上作念的事情度致,他们齐是通过早期融让模子同期学会语义意会和视觉细节。周浩对这套法论的度意会,有望匡助千问在时序理、动作意会等维度上达成高出冲突。
林俊旸期间,千问团队的中枢竞争力不仅仅时间,是组织式。预历练、后历练、多模态、基础设施通盘在个团队里面闭环,交流链路短,个时间判断不错本日落地实验。
但这种“个东谈主的大脑”式的管理式,在团队限制扩大到几百东谈主之后,开动出现瓶颈。
阿里启动了官架构退换,将原来闭环的团队拆分为预历练、后历练、文本、多模态等多个平行的水平单干模块,径直辩护了原来的垂直整模式。
团队的考查逻辑也因此发生转机,中枢KPI从原来的模子能、榜单排行、开源影响力,转向了模子对集团业务的提服从、千问App的用户增长、营业化ROI。
周浩要接的,便是这么个摊子。
时间上仍是走到全国前哨,但有彰着短板;组织上从“推敲先”变成了“筹划驱动”;策略上从开源模子转向C端进口,从时间转向生存助手。
03
千问的来日是?
天然,千问团队历久处于“算力饥渴”景况。吴泳铭也在里面会议上公开谈歉,说“莫得早知谈资源的问题”。
但这仅仅里面矛盾的面,的确决定此次东谈主事变动的,是它发生的时辰节点。
如今的千问正处于策略大退换,因此,底层模子的能至关焦虑。
2025年11月,阿里将“通义”App 名为“千问”,吴泳铭躬行拍板,并在财报分析师电话会上明确表态:“阿里巴巴须要有个AI原生的C端进口。”
3月2日,就在林俊旸发一又友圈告别的前天,千问AI眼镜在 MWC 巴塞罗那众人秀,并于本日开启众人预约。
阿里里面东谈主士显露,除AI眼镜除外,千问还会在年内络续发布AI指环、AI耳机等家具,通盘面向众人阛阓发售。
“帮你就业”和“陪你聊天”,是不同的两件事,对模子来说亦然如斯。
帮用户订张机票,听起来通俗,施行上需要模子完成系列连贯动作:意会用户意图→调用德/飞猪 API→处理复返限度→识别畸形(比如航班取消)→主动建议备选案→恭候用户证明→完成支付。
任何个要害出错,用户体验就会坍塌。
这不是个聊天机器东谈主能作念到的,是以千问App 会从“对话框家具”变成“任务完成家具”。
当今开千问App,中枢交互照旧个聊天框。但有了周浩的多法子强化学习加捏之后,不错预期千问会迟滞把“就业”才能作念设立的家具模块。
不是你问它“帮我订机票”,而是它主动在你说“未来要去北京开会”的时候,自动识别出这是个需要订票、叫车、指示的复任务,并步步帮你完成,半途遭逢航班取消还能我方切换案。
这个家具时势,接近个“AI通知”。
阿里的势就在于产业链圆善,不错缝接入多样阿里系生存、购物家具,这亦然Gemini和ChatGPT咫尺齐还莫得作念到的。
同期我还觉得,千问眼镜会成为种具多情境感知才能的AI助手。
咫尺市面上大大批AI眼镜的中枢才能是“你问我答”,本色上是把手机语音助手搬到了脸上。
千问眼镜要是能把VideoPrism的时序意会才能的确落地,家具体验会有质的不同。
它不需要你启齿问,就能意会你正在作念什么、下步可能需要什么。你走进市,它知谈你在看货架。你在餐厅踌躇,它知谈你在对比菜单。
这种“主动感知、预判需求”的体验,才是AI眼镜联系于手机的确的各别化价值。
林俊旸把千问作念成了个让众人招引者尊敬的时间,那么周浩的任务,便是让千问的确信得过,不仅仅灵巧,还要稳、准、能把事办完。
相关词条:罐体保温施工 异型材设备 锚索 玻璃棉 保温护角专用胶1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》无锡钢绞线用途,以此来变相勒索商家索要赔偿的违法恶意行为。