blog
2025-08-14

Meta华人天才毕树超「叛逃」预言:OpenAI未竟交


新智元报道

编辑:KingHZ

【新智元导读】AGI不是未来,它已到来。十年前,他嗤之以鼻;如今,他赌上职业生涯。Meta科学家毕树超揭秘AI进化真突破:更好更快造数据。 在哈佛大学的演讲,他还揭秘下一个万亿级AI机会。

今年6月,华人AI研究员毕树超在哥伦比亚大学和哈佛大学发表演讲,讲述了在过去十年中,他如何从怀疑AGI逐渐转变为对AGI的日渐痴迷。

最近,他分享了在哈佛大学的演讲内容。


两次演讲主题一致,内容类似,关于硅基智能的过去、开放问题和未来。


从OpenAI离职后,毕树超加入了Meta的超级智能实验室,他已经分享过哥伦比亚大学的演讲:

有趣的是,在哈佛演讲最后,有人提了一个问题:

如果您在「AI原生交互」领域创业,您会押注于哪些多模态基础技术?未来两年最大的机遇在哪里?

确切的答案,毕树超承认自己不知道,即便知道了也不会公之于众。

不过他还是回顾了历史,指出了两个历史性突破:

(1)GUI(图形用户界面),催生了个人电脑;

(2)多点触控,催生了移动设备。

如果有人能基于人工智能找到下一个人机交互方式,那将是一家价值万亿美元的公司。而且他非常肯定地给出了宝贵的洞见:

语音和视觉将成为其中的一部分。它必须非常接近人类自然的交互方式。

AI狂飙史

首先,他介绍了从2012年AI日新月异的进步,抛出一条清晰而震撼的「AI进化时间线」——十年,人工智能完成了一次从蹒跚学步到奔跑跃迁的蜕变。


2012年,AlexNet横空出世,「大数据+算力」一击击碎了数十年手工特征工程的神话。

2013年,Word2Vec出现,引爆「万物皆向量」革命。


单词成了可以计算距离的向量,语义之间有了坐标系。

推荐系统、搜索引擎瞬间换了玩法——YouTube的算法,也从此学会了更懂你。

2015年,两个名字写进了深度学习的骨骼——Adam优化器ResNet残差网络

前者像是给训练提速的涡轮,让模型跨数据集稳定奔跑;

后者则打通了「神经网络的任督二脉」,让深度从十几层飙到上百层不再是奢望。

2017年,Transformer来了。它像一座跨领域的超级枢纽,不仅颠覆了NLP,更成了多模态模型的核心骨架。从此,机器开始学会「长篇大论」,并且「举一反三」。

2019年,Rich Sutton总结了《苦涩的教训》:利用算力,一般的方法终将压倒性胜过人工工程。


随之而来的,是被毕树超反复强调的——Scaling Law

更多数据、更多参数、更多算力,性能就能稳步上升。而且,不只是稳步。

当增长跨过某个临界点,模型会突然「开窍」:会推理、会诊断、会用你意想不到的方式解决问题。


这不是魔法,而是数学与算力堆叠出的质变。

过去十年,AI像婴儿学会了走路;未来十年,它可能会跑得比任何人都快。

强化学习:DeepMind的时代

历史回顾的第二部分,毕树超把视线从自监督学习转向强化学习(RL),故事同样惊心动魄。

2015年,DeepMind推出DQN,AI第一次能从原始像素里学会玩街机游戏。没有规则输入,没有人类提示,靠奖励信号驱动,正如孩子在不断尝试中学会骑车一样。。

接着,世界震惊于AlphaGo。先从人类棋谱起步,再靠自我对弈疯狂磨炼,最终击败围棋世界冠军。它的升级版AlphaGo Zero更狠——彻底抛开人类经验,从零起跑,却跑进了人类棋史的巅峰。

那被称为「神之一手」的第37手,成了载入史册的AI时刻。

AlphaZero则把这一套搬到国际象棋和将棋,全面碾压顶尖棋手。而在棋盘之外,OpenAI将强化学习的战场搬到3D即时战略——Dota 2。最终,他们的AI团队击败了世界级职业战队。


看似风光无限,但毕树超直言——这些都是「单项冠军」。

它们在特定任务上超人,却无法迁移到更多领域。围棋高手不会自动变成医生,AI亦然。

转折出现在预训练+人类反馈强化学习(RLHF)的结合。


ChatGPT就是这样炼成的:

先让模型吸收海量知识,再用人类偏好做微调,让它不仅聪明,还更懂交流、更贴近人类思维。

结果?一场爆发。原本低调的研究预览,迅速变成全球现象级产品,每周吸引5亿+用户。

毕树超提醒,强化学习是AI可无限扩展的两条路径之一(另一条是自监督学习)。既然预训练的规模已被推到极限,下一步,就是在强化学习上同样拉满算力。

开放问题

数据决定智能

当话题进入演讲的第二大部分,毕树超的语气陡然凝重——这一次,他谈的不是AI的辉煌战绩,而是挡在前面的瓶颈

他指出了关键问题:「别以为只要有更大的模型和更多的算力,AI就能无限变强。有一样东西,比算力更稀缺——高质量数据。」

数据红利,正在消耗殆尽

在过去十年里,我们喂给AI的是人类几千年来积累的知识宝库:书籍、论文、代码、图片、视频、网页……这些数据像肥沃的土壤,让模型在短短几年长成参天大树。

但毕树超警告,这块土壤正在快速流失。

高质量、结构化、真实、有深度的信息,正一点点耗尽。等到库存见底,光有更大的「树」和更强的「阳光」(算力),也长不出新枝。

他直言,这是一个全行业即将面对的「隐形天花板」。

突破口I:让AI自己造数据

解决之道?

毕树超抛出第一个突破口——AI像人类一样,通过与环境互动生成新数据


人类的学习过程不是坐在教室里背完所有书,而是边做边学。我们在尝试、失败、修正中获得经验,再把这些经验传递给别人。

「为什么不能让AI也这样做?」他问。

强化学习中的自我博弈(self-play)已经证明了这一思路:

AlphaGo Zero就是在与自己下棋的过程中,不断创造并吸收新局面,从而突破人类经验的边界。


如果AI可以在虚拟环境、模拟实验、甚至真实世界的机器人平台上持续生成并验证数据,它就能摆脱「吃老本」的命运。

「用算力换数据——这是我们唯一能让曲线继续向上的方法之一。」毕树超强调。

突破口II:让学习更高效

第二个突破口,是数据效率

人类只需看几局棋,就能学会规则并进行策略思考;而大模型往往要消耗百万、千万级的样本,才能掌握类似的技能。


原因何在?

毕树超给出两点:

  • 泛化能力——人类会迁移推理模式。学会数独的逻辑,可能帮你下棋时提前几步预判。

  • 学习粒度——人类学习的是「概念」,而不是逐字逐句的「下一个词」。同一个意思有成千上万种说法,人类不需要全部记住,而模型却在消耗大量资源去拟合这些表述。

「这就像你要学游泳,不是去背所有水花的形状,而是直接掌握漂浮和划水的原理。」他形象地说。

如果模型能直接学习概念和关系,而非表面符号,数据需求将骤降,学习速度也会飞跃。

安全与对齐,难度最高的关口

即便解决了数据问题,毕树超提醒,还有另一道高墙——安全与对齐


他将其分为三层:

  • 内容安全:避免生成有害信息。

  • 滥用防护:防止被恶意利用。

  • 内在对齐:确保AI的目标与人类价值观一致

前两层已有较成熟的技术与策略,但第三层,才是真正的硬骨头。

未来:AI无处不在

当演讲进入展望部分,毕树超开始描绘一幅气势恢宏的未来图景——AI将全面渗透社会的每个角落,重塑我们的生活、工作与认知。

智能体:AI时代的手机

毕树超预言,推理能力的进步将让AIAgent像空气一样无处不在。

它们会在办公室帮你做研究、写报告,在家中帮你管理日程、照顾孩子的学习。

「想象一下,身边有一个随时待命的超级助理,永不疲倦,从不忘事。」

这不是奢侈品,而会像智能手机一样普及。

AI for Science:颠覆科研范式

他将科研形容为「在一片浩瀚的可能性海洋中寻找珍珠」。


而AI的搜索能力,将让我们一次网下去,就捞起整串珍珠。

药物研发不再耗费十年,可能几个月就能找到候选分子;

材料科学可以在模拟中直接筛出最佳配方;

像AlphaFold这样的突破将成为常态。

毕树超甚至说,科学家未来可能会有属于他们的「AlphaGo时刻」——突然看到AI给出一个人类几代人都没想到的解法。

AI移掉两座大山:教育与医疗

教育领域的变革同样惊人。

AI可以让任何人无障碍进入新领域,也可以为顶尖学者量身打造最优学习路线。

「也许未来,一个人5年内可以完成10个博士课题,」毕树超半开玩笑地说,「前提是他真的愿意学。」


这不仅意味着效率,更意味着教育公平的真正可能——偏远地区的孩子,也能享受世界顶级的教学资源。

AI让好医生触手可及。

他相信,AI能为更多人带来高质量的医疗服务,尤其是在医生资源匮乏的地区。

一个普通诊所可能会有AI诊断系统,能像经验丰富的医生一样识别病情,还能实时参考全球最新的医学研究。

「很多人的第一位好医生,可能会是AI。」

具身智能:人类伸向宇宙的触角

毕树超将目光投向更远——具身智能(Embodied AI)。它不仅是机器人在仓库里搬货,更是能进入深海、火山、甚至外太空的探索者。


在那些人类无法生存的地方,它们可以代替我们采集数据、建造设施,甚至开启跨星际的「殖民」尝试。

「人类的触角,会通过它们伸向整个宇宙。」

演讲人简介

目前,毕树超是Meta超智能实验室研究员,RL/后训练/智能体;之前,在OpenAI研究多模态和RL。


他联合创建了GPT-4o的实时语音界面,主导了OpenAI的多模态后训练。

他的工作让人工智能能够像人类一样说话——富有情感、自然且即时。

可以把他看作是未来 AGI 助手的声音设计师。

他也曾经在谷歌从事数据科学。

他是浙江大学理学学士(竺院工高班),加州伯克利大学理学博士,大数据资深从业者与实践者,专注大规模机器学习和统计模型在互联网与金融领域的应用。

曾在硅谷联合创立大数据公司,基于谷歌, Facebook和Twitter数据指导广告投放策略与监控广告投放效果。实用主义的数据科学家,深层次去伪存真地理解数据价值。

参考资料:

https://www.youtube.com/watch?v=OB9AIHTP5JM


来源于:https://www.163.com/dy/article/K6UITA1E0511ABV6.html    如有侵权请联系我们