如果AI导致人类陷入灭绝危机,那将是人类的错,不是机器。若超智能诞生,人类为何会允许被接管,集体责任、治理与监管在哪里?“空间智能”或将彻底改变我们理解世界的方式。
李飞飞是斯坦福大学教授,被誉为“AI教母”。她因2006年发布的视觉数据库ImageNet而闻名,该数据库推动了AI的发展。李飞飞近日现身一档播客节目,谈论AI、空间智能以及超智能。
以下是李飞飞本次对话的文字翻译。为了篇幅和清晰度,本次对话内容经过编辑。
提问:我能从您这个行业这段非凡时期开始吗?ChatGPT向公众发布已经过去三年了。此后出现了新工具、新应用,投资金额巨大。您如何形容当下的感受?
李飞飞:AI对我来说并不新鲜。我投身这个领域已经25年,从职业生涯伊始就每天都在与之打交道。然而,当下的影响之深、之广,仍让我感到震撼,甚至有些不真实。这是一项文明级的技术。我正是推动它诞生的科学家之一,却没想到它会如此巨大。
提问:那一切是从什么时候开始改变的?是因为技术发展的速度,还是因为世界终于觉醒,把聚光灯投向了你们?
李飞飞:我觉得两者交织在一起。但我说它是文明级技术,并不是因为我们受到了关注,也不是因为它有多强大,而是因为它影响了太多人。每个人的生活、工作、福祉、未来,都会以某种方式被AI触及。
提问:也包括负面影响吗?
李飞飞:技术从来都是双刃剑,对吧?自人类文明诞生以来,我们创造的工具——也就是技术——总体上是用来行善的,但过程中可能被人蓄意滥用,也可能带来意料之外的负面后果。
提问:您提到“强大”。如今这项技术的权力掌握在极少数公司手中,其中大多数是美国公司。您对此怎么看?
李飞飞:你说得没错。大型科技公司通过它们的产品对社会影响最大。我个人希望这项技术能更加民主化。无论谁构建或掌握它,都应以负责任的方式去运用。我也相信每个人都应有能力去影响这项技术。
提问:您既是学者,也是科技公司CEO。您的公司才成立一年多,据报道估值已达十亿美元。
李飞飞:是啊!(笑)我是World Labs的联合创始人兼CEO。我们正在开拓AI的下一个前沿——空间智能。如今大家谈论的都是大语言模型,所以这个词人们听得不多。但我认为空间智能与语言智能同样关键,且互为补充。
提问:我知道您最初热爱的是物理。
李飞飞:对。
提问:那些您最钦佩的物理学家,他们的生平或工作中是什么让您超越了物理本身?
李飞飞:我在中国一个不太知名的城市长大,家庭也很普通,可以说生活圈子很小。童年简单、封闭,我是独生女。物理则恰恰相反——它浩瀚、大胆,想象力无边。仰望星空,可以思考宇宙的起源;观察一片雪花,可以深入物质的分子结构;思考时间、磁场、原子核……它把我的想象力带到此生无法抵达的地方。至今让我着迷的是,物理教会我敢于提出关于物理世界、宇宙、我们起源的最大胆、最狂妄的问题。
提问:而您自己的“狂妄之问”,我想是“什么是智能?”
李飞飞:对。从牛顿到麦克斯韦,从薛定谔到爱因斯坦——我最崇拜的物理学家——我欣赏他们各自提出的“狂妄之问”。
我也想找到自己的。大学中期,我的问题从物理世界转向了智能:智能是什么?它如何产生?最迷人的是,我们如何造出智能机器?这成了我的追求,我的北极星。
提问:那可是量子跃迁——从只会做计算的机器,到能够不断学习、持续学习的机器。
李飞飞:我喜欢你用“量子跃迁”这个物理双关。
提问:我注意到您阅读面非常广。最终突破的契机,是您开始关注心理学家和语言学家与您的领域相关的研究。
李飞飞:这就是在最前沿做科学的魅力。它是全新的,没人知道该怎么做。很自然地去研究人脑和人的心智,并从中获得灵感。我早期试图破解视觉智能难题时,一个灵感来源是研究人类的视觉语义空间如何组织。世界上有成千上万、数百万种物体,它们如何被组织?按字母?按大小?按颜色?
提问:您研究这个,是因为必须先理解大脑如何组织信息,才能教计算机吗?
李飞飞:可以这么理解。我接触到一项语言学成果,叫WordNet,它用特定分类法组织语义概念——不是视觉,只是语义或词汇。
提问:举个例子。
李飞飞:在字典里,apple(苹果)和appliance(电器)挨得很近,但在现实生活中,苹果和梨才更接近——它们都是水果,而电器则属于完全不同的类别。我灵光一闪:视觉概念的组织也许就是这样,苹果和梨的关联远大于苹果和洗衣机。更重要的是规模。当你看到语言所能描述的物体数量之庞大,会意识到我们作为智能生物,体验世界时接触的是海量数据——我们也需要赋予机器这种能力。
提问:值得注意的是,那时——世纪初——“大数据”这个概念还不存在。
李飞飞:这个词甚至还没出现。我们当时用的科学数据集非常小。
提问:多小?
李飞飞:图像方面,我们那代研究生用的数据集通常只有四到六种,最多二十种物体类别。三年后,我们做出了ImageNet:22000个物体类别,1500万张标注图像。
提问:ImageNet是一项重大突破,也是您被称为“AI教母”的原因。我想知道,是什么让您能做出别人没看到的连接?您15岁才到美国,英语是第二语言,这是否促成了您所说的那种灵感?
李飞飞:我不知道。人类创造力仍是谜。有人说AI什么都能做,我不同意。关于人脑我们仍有太多未知。我只能推测,是我的兴趣和经历共同作用。我在科学上敢于提“疯狂”的问题,不怕跳出框外。我对语言与视觉联系的敏感,也许正因我自己有学外语的经历。
提问:来美国时正值青春期,本就不易,还要克服语言障碍,那是什么感受?
李飞飞:很难。(笑)我15岁来美国,到新泽西州帕西帕尼。我们家人英语都不好。我学得还算快,但父母非常吃力。家里经济拮据,父母做收银员,我在中餐馆打工。上大学时妈妈身体不好,我们决定开家干洗店维持生计。
提问:您亲自参与?
李飞飞:我开玩笑说自己就是CEO。从18岁到研究生中期,我经营了七年。
提问:即使人不在,也远程打理?
李飞飞:对。我英语最好,所有客户电话、账单、质检都我来。
提问:这段经历教给您什么?
李飞飞:韧性。做科研也必须坚韧,因为科学之路非线性,没人有现成答案。作为移民,你也必须学会resilient(坚韧)。
提问:父母对您的期望高吗?
李飞飞:公允地说,他们没怎么逼我,不是“虎爸虎妈”,他们只想活下去。妈妈骨子里是知识分子,爱读书。但移民生活艰难,加上身体差,她根本没空管我。青少年阶段,我别无选择,要么成功,要么失败,风险极高,所以我自我驱动。我一直好奇,科学成了我的出口,也让我沉稳。我不好夜店,只爱科学。
提问:有位老师对您很重要?
李飞飞:我数学好,和数学老师Bob Sabella成了朋友,因我们都爱科幻。起初我读中文科幻,后来读英文。他看出我求知欲强,便特意创造机会。我数学跳级后没课可上,他就用午餐时间一对一教我,他并无额外报酬。那是师者之爱,亦是一种责任。他成了我生命中的贵人。
提问:他还健在吗?
李飞飞:我任斯坦福助理教授时他去世了,但他的妻儿成了我在新泽西的“家人”。
提问:他们是否帮您融入美国社会?
李飞飞:当然。他们让我看到典型中产家庭的模样,是我了解美国社会的窗口。
提问:您觉得自己能在中国拥有同样的职业生涯吗?
李飞飞:人生充满偶然,我无法假设。但不变的是好奇心,是追寻北极星。所以我相信,无论如何我都会投身AI。
提问:您仍与国内有联系吗?
李飞飞:那是我的根。我很幸运能在美国发展。如今我生活在斯坦福、旧金山、硅谷,这里非常国际化;AI这门学科也横跨全球。我更像全球公民。
提问:中国AI专利、论文数量激增,年初的Deepseek也引发关注。您怎么看中美AI竞争?
李飞飞:中国无疑是AI强国。当下公认AI领先的就是中美两国。全球很多地区都渴望在AI领域有一席之地。
提问:您说的下一个前沿“空间智能”指什么?
李飞飞:空间智能是AI理解、感知、推理并与世界互动的能力,是视觉智能的延续。我职业前半段解决“看见”问题,那是被动接收信息。而进化中,智能与行动密不可分:我们因移动而需看见,因看见而更好移动。如何建立这种连接?需理解三维空间,理解物体如何运动,理解我如何伸手抓杯——这一切的核心就是空间智能。
提问:您网站发布的Marble演示,是一个虚拟世界。它对您来说是训练AI的工具吗?
李飞飞:先澄清定义。Marble是一个前沿模型,能根据简单提示生成三维世界。比如“给我一个现代厨房”,或给一张厨房照片,它就能生成3D世界。人类天生会创造3D世界,我希望AI也能。设计师可用它构思,游戏开发者可快速获得3D场景,机器人可用它做仿真训练,也可用于AR/VR教育。
提问:我能想象阿富汗的女孩在虚拟教室上课。
李飞飞:对。或如何让8岁孩子理解“细胞”?将来我们可建一个细胞内部世界,让学生走进去,看细胞核、酶、膜——可能性无限。
提问:行业面临诸多现实问题。第一,AI会摧毁大量工作岗位吗?
李飞飞:技术会改变劳动版图。AI如此深刻,必将深刻影响就业。Salesforce CEO贝尼奥夫说,公司50%客服岗位已交给AI。确实在发生。人类每次出现更先进技术——蒸汽机、电力、电脑、汽车——都经历阵痛,也经历岗位重塑。仅讨论岗位数量增减不够,需更细致应对:个人要持续学习,企业、社会也有责任。
提问:第二,诺贝尔奖得主Geoffrey Hinton认为AI有10%–20%概率导致人类灭绝,您怎么看?
李飞飞:首先,Geoff是我25年的老友,我敬他,但我们常聊也常辩。关于“取代人类”,我尊重但不同意。不是绝无可能,而是若人类真陷危机,那将是人类自己做错,而非机器。他提的实用问题:当超智能诞生,我们如何防止它接管?我们尚无先例。我的问题是:人类整体为何会允许此事发生?我们的集体责任、治理与监管在哪里?
提问:能否给超智能设上限?
李飞飞:我相信可以确保技术在国际层面负责任地开发与使用。
提问:政府层面是通过条约吗?还是仅仅由企业同意以某种方式行事?
李飞飞:这个领域还处于起步阶段,我们还没有国际条约,也没有那种程度的全球共识。但我认为我们已经有了全球意识。我想说的是,我们不应该过度担忧AI的负面影响。这项技术非常强大。它或许会带来一些负面后果,但同时也为人类带来了诸多造福人类的应用。我们需要从整体上看待这个问题。
提问:我知道你经常与政界人士交流 。你在美国、英国、法国和其他地方都这样做过。他们问得最多的、让你感到沮丧的问题是什么?
李飞飞:我不会用“令人沮丧”这个词,我会用“担忧”,因为我认为我们关于AI的公共讨论,需要超越 “当机器统治者出现时我们该怎么办?” 这个问题。另一个常被全球家长问:AI来了,我孩子该怎么办?该学计算机吗?将来还有工作吗?
提问:您怎么答?
李飞飞:AI是强大技术,我也是母亲。最重要的是把孩子当“人”来培养:赋予主观能动性、尊严、求知欲,以及诚实、勤奋、创造、批判性思维等永恒价值。别只焦虑专业,了解孩子兴趣、个性,因势利导。焦虑无解。
提问:我还有个行业方面的问题,关于大量资金涌入像贵公司这样的企业。这会不会像互联网泡沫一样 ,出现泡沫,导致其中一些公司估值过高?
李飞飞:首先,我的公司还是初创。当我们谈到巨额资金时,我们往往会关注大型科技公司。AI仍是一项新兴技术,还有许多方面需要开发。这门科学非常复杂,取得突破需要投入大量资源。正因如此,为这些研究提供资源至关重要。另一方面是市场: 我们能否看到回报? 我相信AI的应用前景非常广阔——软件工程、创意、医疗保健、教育、金融服务——市场将会持续扩张。AI可以作为助手或协作工具,帮助人们提升福祉和生产力,满足诸多需求。我坚信,这部分市场将会不断增长。
提问:但这样做在电力、能源以及气候方面会付出怎样的代价呢?一位著名的AI企业家杰里·卡普兰表示 ,由于庞大的数据中心消耗了大量能源,我们可能正走向一场新的生态灾难。
李飞飞:这是一个很有意思的问题。为了训练大型模型,我们需要越来越多的电力或能源,但没有人规定这些数据中心必须使用化石燃料。能源领域的创新将是其中的关键一环。
提问:他们需要的电力数量如此巨大;单靠可再生能源很难满足需求。
李飞飞:目前情况确实如此。需要建设这些大数据中心的国家也需要审视其能源政策和产业结构。这为我们投资和发展更多可再生能源提供了契机。
提问:你描绘了一幅非常积极的景象。你一直走在这个行业的前沿,并且看到了更大的潜力,所以我理解你的想法。但是,你对你的行业有哪些担忧呢?
李飞飞:我既不是科技乌托邦主义者,也不是反乌托邦主义者——我其实是平庸的中间派。平庸的中间派希望用一种更加务实和科学的视角来看待这个问题。当然,任何工具落入心怀不轨之人手中都会让我担忧。自人类文明伊始,火对我们物种而言就是一项至关重要的发明,然而用火伤人却是极其罪恶的。因此,任何对AI的错误使用都令我担忧。与公众沟通方式的不当也令我担忧,因为我的确感到人们普遍焦虑不安 。
李飞飞:我唯一担心的是我们的教师。我个人的经验告诉我,他们是我们社会的脊梁。他们对培养我们的下一代至关重要。我们与他们沟通得当吗?我们是否让他们参与进来?我们的教师是否在利用AI工具来提升他们的专业能力,或者帮助我们的孩子使用AI?
提问:您今天的生活与当年在干洗店长大的日子天差地别,您意识到自己作为行业领袖的权力吗?
李飞飞:(笑)我在家仍自己洗衣服。我深知自己肩负的责任。我是将这项技术带给世界的人之一。我非常荣幸能在世界顶尖大学之一工作 ,培养未来的领导者,从事前沿研究。我深知自己既是企业家,又是AI领域最令人振奋的初创公司之一的CEO。因此,我所做的每一件事都会产生后果,这是我肩负的责任。我非常重视这一点,因为我一直告诉人们: 在AI时代,主导权应该掌握在人类手中。主导权不在于机器 ,而在于我们自己。我的机构宗旨是创造激动人心的技术,并以负责任的方式加以利用。
提问:那么,你生活中那些人,你的孩子,你不允许他们使用AI、电子设备或互联网做什么呢?
李飞飞:老生常谈:别用工具做蠢事。你必须思考你为什么要使用这个工具以及如何使用它。其实很简单, 不要因为有了AI就偷懒。如果你想理解数学,大型语言模型或许能给你答案,但这并不是学习的正确方法。要问对问题。另一方面, 不要利用AI做坏事。 例如,信息的真实性问题:虚假图像、虚假声音、虚假文本。这些问题既是AI面临的,也是我们当今社会以社交媒体为主导的交流方式所带来的。
提问:在这个瞬息万变、三年前我们都无法想象的世界里,你却在呼吁回归传统价值观。
李飞飞:你可以说它老套,也可以说它永恒。作为一名教育工作者,作为一名母亲,我认为有些人类价值观是永恒的,我们需要认识到这一点。