这一围棋AI,有何不同?
创始人
2025-06-03 08:10:39
0

近日,在上海市宝山区智慧湾科创园里,上演了一场人与AI大模型的围棋“智斗”。

这个大模型名为书生·思客(InternThinker),由上海人工智能实验室开发,它在围棋任务上具备较强的专业水平,还能运用自然语言就对弈过程进行“解说”。

现场排队等待与书生·思客对弈的小朋友很多,原计划下午5点结束的活动延迟半小时收摊,成为整个展厅最晚“撤退”的展台之一。

拍摄:陈蒋逸

自2016年AlphaGo四比一战胜李世石,随后又三比零战胜当时世界排名第一的柯洁后,各类围棋AI竞相涌现,如国内较为知名的绝艺、星阵、Katago等。书生·思客有何不同之处?

工作人员介绍, 相较于直接用围棋棋盘状态训练人工智能的路径,书生·思客要将搜索过程的状态建模转化为语言建模让机器学习,而语言建模的训练计算量大大增加

训练大模型围棋能力的挑战不止于此。上海人工智能实验室青年研究员李林阳表示:“飞、虎、粘、长等围棋术语是从棋盘画面出发去理解的,而大模型学习下棋时只能根据坐标而非画面来学习,其难度堪比‘盲棋’,即不看棋盘来模拟下棋。”

围棋这项古老的运动也被称为“手谈”,即棋手通过棋盘的落子表达自己对棋局的看法,仿佛用手在棋局中“交谈”。“盲棋”则是对局者之间没有棋盘,完全依靠报出棋盘上的坐标来落子,挑战更大。

据悉,为保证训练效果,上海人工智能实验室研究团队构建了一个“加速训练营”(InternBootcamp),通过对评价建模,与大模型进行交互并提供反馈,从而使大模型持续进化,获得解决复杂推理任务的能力。通过该方法,书生·思客已实现在奥赛级数学、科学对象理解与推理、算法编程、棋类游戏、智力谜题等多个专业任务同步学习演进,并在多任务混合强化学习过程中出现智能“涌现时刻”(在单一任务中,无法成功推理得到奖励的模型,通过多个任务混合的强化学习,能够在训练过程中成功得到奖励,实现领域外专业任务的有效强化学习训练)。

在实操中,书生·思客在与展台的儿童对弈时,均占上风。

拍摄:陈蒋逸

李林阳表示,团队最主要的目标并不在于棋力的提升,而是为了锻炼大模型的推理能力、逻辑思维,如此后续可以期待大模型完成更多专业的任务。

“我们将这样专业的能力融合在通用模型里,它就会有更泛化的通用能力。”李林阳说。

这种“通专融合”技术路线由上海人工智能实验室率先提出并不断探索。从大模型发展历程看,主要分化为专业性和通用泛化性两大路线。实验室致力于解决大模型高度专业化和通用泛化性相互制约的发展困境,期待模型不仅在广泛的复杂任务上表现出色,还能在特定领域中达到专业水平。

工作人员告诉记者,在通用大模型的专业任务探索上,起码针对围棋这一任务,书生·思客大模型已经超越不少国内外主流大模型,是首个既具备围棋专业水平,又能展示透明思维链的大模型。

作者:霍星羽 陈蒋逸(实习生)

相关内容

最新资讯

戴北方被查 澎湃新闻记者 岳怀让 12月15日,中央纪委国家监委网站发布消息:广东省深圳市政协原党组书记、主席戴...
【夜读】一个与孩子沟通的“密码... 55387 一个有效沟通的“密码” 你有没有算过,一天之中,对孩子说了多少句话?又有多少句,真正被孩...
《怦然心动》导演夫妇遇害,警方... 当地时间12月14日,曾执导《当哈利遇到莎莉》、《怦然心动》、《遗愿清单》等影片的美国知名导演罗布·...
济南艺考生文化课培训心态调整指... 在济南,艺考生们怀揣着艺术梦想,一路披荆斩棘,历经专业考试的洗礼后,又迎来了文化课培训这一关键阶段。...
高校交流 | 我校学生委员会赴... 中国政法大学学生委员会 北京师范大学学生会 高校学生组织交流活动顺利举办 ★ 为贯彻落实学联学生会组...
25版金版学练优四年级上册语文... 亲爱的同学们好,这里是小学课堂秘籍 今天为大家分享:这份四年级上册语文练习资料,以 “素养导向的大单...
喜报!鱼台特教排舞创造历史全国... 近日,在江苏仪征举行的第八届全国特殊教育学校排舞公开赛圆满落幕。来自全国40多支代表队、800余名特...
岳峰小学开展安全应急演练暨“消... 鲁网12月15日讯 近日,岳峰小学开展安全应急演练暨“消防设施我会用,关键时刻能救命”安全教育活动。...
天津市首届基础教育学生创新能力... 天津北方网讯:12月9日至10日,由天津市教育科学研究院德育与教育心理研究所(拔尖创新人才早期培养研...
筑牢校园防毒墙!白沙镇禁毒课堂... 为进一步加强校园禁毒宣传教育,提升青少年学生识毒、防毒、拒毒意识与能力,12月10日,白沙镇综治中心...