北大发布“中华民族语言文字接触交融大数据模型”
创始人
2025-12-18 13:55:51
0

活动中,孔江平介绍北大语言学实验室相关研究成果。澎湃新闻记者 程婷 图

12月16日—19日,北京大学举行北京大学语言学实验室成立一百周年系列活动。活动中,“中华民族语言文字接触交融大数据模型”成果发布。

据北大语言学实验室主任、北大中文系教授孔江平介绍,北大语言学实验室是集科研、教学、社会服务于一体的多学科交叉平台,其前身是1925年成立的北大语音乐律实验室。2021年12月,北大语言学实验室获批为教育部哲学社会科学实验室。在教育部经费的支持下,2022年春北大语言学实验室启动了“中华民族语言文字接触交融大数据模型建设”项目。该项目组织国内12所大学和科研机构的约20名专家的研究团队,近200名博士生和硕士生,对中华民族语言文字接触交融情况进行了大规模的田野调查,历经四年,初步完成了基础的调查工作和大型数据库建设。

此次发布的中华民族语言文字接触交融大数据模型,涉及中华民族语言文字接触交融大数据模型数据库的结构;语言活力的基础模型和算法——主要讨论语言活力的基本要素和分类方法;文字活力的基础模型和算法——主要讨论语言活力的基本要素和分类方法;中华民族语言文字接触交融大数据模型的内容和形式——主要讨论数据库的形式;中华民族语言文字接触交融通用语言词汇模型与算法——主要讨论词汇的语意结构、相关的基本算法和分类的方法;中华民族语言文字接触交融音位系统相似度模型与算法——主要讨论利用音位系统相似性来对语言进行分类。该大模型的建设,有助于让沉睡在田野中的即将消亡的声音活起来、传承下去。

孔江平介绍,在该项目中,除了大数据模型以外,主要成果还有关于中华民族语言文字接触交融的系列书籍。按语言接触和融合的实际,该系列书籍共分为十七卷,将于明年陆续出版。

此外,北大语言学实验室还在“人类语言涌现和演化研究”“语言障碍与教育公平研究”和“基于人工智能的语言应用研究”等方向上开展了多项重大课题的研究。本次活动期间,有声博物馆项目建设同步启动。

北大党委副书记姜国华表示,北大语言学实验室是文理学科交叉创新的典范,希望实验室继续传承科学方法传统,主动服务国家战略,做文明火种的守护者、交叉创新的开拓者、立德树人的践行者和中国学派的建构者。

教育部语言文字应用管理司司长杨鸿表示,北大语言学实验室积极服务国家语言文字重大战略任务与需求。他希望北大继续以中文系和语言学实验室为重要阵地,进一步深耕国家通用语言文字推广普及、引领语言文字数智变革、厚植复合型人才沃土,为构建新时代语言文字事业高质量发展体系作出更大贡献。

教育部语言文字信息管理司司长刘培俊表示,在智能时代,语言文字已成为大语言模型以及人工智能技术创新的数据要素、智能基座和战略基础。期待北大语言学实验室未来在国家标准研制、关键技术攻关、跨学科协同等方面发挥更大作用,有效赋能经济社会发展。

相关内容

最新资讯

旗第一中学与内蒙古师范大学附属... 12月17日,土左旗第一中学与内蒙古师范大学附属中学举行合作续建签约活动。 据了解,根据续建协议,...
香港殉职消防员何伟豪设灵,李家... 中新社香港12月18日电 (记者 韩星童 李志华)在香港大埔宏福苑火灾中殉职的消防员何伟豪,18日在...
羡慕!在弥勒这2所学校读书太欢... 2025年12月18日《弥勒新闻》视频,时长13分47秒 新闻视频内容提示 1.市委常委会召开会...
亲爱的考研er:祝你铮铮,祝你... 从晨光熹微到暮色沉沉, 小馆见证了考研人日复一日的坚持与付出。 那些早起的清晨、寒风中的诵读、 自习...
英伟达成为唯一能免费提供AI模... 一个从太空乘彗星来到地球的外星人俯视下来,会发现这里有一家极具影响力和知名度的软件公司叫做英伟达,而...
《时刻V播》20251218:... 全天资讯,尽在时刻V播! 【省内消息】 ·12月18日,2025三湘民营企业百强榜发布。三一集团有限...
【注意】2026年4月自考难度... 距离2026年4月报考不到三个月。想要冲刺4月自考的同学是不是还没想好选什么专业呢?怕自己选的专业很...
创建可复制的幸福学校——202... 廿载育才路,五载焕新程。北京东方红学校自2005 年建校,历经二十年积淀,于 2020年开启全面转型...
扎哈罗娃回答总台记者提问:海南... 当地时间12月18日,俄罗斯外交部发言人扎哈罗娃在当日的简报会上回答总台记者提问。当被问及就在自由贸...
上海骨干教师来克开展示范教学 12月11日,克拉玛依市南湖小学内书香氤氲、研讨热烈,一堂聚焦“双新”课改的全市小学语文公开课在此拉...