中国中文信息学会

当前位置：首页 > 学术会议

中国大模型大会“大模型+民族语言”专题论坛

来源：民族语言文字信息专业委员会发布时间：2024-06-21

6月18日-19日，由中国中文信息学会主办的“中国大模型大会”在北京成功举办。6月19日，大会围绕“中国大模型之路”主题展开研讨，设置了12场大模型专题论坛，其中 “大模型+民族语言”专题论坛由少数民族语言文字信息专委会承办，该论坛共邀请了3位专家学者做特邀报告，并举办了题目为“多语言生成式大模型技术的现状和趋势”专题讨论，论坛特别邀请到西藏大学尼玛扎西院士作为嘉宾参加专题研讨。

图1 尼玛扎西院士参与专题研讨环节

同济大学王昊奋教授以“大数据驱动的民族语言大模型：关键技术与应用展望”为题进行了报告。报告首先回顾了大语言模型的崛起；其次，从提升工程、知识增强、检索增强和智能中控四个方面讲解了增强大模型的关键技术；再从现有大语言模型民族语言能力现状、大语言模型的缺陷与民族语言视角以及结合增强大模型关键技术对民族语言大模型进行了初步探索；最后从OpenKG和民族语言模型方面开展的工作对民族语言大模型进行了展望。

2024-06-21 11.26.14.png

图2 同济大学王昊奋教授做题为“大数据驱动的民族语言大模型：关键技术与应用展望”的报告

哈尔滨工业大学车万翔教授以“多语言大模型的原理与应用”为题进行了报告。报告指出多语言大模型关键是跨语言对齐和知识共享，再围绕着这两个核心的问题，首先分析了参数微调对齐和参数冻结对齐的多语言大模型对齐技术；其次结合自己的工作从少数民族语言预训练模型、基于多语言预训练模型的对话语言理解、基于编码转换的跨语言对话理解、基于对比学习的跨语言对话理解、基于一致性正则的跨语言模型、基于多语言大模型的思维链推理等方面介绍了多语言大模型的应用；最后展望了多语言大模型的未来。

2024-06-21 11.26.43.png

图3 哈尔滨工业大学车万翔教授做题为“多语言大模型的原理与应用”的报告

北京大学冯岩松副教授以“大语言模型如何学习新语言？”为题进行了报告。报告分析了目前民族语言属于“低资源语言”的情况，为了做好“大语言模型+低资源语言”的工作，报告从有限资源收集与利用、语言知识运用、模型能力融合等几个方面讨论了大模型时代如何促进低资源语种智能信息处理的相关研究。

截屏2024-06-21 11.27.04.png

图4 北京大学冯岩松副教授做题为“大语言模型如何学习新语言？”的报告

“多语言生成式大模型技术的现状和趋势”专题讨论由中央民族大学赵小兵教授主持，邀请了尼玛扎西院士（西藏大学）、王昊奋教授（同济大学）、车万翔教授（哈尔滨工业大学）、冯岩松副教授（北京大学）、孙媛教授（中央民族大学）、杨雅婷研究员（中国科学院新疆理化技术研究所）、于永斌副教授（电子科技大学）七位特邀嘉宾。与会嘉宾纷纷发言，在介绍各单位于大模型方面开展的工作基础上，围绕着多语言大模型的现状和趋势开展了热烈讨论。

截屏2024-06-21 11.27.22.png

图5 专家与听众互动

截屏2024-06-21 11.27.42.png

图6 “多语言生成式大模型技术的现状和趋势”专题讨论

本次论坛不仅促进了各单位在“大模型+民族语言”领域的深入研讨，也为大模型时代民族语言怎么开展工作，开展什么工作等提供了很好的思路。

上一篇：第十届全国少数民族自然语言处理青年论坛(MNLP 2024)在锡林浩特市顺利召开

下一篇：开放注册|第十届全国少数民族自然语言处理青年论坛（MNLP2024）

返回列表