-
题名人机共生时代的语言数据问题
被引量:10
- 1
-
-
作者
李宇明
-
机构
北京语言大学语言政策与标准研究所
-
出处
《华中师范大学学报(人文社会科学版)》
北大核心
2023年第5期135-143,共9页
-
基金
国家社会科学基金重点项目“中国学前儿童语料库建设及运作研究”(19AYY010)
国家社会科学基金重大项目“新时代中国特色语言学基本理论问题研究”(19VXK06)
国家社会科学基金重大项目“‘两个一百年’背景下的语言国情调查与语言规划研究”(21&ZD289)。
-
文摘
人类不断创造各种语言技术以辅助语言应用、改善语言生活,从结绳记事、表意图画到文字的创制、印刷术的应用、广播影视的普及,而今进入了以互联网和语言智能为代表的现代语言技术阶段。“人-人”直接交际方式逐渐减少,“人-机-人”的间接交际方式成为常态,未来正在进入为人类配备AI助手的“人机共生”时代。以ChatGPT为代表的语言大模型是人类语言技术发展到今天的高峰,显示了大数据、特别是语言数据的强大功能;而语言大模型在语言表达中所表现出的知识缺陷,是网络上缺乏专门领域、特殊人群、特殊场景、非通用语种等“特域数据”造成的。数据,包括语言数据,已成为新科技发展的关键要素和现代经济的生产要素,必须通过法律法规、规范标准对数据进行管理,通过数据市场促进数据的生产、流通和利用,通过数据公司有规划地集聚“特域数据”以有效弥补网络数据之缺,通过语言智能教育来促进公民具有适应AI助手的能力,通过就业市场预测机制及时将劳动力转移到新技术催生出的新岗位。数据管理应宽严适度,既要尽力促进语言智能发展,又要保证技术向善,使其在伦理学的轨道上前进。
-
关键词
语言技术
语言数据
语言智能
AI助手
语言伦理
-
Keywords
language technology
language data
linguistic intelligence
AI assistants
linguistic ethics
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
F49
[经济管理—产业经济]
-
-
题名民族地区法制领域的语言需求与语言服务
被引量:1
- 2
-
-
作者
陈丽湘
-
机构
教育部语言文字应用研究所
北京语言大学中国语言政策与标准研究所
-
出处
《辽宁师范大学学报(社会科学版)》
2020年第1期119-125,共7页
-
基金
国家社会科学基金一般项目“基于领域知识图谱构建的中国少数民族语言热点与前沿问题研究”(17CY044)
-
文摘
领域语言政策是国家管理领域语言生活的重要方式,也是检验国家语言文字政策是否完善的重要观测点。在我国少数民族地区,双语审判已纳入了法治的轨道,法制领域对双语服务人才的需求迫切。本研究基于中国少数民族语文政策知识库,梳理法制领域的语言政策;从网络新闻信息中综合分析民族地区对双语法制人才的关注及需求;并从语言服务的理念和视角,思考在我国民族地区的法制领域如何更好地提供语言服务。
-
关键词
领域语言政策
法制领域
语言服务
双语法官
-
Keywords
domain language policy
legal field
language service
bilingual judge
-
分类号
H195
[语言文字—汉语]
-
-
题名“中文+X”的类型及“工具语言”问题
被引量:2
- 3
-
-
作者
李宇明
李艳华
-
机构
北京语言大学语言政策与标准研究所
北京语言大学国际中文教学研究所
-
出处
《世界汉语教学》
北大核心
2024年第2期147-159,共13页
-
基金
国家社科基金重大项目“‘两个一百年’背景下的语言国情调查与语言规划研究”(项目编号:21&ZD289)
教育部中外语言交流合作中心2023年国际中文教育研究课题重点项目“英语加勒比国家国民教育体系内中文教学质量提升路径研究”(项目编号:23YH08B)的资助。
-
文摘
“中文+X”由专门用途中文教育发展而来,是国际中文教育的重要发展趋势之一。“中文+X”中的X可以细分为四类:X_(1)=专业、X_(2)=技能、X_(3)=职业、X_(4)=职业教育。X既是学生学习的对象,也与将来要从事的工作相关。“中文+X”中的“中文”具有工具语言的性质,其功能是帮助学生学习X或从事X,分为“一般中文”和“专业中文”两部分。“中文+专业”的教育功能在科技、文化领域,有助于高等教育走出去。“中文+技能/职业/职业教育”的教育功能在经济领域,有助于促进学习者、学习者所在的国家或地区的经济发展,有助于中国产业、产品、技术标准、职业教育走出去,有助于中外经贸合作。“中文+X”将为国际中文教育开辟新天地,推动国际中文教育发展到新阶段。
-
关键词
中文+X
中文+专业
中文+技能
中文+职业
中文+职业教育
专门用途中文
工具语言
-
Keywords
Chinese+X
Chinese+major
Chinese+skill
Chinese+occupation
Chi-nese+vocational education
Chinese for Specific Purposes
tool language
-
分类号
H195
[语言文字—汉语]
-
-
题名新世纪专门用途中文的发展动力、现状与趋势
- 4
-
-
作者
李艳华
李宇明
-
机构
北京语言大学国际中文教学研究所
北京语言大学语言政策与标准研究所
国家语委中国语言文字规范标准研究中心
-
出处
《首都师范大学学报(社会科学版)》
北大核心
2024年第2期87-96,共10页
-
基金
教育部中外语言交流合作中心2023年国际中文教育研究课题重点项目(23YH08B)
北京语言大学院级科研项目(中央高校基本科研业务费专项资金)(21YJ010105)
北京语言大学2023年国际中文教育教改一般项目(GJG202336)的资助。
-
文摘
进入21世纪,在自驱力--中文学习者学习需求多元化和他驱力--经济动力和政策动力的合力作用下,专门用途中文进入内涵式发展的新阶段,呈现出新特点,并有进一步提升的空间。新世纪专门用途中文教材在编写数量、编写团队、教材性质和编写原则等方面取得显著成效;专门用途中文教学法与具体学科相结合进行创新性探索;专门用途中文大纲以考试大纲为主,编制领域不断拓展,职业中文系列标准接续推出;专门用途中文语言测试已在商务和医学领域有成功经验,并将朝着系统化、专业化、科学化、产业化的方向推进;专门用途中文师资以中文教师为主,专门院校和职业院校的师资力量不断充实进来。今后专门用途中文的发展在理论层面和实践层面都呈现出良好态势,并需在参与主体、依托形式和发展模式等方面深入探索,努力实现深层次、高水平的可持续发展。
-
关键词
专门用途中文
学习需求多元化
内涵式发展
发展趋势
-
分类号
H195
[语言文字—汉语]
-
-
题名人机共生时代的语言数据问题
- 5
-
-
作者
李宇明
-
机构
北京语言大学语言政策与标准研究所
-
出处
《新华文摘》
2024年第5期112-115,共4页
-
文摘
人类的语言发展和语言应用,是与语言技术相依相伴、相辅相成的。人类不断创造着语言技术,利用语言技术促进语言应用,同时也促进着语言自身的进步、人类语言能力的进步和社会进步。而今语言技术已经发展到语言智能阶段,“人-机-人”交际成为主要交际方式,具有一定“语言能力”的“AI助手”开始进入人类生活,人类正在进入“人机共生”的新时代。
-
关键词
交际方式
语言智能
相依相伴
语言数据
人机共生
相辅相成
时代
能力
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于70年报刊语料的现代汉语历时稳态词抽取与考察
被引量:6
- 6
-
-
作者
饶高琦
李宇明
-
机构
北京语言大学对外汉语研究中心
北京语言大学语言政策与标准研究所
-
出处
《中文信息学报》
CSCD
北大核心
2016年第6期49-58,共10页
-
基金
国家社科基金(12&ZD173)
国家社科基金(16AYY007)
+3 种基金
国家语委科研项目(YB125-42
ZDI135-3)
863计划重点项目(SQ2015AA0100074)
教育部人文社科重点研究基地重大项目(16JJD740004)
-
文摘
该文基于70年跨度的历时报刊语料库,使用九种统计方法计算了词语历年的使用情况,并通过对稳定性、覆盖度和时间区分性能的考察筛选获得了规模为3 013词的历时稳态词候选词集。该词集中动词与名词各占约三分之一(其余为形容词、副词与虚词),平均词长约1.7字,前密后疏地分布于历时语料库总频序表的前7 609位,覆盖了总语料的近九成。该部分词语中包含大量构造句子结构的核心词语。它们塑造了稳态词在词长和词类上的特性。稳态词的提取可以加深对语言生活底层与基础词汇的认识,对汉语教学、中文信息处理和语言规划都具有重要意义。
-
关键词
稳态词
历时语料库
语言监测
-
Keywords
steady-state word
diachronic corpus
language monitoring
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于词汇聚类方法的现代汉语分期与分期体系构建
被引量:3
- 7
-
-
作者
饶高琦
李宇明
-
机构
北京语言大学对外汉语研究中心
北京语言大学语言政策与标准研究所
-
出处
《中文信息学报》
CSCD
北大核心
2017年第6期18-24,共7页
-
基金
北京市语言资源高精尖创新中心项目(TYR17001J)
北京语言大学校级项目(中央高校基本科研业务费专项基金)(17PT05
+2 种基金
16YBB16)
国家语委重点规划项目(ZDI135-3)
教育部人文社科重点研究基地重大项目(16JJD740004)
-
文摘
当前对现代汉语史的研究多借用政治-社会史的分期方式将现代汉语分为新文化运动至1949年、1950—1966年、1967—1976年和1977—至今四个时期,并在这一基础上开展了许多研究。语言尤其是书面语虽然与社会政治生活有密切联系,但语言系统有其自身的演化规律。从语言数据出发对语言进行分期是更加合适的选择。该文将语言的分期问题视作历时语料的分期问题,进而成为历时文本的聚类问题。该文工作基于历时报刊语料库遴选出的时间敏感程度较好的词汇。使用机器学习领域中广泛使用的K均值和期望最大算法进行聚类,以该部分词汇频率为特征对70年跨度(1945—2015)的历时报刊语料进行聚类,并在不同的聚类数量下绘制了具有层次性的词汇使用分期树。据此构建了过去70年现代汉语的词汇层次分期模型,揭示了改革开放的开始作为词汇使用变迁最重要分水岭的地位。
-
关键词
现代汉语
分期
词汇
历史演变
聚类
-
Keywords
modern Chinese
epoch division
lexicon
diachronic evolation
clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名“别解”造词理据及规范问题分析
被引量:2
- 8
-
-
作者
刘楚群
-
机构
教育部语言文字应用研究所
北京语言大学中国语言政策与标准研究所
-
出处
《江西师范大学学报(哲学社会科学版)》
2013年第6期52-56,共5页
-
基金
国家社科基金一般项目"新词语规范及科学语言规范观研究"(编号:13BYY059)
国家社科基金重大项目"新时期语言文字规范化问题研究"(编号:12&ZD173)
江西省社会科学"十二五"(2011)规划项目"新词语构造理据的多视角研究"(编号:11WX29)
-
文摘
别解造词是近年来新出现的一种修辞造词的方式。其存在并流行的理据主要涉及两方面:语言本身内在的理据、社会文化方面的外在理据。语言理据包括语义别解、语法别解、语音别解、字形别解,其社会文化理据包括一定的逻辑基础、"陌生化"的美学特征、凸显个性的时代文化以及网络媒介的助推。在新词语规范中要注意避免别解造词的低俗化和随意性。
-
关键词
新词语
别解
修辞造词
词语规范
-
Keywords
new words
"Bie Jie"
rhetorical word - building
criterion of words
-
分类号
H102
[语言文字—汉语]
-
-
题名推普脱贫有关问题探讨
被引量:24
- 9
-
-
作者
陈丽湘
魏晖
-
机构
教育部语言文字应用研究所
北京语言大学中国语言政策与标准研究所
-
出处
《语言文字应用》
CSSCI
北大核心
2019年第3期2-11,共10页
-
基金
国家社会科学基金项目(批准号18BYY062)阶段性成果
-
文摘
本文阐述了推普脱贫的意义,从语言与经济、语言与教育、语言与人力资本的关系等角度对推普助力扶贫进行机理分析,并对推普脱贫的路径进行了初步探讨。
-
关键词
推普脱贫
语言经济
语言政策
语言资源
-
Keywords
Putonghua-promotion-oriented poverty alleviation
language economy
language policy
language resources
-
分类号
H002
[语言文字—语言学]
-
-
题名基于量范畴的让步复句的重新分类
- 10
-
-
作者
刘昌华
-
机构
北京语言大学中国语言政策与标准研究所
扬州市职业大学人文学院
-
出处
《南昌师范学院学报》
2015年第4期119-122,共4页
-
文摘
主观量的知识和集合的知识,可以用来刻画成一个公式模板,来确立让步复句的新的分类标准,按照集合A中元素的多少,即按照让步分句可容纳量的多少,将让步复句分为四大类:其一,全量让步复句,包括"虽然…但是…"类复句和"即使…也…"类复句。其二,极量让步复句,包括"无论…都…"类复句和"任凭…都…"类复句。其三,双量让步复句,指"宁可…也…"类复句。其四,单量让步复句,包括"P倒P…就是…"类,"P倒不/没P…只是…"类和"…是…,但…"类复句。
-
关键词
让步复句
新分类标准
新分类量范畴
集合
-
Keywords
concessive complex sentences
new classification standard
new classification quantity category
set
-
分类号
H043
[语言文字—语言学]
-
-
题名语言地理学的性质透视和方法实践
- 11
-
-
作者
张驰
-
机构
北京语言大学语言政策与标准研究所
-
出处
《语言历史论丛》
2015年第1期140-165,共26页
-
文摘
本文针对学界近年来“语言地理学”和“地理语言学”的术语争论,通过对语言地理学性质的重新认识,我们认为语言地理学在性质上应归属于地理学的门类之下。由此使我们能够看到,语言地理学的研究目标是要揭示语言与空间中要素之间的相关性,并以空间观和区域观建立起相应的研究范式。在这样一种地理学眼光的统摄之下,以GLOTTOGRAM法为例,通过对特定区域内方言状况的分析,来实践语言地理学的一些理论和方法。
-
关键词
语言地理学
性质
方法
GLOTTOGRAM法
-
Keywords
Linguistic-geography
property
methods
GLOTTOGRAM
-
分类号
H004
[语言文字—语言学]
-
-
题名“全球汉语中介语语料库建设和研究”的设计理念
被引量:24
- 12
-
-
作者
张宝林
崔希亮
-
机构
北京语言大学中国语言政策与标准研究所
北京语言大学学校办公室
-
出处
《语言教学与研究》
CSSCI
北大核心
2013年第5期27-34,共8页
-
基金
国家社会科学基金项目(批准号:11BYY054)
教育部哲学社会科学研究重大课题攻关项目(批准号:12JZD018)的资助
-
文摘
目前,汉语中介语语料库建设迎来了一个蓬勃发展的重要时期。同时,语料库建设中还存在着种种问题,尚不能满足教学与研究的多方面需求。针对这些问题,我们提出了"全球汉语中介语语料库建设和研究"的课题,力图通过该课题的实施,进一步推动语料库的建设与发展。该课题的主要创新点是:(1)理念创新:建设最好最大的语料库,实现最充分的资源共享,全心全意地为全世界的汉语教学与研究服务;(2)内容创新:在建设语料库的过程中,进行汉语中介语语料库建设的本体研究,提高语料库建设水平;(3)方式创新:全球汉语学界携手共建,基于web的语料协同标注平台,以及"搭积木式"的动态建设策略等。
-
关键词
汉语中介语语料库建设
本体研究
全球共建
资源共享
-
Keywords
the construction of inter-language corpus of Chinese
ontology research
globalcooperation in the construction of corpus
resource sharing
-
分类号
H195
[语言文字—汉语]
-
-
题名日本汉诗集《怀风藻》用韵研究
- 13
-
-
作者
崔蒙
-
机构
北京语言大学语言政策与标准研究所
-
出处
《语言历史论丛》
2015年第1期82-97,共16页
-
文摘
日本最早汉诗集《怀风藻》是古代日本人创作中国诗歌的第一个成果。诗集一方面在用韵上模仿当时的中国音韵,另一方面受到日语汉字音影响,在合用上呈现出不同于中国诗歌的特点。
-
关键词
日本汉诗
怀风藻
诗韵
-
Keywords
Kanshi poems
KaiFuSoh
rhyming
-
分类号
I313.072
[文学—其他各国文学]
-
-
题名中国少数民族语文政策知识库的构建及应用
- 14
-
-
作者
陈丽湘
-
机构
教育部语言文字应用研究所
北京语言大学中国语言政策与标准研究所
中央民族大学国家语言资源监测与研究少数民族语言中心
-
出处
《语言政策与规划研究》
2016年第2期75-87,98,共14页
-
基金
国家语委十二五科研规划项目“少数民族语言文字政策法规研究及知识库构建”(项目编号:YB125-198)的阶段性成果
-
文摘
本研究对少数民族语文政策知识库的构建过程、主要功能进行介绍;并通过具体实例展示如何利用领域知识库的知识信息进行语文政策扩散分析、历程分析。研究结果期待能在为语言政策和语言规划研究提供良好服务的同时,为语言文字政策的研究提供新的研究视角和方法论的参考。
-
关键词
少数民族语文政策
知识库
知识扩散
发展历程
-
分类号
H002
[语言文字—语言学]
-
-
题名论汉语的外语角色
被引量:37
- 15
-
-
作者
李宇明
唐培兰
-
机构
北京语言大学语言资源高精尖创新中心
北京语言大学中国语言政策与标准研究所
-
出处
《语言教学与研究》
CSSCI
北大核心
2020年第5期17-30,共14页
-
基金
国家社会科学基金重点项目(批准号19AYY010)的支持
-
文摘
本文目的是阐发“外语角色理论”,并以此审视汉语70年来所扮演的外语角色,明确汉语国际教育当前的主要任务和长远发展目标。某种外语对外语国所发挥的作用称为“外语角色”,主要有六大类:A.外事外语;B.领域外语;C.泛领域外语;D.基础教育外语;E.重要外语;F.语言。A—F依次形成外语角色梯级。决定外语角色、外语角色梯级及外语角色进阶、退阶的因素主要有:1.本土国的综合实力;2.外语国与本土国的关系。此外,外语国的外语教育传统、世界语言风尚等也可成为影响因素。汉语作为外语,其角色已经经历了外事外语、领域外语、泛领域外语,正在进入基础教育外语阶段。目前,已有70国把汉语纳入基础教育体系,但是其汉语教育总体上还处在初级水平。当前的主要任务,是要有明确的国别意识和国别发展方案,整合各种力量推进汉语在海外基础教育领域的发展。同时也要为汉语将来承担“重要外语”这一新角色做准备,这也是汉语国际教育的发展方向。根本上说,汉语国际教育就是促进汉语成为世界的“重要外语”,成为人类可以方便使用的公共产品。汉语进入世界各国的基础教育,是实现这一目标的必需的重要的一步。
-
关键词
汉语国际教育
外语角色
基础教育外语
重要外语
人类公共产品
-
Keywords
TCSOL
foreign language roles
foreign languages in basic education system
important foreign languages
human public product
-
分类号
H195
[语言文字—汉语]
-
-
题名与杜道生先生二三事
- 16
-
-
作者
张维佳
-
机构
北京语言大学中国语言政策与标准研究所
-
出处
《语言历史论丛》
2014年第1期10-14,共5页
-
文摘
夜深了,我辗转反侧难以入眠,几次点灯阅读网上有关百岁“汉字守护人”恩师杜道生先生仙逝的消息,从先生读书的往事一幕幕浮现在眼前。20世纪80年代中期,我从中学教师任上考入四川师范大学汉语研究所攻读汉语史专业的硕士学位。复试那天,几位老先生——冉友侨教授、刘君惠教授、杜道生教授、郭诚永教授、张振德教授正襟危坐在我的面前.
-
关键词
研究所
师范大学
先生
一幕幕
读书
有关
教授
守护人
专业
-
分类号
K825.5
[历史地理—历史学]
-
-
题名甘肃省宕昌县之“宕”变读成因
- 17
-
-
作者
张维佳
-
机构
北京语言大学语言政策与标准研究所
-
出处
《语言历史论丛》
2015年第1期98-110,共13页
-
文摘
甘肃宕昌县“宕昌”读音问题近十年来颇受当地政府关注,“宕昌”当地人读[t‘an51 t■‘a?55],与标准语读音有别,从历史音变角度看,其读音变化中隐含非常重要的音变规则,因此其读音审音问题值得研究。
-
关键词
宕昌
变读
历史音变
审音
-
Keywords
Dangchang
sound shift
historical mutation
Middle Chinese
-
分类号
H11
[语言文字—汉语]
-