题名 综合型语言知识库及其前景
被引量:9
1
作者
俞士汶
穗志方
朱学锋
机构
北京大学计算语言学教育部重点实验室
出处
《中文信息学报》
CSCD
北大核心
2011年第6期12-20,共9页
基金
国家自然科学基金资助项目(60970083)
国家社会科学基金资助项目(09BYY032)
文摘
北京大学计算语言学研究所自1986年起,历时25年建成综合型语言知识库(CLKB)。CLKB包括6个语言知识库、10项规范与标准、基础软件工具集和4个应用系统,它们相互支撑,形成一个有机整体。CLKB的系列化的语言知识涵盖词、词组、句子、篇章各单位和词法、句法、语义各层面,从汉语向多语言辐射,从通用领域深入到专业领域。尽管CLKB已形成阶段性成果,但它仍在发展中。该文重点介绍CLKB的语言知识库,也探讨其发展方向。
关键词
自然语言 处理
计算语言 学
语言 工程
综合型语言 知识库
现代汉语语法信息词典
Keywords
natural language processing
computational linguistics
language engineering
comprehensive language knowledge Base
grammatical knowledge-base of contemporary Chinese
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 建设综合型语言知识库的理念与成果的价值
被引量:13
2
作者
俞士汶
机构
北京大学计算语言学研究所
出处
《中文信息学报》
CSCD
北大核心
2007年第6期3-12,共10页
基金
国家973课题资助项目(2004CB318102)
文摘
积20余年之努力与锤炼,北京大学计算语言学研究所完成的一项科研成果"综合型语言知识库"于2007年2月通过了教育部组织的技术鉴定。鉴定结论认为"其规模、深度、质量和应用效果在我国语言工程实践中是前所未有的。该成果是以汉语为核心的多语言知识库建设中最全面、最重要的研究成果,总体上达到了国际领先水平"。本文在介绍以《现代汉语语法信息词典》为基础的综合型语言知识库的规模、构成、内容、品质和发展历程之后,陈述建设综合型语言知识库的理念,期望与读者分享在计算语言学和自然语言处理这一交叉学科领域内治学的心得与研发的经验。同时也对这项成果的应用实例进行分析,评估它的应用潜力,期望它在以汉语为核心的多语言信息处理事业的发展中起到铺路填坑或者投石问路的作用。
关键词
计算机应用
中文信息处理
综合型语言 知识库
多语言 信息处理
计算语言 学
自然语言 处理
现代汉语语
法信息词典
治学心得
Keywords
computer application
Chinese information processing
comprehensive language knowledge-base
multilanguage information processing
computational linguistics
natural language processing
grammatical kvowledgebase of contemporary Chinese
research experience
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 综合型语言知识库及其在语言教学中的应用
被引量:1
3
作者
俞士汶
朱学锋
机构
北京大学计算语言学教育部重点实验室
北京大学计算语言学研究所
出处
《北华大学学报(社会科学版)》
2014年第3期4-9,共6页
基金
国家973课题"融合三元空间的中文语言知识与世界知识获取和组织"(2014CB340504)
国家自然科学基金项目"汉语全文词义标注关键技术研究"(61272221)
"隐喻识别与理解的理论与方法研究"(61170163)的阶段性成果之一
文摘
自然语言处理研究的目标是让计算机学会理解和运用人类的自然语言,这就必须给计算机配备一个包含自然语言的词汇、句法、语义知识的语言知识库。北京大学计算语言学研究所(ICL/PKU)自1986年起,历时26年,研制出面向自然语言处理的"综合型语言知识库"。综合型语言知识库中的语言知识所具有的周遍性、格式化、显性化等特点,使得它能够在汉语语言教学领域发挥作用。
关键词
自然语言 处理
计算语言 学
现代汉语语法信息词典
综合型语言 知识库
语言 教学
Keywords
Natural language processing
Computational linguistics
Grammatical Knowledge-base of Contemporary Chinese
Comprehensive Language Knowledge Base
Language teaching
分类号
H087
[语言文字—语言学]
TP319
[自动化与计算机技术—计算机软件与理论]
题名 语言测试标准设定研究现状与展望
4
作者
闵尚超
沈吉利
机构
浙江大学
出处
《语言测试与评价》
2024年第1期57-68,114,共13页
基金
2022年度浙江省哲学社会科学规划“之江青年理论与调研专项课题”“语言测评标准设定模式的再审视:从安戈夫法到书签法”(课题编号:22ZJQN16YB)的阶段性成果。
文摘
本文首先简要梳理标准设定的背景,接着介绍接受型和产出型考试常用的标准设定方法以及选择方法时应考虑的因素,随后重点讨论标准设定过程中普遍存在的若干挑战,如标准设定的信度和效度问题,以及认知诊断测试、专门用途英语测试和综合型语言测试标准设定中存在的问题,并据此探讨未来的研究方向,以期对研究者有所启迪。
关键词
标准设定
语言 测试
认知诊断测试
综合型语言 测试
Keywords
standard setting
language testing
cognitive diagnostic assessment
integrated language tests
分类号
G63
[文化科学—教育学]
题名 面向自然语言处理的机器词典的研制
被引量:2
5
作者
俞士汶
朱学锋
机构
北京大学计算语言学教育部重点实验室
北京大学计算语言学研究所
出处
《辞书研究》
2019年第2期22-30,I0001,共10页
基金
中国国家自然科学基金项目"汉语抽象意义表示关键技术研究"(项目编号61772278)的支持
文摘
北京大学计算语言学研究所积30余年之努力,研制了一部面向自然语言处理的机器词典,即《现代汉语语法信息词典》(以下简称GKB)。基于GKB,又衍生了一系列成果,进而集成为综合型语言知识库。文章扼要介绍GKB及相关成果,并总结从事大型语言工程的实践经验,期望这些经验不仅对语言工程的实践者,而且对探索学科交叉融合的学者都有参考价值。
关键词
自然语言 处理
语言 工程
现代汉语语法信息词典
综合型语言 知识库
交叉学科
Keywords
natural language processing
language engineering
Grammatical Knowledge Base of Contemporary Chinese
Comprehensive Language Knowledge Base
interdisciplinary
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 从英汉语言语态上的差异看英语被动句的翻译
被引量:4
6
作者
段满福
机构
内蒙古大学外国语学院英语系
出处
《内蒙古农业大学学报(社会科学版)》
2004年第4期120-122,共3页
文摘
英语和汉语由于属于不同的语系和语言形态,因此在句型结构上存在很大的差别。本文在分析英语和汉语在使用被动语态上的差别的基础上,探讨了将英语被动句翻译成汉语的四种方法译成汉语主动句、译成汉语无主句、译成汉语判断句和译成汉语的被动句。
关键词
综合型语言
分析型语言
形合
意合
被动句
翻译
分类号
G642.0
[文化科学—高等教育学]
题名 面向语言能力提升的汉语成语知识库及其扩展
7
作者
俞士汶
罗鳯珠
朱学锋
王雷
常宝宝
机构
北京大学计算语言学教育部重点实验室
语言能力协同创新中心
元智大学中国语文学系
北京大学计算语言学研究所
北京大学外国语学院
出处
《西华大学学报(自然科学版)》
CAS
2015年第5期1-6,共6页
基金
国家重点基础研究发展计划(2014CB340504)
国家自然科学基金项目(61272221
61170163)
文摘
汉语成语知识库是北京大学计算语言学研究所研制的综合型语言知识库大家庭中的一名新成员,无论是对人还是机器的语言能力的提升,它都可以发挥作用。文章较详细地介绍汉语成语知识库的内容、构建理念和发展历程。将汉语成语知识库与台湾元智大学罗凤珠研制的诗词曲典故资料库相连接,2个知识库相得益彰。文章还提出了基于汉语成语知识库值得进一步研究的若干课题。
关键词
!综合型语言 知识库
语言 能力
成语
成语知识库
典故资料库
Keywords
Comprehensive Language Knowledge Base
language ability
idiom
Chinese Idioms Knowledge Base
allusion knowledge base
分类号
H136.3
[语言文字—汉语]
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 词汇计量研究与常用词知识库建设
被引量:5
8
作者
俞士汶
朱学锋
机构
北京大学计算语言学研究所计算语言学教育部重点实验室
语言能力协同创新中心
出处
《中文信息学报》
CSCD
北大核心
2015年第3期16-20,共5页
基金
国家重点基础研究发展计划(2014CB340504)
国家自然科学基金(61272221
61170163)
文摘
面向自然语言处理的词汇语义研究应该以词汇的计量研究为基础。该文在评述汉语词汇计量研究的主要成果以后,提出一个汉语常用词知识库的建设任务,并给出常用词表的构造性定义、词表常用性的定量评价方法以及"部件词"的概念,最后介绍现代汉语常用词知识库的总体设计和已经做的工作。期望常用词知识库的建设能为汉语词汇语义学研究、为中文信息处理事业的发展做出贡献。
关键词
汉语常用词知识库
《中国语言 生活状况报告》
综合型语言 知识库
《现代汉语语法信息词典》
部件词
Keywords
knowledge base of Chinese commonly used words
Language Situation in China
comprehensive lan-guage knowledge base
Grammatical Knowledge base of Contemporary Chinese
component word
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 《汉语高频词语法信息词典》的研制
被引量:2
9
作者
朱学锋
张化瑞
段慧明
俞士汶
机构
北京大学计算语言学研究所
出处
《语言文字应用》
CSSCI
北大核心
2004年第3期98-104,共7页
基金
本项研究得到国家 973项目 (G19980 30 5 0 1A 0 1)
86 3计划 (2 0 0 1AA114 2 10
2 0 0 2AA1170 10 )的支持
文摘
北京大学计算语言学研究所自 2 0 0 3年 1月起承担了国家重点基础研究973项目《汉语高频词语法信息词典》的研制任务 ,至 2 0 0 3年 9月已完成。本文详细介绍《汉语高频词语法信息词典》
关键词
现代汉语语法信息词典
综合型语言 知识库
Keywords
The Grammatical Knowledge base of Contemporary Chinese
Comprehensive Language Knowledge base
分类号
H125.19
[语言文字—汉语]
题名 功能语法及俄语教学
被引量:3
10
作者
谭林
出处
《中国俄语教学》
CSSCI
北大核心
1993年第4期3-7,共5页
文摘
俄语是综合型语言,词形变化非常丰富,语法结构也特别严谨。
关键词
功能语法
俄语教学
词形变化
语法错误
综合型语言
语义场
俄语语法
动词形式
语法形式
语言 规则
分类号
H35
[语言文字—俄语]
题名 关于汉语教学中的几个问题
11
作者
贺淑秀
机构
新疆财经学院
出处
《语言与翻译》
CSSCI
北大核心
1991年第1期67-66,共2页
文摘
“关于汉语教学中的几个问题”(贺淑秀)和“浅谈汉语语法教学”(周凤翔)二文,虽则谈的是预科部的汉语教学,但所谈的具体教学方法,很适用于中、小学汉语教学的需要,现将此二文刊登在“中小学汉语教学”栏,以飨读者。
关键词
汉语教学
汉字教学
具体教学方法
汉语语法
独体字
汉语语音
周凤
综合型语言
于中
形体结构
分类号
H059
[语言文字—语言学]
题名 名词作状语浅析
12
作者
李秉铨
出处
《语言教育》
1992年第11期20-21,共2页
文摘
名词在句子中可充当主语、宾语、表语等成分;状语通常是用副词或介词短语充当。而在现代英语中,尤其是在口语中,名词当状语用这一现象屡见不鲜。如:He walked two miles.miles用作状语。有人认为这是省略了介词for。其实不然,这种解释是不够准确的。这种语言现象应追溯到古英语去求解释。从英语发展的历史看,古英语是综合型语言(synthetic lan-guage),有相当完备的词形变化。名词的宾格不必借助介词,即可用作状语,故称之为“副词性宾格”(adverbial accusative)。
关键词
名词作状语
古英语
综合型语言
现代英语
词形变化
句尾
名词词组
表示方式
诺曼人
night
分类号
G6
[文化科学—教育学]