-
题名汉语词的概率语法属性描述
被引量:6
- 1
-
-
作者
俞士汶
段慧明
朱学锋
-
机构
北京大学计算语言学研究所
-
出处
《语言文字应用》
CSSCI
北大核心
2001年第3期21-26,共6页
-
文摘
现代汉语词的语法属性研究”是中国国家哲学社会科学基金在“九五”期间支持的语言学科重大课题“信息处理用现代汉语词汇研究”中的一个子课题 ,本文首先介绍这个子课题的主要研究内容 ,即以《现代汉语语法信息词典》的己有成果为基础 ,以大规模真实语料的统计数据为依据 ,用概率值重新描述词的语法属性。然后介绍这个子课题已经取得的成果 。
-
关键词
现代汉语
词汇
词类
语法属性
概率语法属性描述
-
Keywords
contemporary Chinese, lexicon, parts of speech, grammatical attribute of words, probable grammatical attribute description
-
分类号
H08
[语言文字—语言学]
-
-
题名“现代汉语词的语法属性描述研究”的目标与进展
被引量:1
- 2
-
-
作者
俞士汶
朱学锋
-
出处
《语言文字应用》
CSSCI
北大核心
2000年第1期24-26,共3页
-
-
关键词
现代汉语
信息处理研究
词
语法属性描述
-
分类号
H109.4
[语言文字—汉语]
-
-
题名现代汉语名词语法属性的计量研究初探
被引量:2
- 3
-
-
作者
王萌
俞士汶
段慧明
孙薇薇
-
机构
北京大学计算语言学研究所
-
出处
《中文信息学报》
CSCD
北大核心
2008年第5期22-29,38,共9页
-
基金
国家973课题资助项目(2004CB318102)
-
文摘
以《现代汉语语法信息词典》中语法属性的概率化描述为目标,基于1998年上半年《人民日报》标注语料,对名词语法属性的概率化进行了初步的实验研究。首先,考察了名词与数词、名词与量词搭配的相关属性,引进"分散度"概念,利用它对"数名"结构进行了定量分析;其次,考察了名词受不同量词修饰的分布情况。最后,把实验结果与《现代汉语语法信息词典》的相应属性进行了比照和分析,在属性概率化的同时也对其正确性进行了验证。
-
关键词
计算机应用
中文信息处理
现代汉语
现代汉语语法信息词典
概率语法属性描述
基本标注语料库
“数名”结构
“数量名”短语
-
Keywords
computer application
Chinese information processing
contemporary Chinese
the grammatical knowledge-base of contemporary Chinese
description of probabilistic grammatical attribute^POS tagged corpus
"numeral- noun" structure
"numerallassifier-noun" phrase
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名《现代汉语语法信息词典》的新进展
被引量:9
- 4
-
-
作者
俞士汶
朱学锋
王惠
-
机构
北京大学计算机系计算语言学研究所
-
出处
《中文信息学报》
CSCD
北大核心
2001年第1期59-64,F003,共7页
-
基金
国家社科基金 !( 97@yy0 0 1-6)
国家自然科学基金! ( 69973 0 0 5)
+1 种基金
国家 973项目! (G 19980 3 0 50 7-4 )
北京大学985项目
-
文摘
:《现代汉语语法信息词典》是面向汉语信息处理的基本语言知识库。 1995年 11月底通过技术鉴定。 5年来 ,北大计算语言学研究所在应用、推广的同时 ,仍把重要的力量投入词典本身的发展。至目前为止 ,词典收词已由 5万条增加到 7.3万条 ,并且全部完成了归类 ;为了处理未定义词 ,还开发了一个全新的语素库 ;词语语法属性描述中的瑕疵得到了进一步的修正 ,新增了 2 0多个语法属性项目和大量的实例。
-
关键词
中文信息处理
语法属性描述
语言知识库
语素库
《现代汉语语法信息词典》
语法属性项目
-
Keywords
Chinese information processing
contemporary Chinese
grammatical attribute description
grammatical knowledge base
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-