-
题名基于决策树的汉语基本名词短语识别
被引量:3
- 1
-
-
作者
孟迎
冯丽辉
赵铁军
-
机构
昆明理工大学信息与技术学院
哈尔滨工业大学计算机科学与技术学院
-
出处
《黑龙江工程学院学报》
CAS
2004年第2期1-4,共4页
-
基金
国家自然科学基金资助项目(60373101)
863计划支持项目(2002AA117010-09)
-
文摘
提出了一种基于汉语树库,采用决策树的方法识别汉语基本名词短语。其核心思想为:从语料库中自动抽取基本名词短语的词性模板以及其相应的上下文信息,采用ID3算法形成相应的决策树。该方法有效地引入了学习机制,提高了系统的性能和识别速度,具有较好的精确率和召回率。
-
关键词
汉语基本名词短语
决策树
语料库
-
Keywords
Chinese base noun phrase
decision tree
corpus
-
分类号
H085
[语言文字—语言学]
-
-
题名汉语基本复合名词短语语义关系知识库构建与识别
被引量:2
- 2
-
-
作者
张文敏
李华勇
邵艳秋
-
机构
北京语言大学信息科学学院
-
出处
《中文信息学报》
CSCD
北大核心
2019年第12期28-36,共9页
-
基金
国家自然科学基金(61872402)
教育部人文社科规划基金(17YJAZH068)
北京语言大学校级项目(中央高校基本科研业务费专项资金)(18ZDJ03)
-
文摘
汉语复合名词短语因其使用范围广泛、结构独特、内部语义复杂的特点,一直是语言学分析和中文信息处理领域的重要研究对象。国内关于复合名词短语的语言资源极其匮乏,且现有知识库只研究名名复合形式的短语,包含动词的复合名词短语的知识库构建仍处于空白阶段,同时现有的复合名词短语知识库大部分脱离了语境,没有句子级别的信息。针对这一现状,该文从多个领域搜集语料,建立了一套新的语义关系体系,标注构建了一个具有相当规模的带有句子信息的基本复合名词语义关系知识库。该库的标注重点是标注句子中基本复合名词短语的边界以及短语内部成分之间的语义关系,总共收录27007条句子。该文对标注后的知识库做了详细的计量统计分析。最后基于标注得到的知识库,使用基线模型对基本复合名词短语进行了自动定界和语义分类实验,并对实验结果和未来可能的改进方向做了总结分析。
-
关键词
汉语基本复合名词短语
语义关系体系
定界识别
-
Keywords
Chinese basic compound noun phrases
semantic relational system
delimitation recognition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-