-
题名基于文本特征的短文本倾向性分析研究
被引量:7
- 1
-
-
作者
程南昌
侯敏
滕永林
-
机构
中国科学院自动化研究所模式识别国家重点实验室
中国传媒大学国家语言资源监测与研究中心有声媒体语言中心
-
出处
《中文信息学报》
CSCD
北大核心
2015年第2期163-169,共7页
-
基金
国家语委十二五规划重点项目(ZDI125-3)
-
文摘
语篇倾向性分析是倾向性分析的较高层次领域。根据文本篇幅和结构可以将语篇分为短文本和长文本。该文以网络商品评论作为样本研究短文本倾向性分析的特点和策略。根据倾向极性在文中的决定性因素的不同表现,短文本可以分为含显性归总句、含隐性归总句、含特征词以及一般文本四类,针对不同类别文本采用不同的处理策略。在此基础上,运用词典、规则的方法构建了语篇倾向性分析系统CUCsas,该方法在第四届中文倾向性分析评测(COAE2012)中取得了较好成绩。
-
关键词
短文本
文本特征
归总句
倾向性分析
词典与规则
-
Keywords
short text
textual characteristics
summary sentencer attitude analysis
dictionary and rules
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于归约的汉语最长名词短语识别方法
被引量:4
- 2
-
-
作者
钱小飞
侯敏
-
机构
上海大学文学院
中国传媒大学国家语言资源监测与研究中心有声媒体中心
-
出处
《中文信息学报》
CSCD
北大核心
2015年第2期40-48,共9页
-
基金
上海市高校青年教师培养资助计划(shu11053)
国家语言资源监测与研究中心科研项目(YZYS08-04)
-
文摘
该文提出了最长名词短语(MNP)的操作性定义,分析了其构造和分布特征,并设计了一种基于baseNP归约的识别方法,利用MNP结构特性及起始有定成分、语义核心等语言学特征,缓解了最长名词短语长距离依赖与模型观察窗口受限的矛盾。开放测试取得了88.68%的正确率和89.21%的召回率;归约方法全面提升了识别性能,特别是将多词结构的调和平均值提高1%,优化幅度达6%以上,并且对长距离复杂结构有着更好的识别效果。
-
关键词
最长名词短语
识别
归约
基本名词短语
-
Keywords
maximal noun phrase
recognize
reduction
baseNP
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-