-
题名多种语义特征在突发事件新闻中的共指消解研究
被引量:3
- 1
-
-
作者
庞宁
杨尔弘
-
机构
太原科技大学应用科学学院
北京语言大学国家语言资源监测与研究中心平面媒体语言分中心
-
出处
《中文信息学报》
CSCD
北大核心
2014年第1期26-32,共7页
-
基金
山西省自然科学基金(2012011011-4)
-
文摘
提高突发事件应对的关键在于快速地收集和提取相关新闻报道中的有用信息,共指消解是信息提取研究的重要子任务。该文采用最大熵模型对汉语突发事件新闻报道中的共指现象进行消解,综合对比了语义类特征、语义角色特征,以及基于维基百科的语义相关特征,重定向特征及上下文特征在测试集上的效果。实验结果表明,除单纯使用语义角色特征会使系统F值下降1.31%以外,其余各种语义知识对共指消解模型的结果均有所提高。
-
关键词
中文信息处理
突发事件
共指消解
语义特征
最大熵模型
-
Keywords
Chinese information processing
paroxysmal event
coreference resolution
semantic features
maximumentropy model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名媒体5年词语使用情况调查分析
被引量:3
- 2
-
-
作者
杨尔弘
-
机构
北京语言大学国家语言资源监测与研究中心平面媒体语言分中心
-
出处
《北华大学学报(社会科学版)》
2011年第4期26-33,共8页
-
基金
教育部语言文字信息管理司与北京语言大学共建项目"语言资源建设与监测研究"的阶段性研究成果之一
-
文摘
以《中国语言生活状况报告》(2005-2009卷)所反映的国家语言资源监测与研究中心对5个年度的媒体用字用语调查情况为依据,对媒体词语调查的技术支持进行了分析,历时地比较了5个年度媒体词语的使用情况,包括年度词语的出现种类、使用频率的分布与变化情况,并从年度间共用、频率变化角度分析了词语的稳定使用分和动态变化情况;通过对比分析年度词语使用的特色,反映社会生活对词语使用的影响;将媒体使用的词语与已有的词典进行对比,反映稳定使用的词语在语料中的分布情况,为频率词典的研究提供参考。
-
关键词
中国语言生活状况报告
动态流通语料库
词语
-
Keywords
The Annual Report of the Language Situation in China
Dynamic circulating corpus
Words
-
分类号
H00
[语言文字—语言学]
H136
[语言文字—汉语]
-
-
题名事件信息结构分析
被引量:6
- 3
-
-
作者
杨尔弘
曾青青
李婷婷
-
机构
北京语言大学国家语言资源监测与研究中心平面媒体语言分中心
首都体育学院国际教育学院
-
出处
《中文信息学报》
CSCD
北大核心
2012年第3期92-97,共6页
-
基金
国家社科基金资助项目(06YY047)
-
文摘
该文通过考察事件词在文本篇章结构中的分布方式,指出突发事件新闻报道文本中包含主线信息链和副线信息链。主线信息链中包含了文本的事件信息,是事件信息提取重点考虑的文本内容部分;副线信息链则由文本结构中的"评价"、"背景"以及"情节"部分的细节信息等组成,是事件信息提取时可以忽略的文本内容部分。事件信息的结构可以进一步分解为前核心事件链、核心事件链、次生事件链和后次生事件链。该文通过定义事件词,以其为触发,探索了事件信息结构的识别与获取,并借助《知网》(HowNet)提高了事件词对信息刻画的有效性和区分度。
-
关键词
事件词
事件信息结构
主线信息链
副线信息链
-
Keywords
event word
event information structure
the main information chain
the second information chain
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-