题名 基于缩略语分析的中文报道关系识别研究
1
作者
王凤玲
机构
菏泽学院计算机与信息工程系
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第18期164-166,共3页
文摘
分析中文缩略语的构词方式,定义2个词之间的词形相似度,提出一种基于最长字符串匹配的相似度计算方法,探讨该方法在中文报道关系识别系统中的应用。实验结果表明,该相似度计算方法能够改善中文报道关系识别系统的性能,使系统的归一化检测开销降低12.96%,取得较好的识别效果。
关键词
报道关系识别
话题检测与跟踪
缩略语
归一化检测开销
相似度计算方法
Keywords
report link recognition
topic detection and tracking
abbreviation
normalized detection cost
similarity computation method
分类号
N945
[自然科学总论—系统科学]
题名 基于内容分析的报道关系识别方法研究
2
作者
王凤玲
机构
菏泽学院
出处
《西藏大学学报(社会科学版)》
CSSCI
2012年第2期71-75,87,共6页
文摘
话题检测与跟踪是当前自然语言处理领域的一个研究热点,而报道关系识别是其中的一项基础研究内容。为了得到高性能的报道关系识别算法,必须充分挖掘新闻报道中包含的信息。文章在分析了英语新闻报道书写特点的基础上,提出了基于内容分析的报道关系识别算法,算法中将新闻报道表示成两个向量空间模型。实验结果表明,文章提出的基于内容分析的报道关系识别算法不但简单易行,并能大大改进报道关系识别的性能。
关键词
话题检测与跟踪
报道关系识别
内容分析
错误检测开销
Keywords
Topic detection and tracking
Story linked detection
Content analysis
Detection error cost
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 基于SVM的中文报道关系识别方法研究
被引量:3
3
作者
王强
张永奎
机构
山西大学计算机与信息技术学院
计算智能与中文信息处理省部共建教育部重点实验室
出处
《计算机工程与应用》
CSCD
北大核心
2008年第33期141-143,共3页
基金
国家自然科学基金No.60475022
山西省自然科学基金No.20041041
山西省回国留学人员基金(No.2002004)。~~
文摘
针对网络新闻的特点,从人名、时间名、地点名、组织机构名、内容五个方面抽取特征词形成特征向量。在此基础上,分别进行了相似度计算,其中,人名、组织机构名、内容采用余弦夹角的方法,时间和地点向量,相似度计算采用了引入报道时间和关联度计算。最后,使用这5个相似度作为特征,使用SVM进行训练,并在测试集上进行了测试。测试结果表明,这种方法可以有效地改善系统的性能。
关键词
报道关系识别
话题检测与跟踪
多向量表示模型
Keywords
story link detection
topic detection and tracking
multi-vector mode
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于话题要素相似度计算的报道关系识别方法
4
作者
赵艳
戴播
濮小佳
袁春风
机构
南京大学计算机软件新技术国家重点实验室
出处
《计算机应用与软件》
CSCD
2010年第1期35-37,64,共4页
基金
国家863高科技重点项目(2006AA010109)
国家自然科学基金(60673043)
文摘
报道关系识别是话题识别与跟踪TDT(Topic Detection and Tracking)研究内容中的基本任务之一,根据新闻话题的几大要素:时间、地点、人物、内容等,提出了一种基于话题要素的话题报道表示模型,并给出了基于话题要素相似度计算的报道关系识别方法。实验证明这种方法特别适用于同主题下不同话题的报道关系识别。
关键词
话题识别 与跟踪
报道关系识别
话题要素
相似度计算
Keywords
Topic detection and tracking Story link detection Topic elements Similarity calculation
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于要素提取关联词对的中文报道关系检测
被引量:2
5
作者
陈智敏
蒙祖强
林啟锋
机构
广西大学计算机与电子信息学院
出处
《计算机应用》
CSCD
北大核心
2013年第1期182-185,共4页
基金
国家自然科学基金资助项目(61063032)
广西自然科学基金资助项目(2012GXNSFAA053225)
文摘
针对现有中文报道关系检测的检测代价即误报率和丢失率较高的问题,在多向量空间模型基础上提取不同向量的要素(时间、地点、人物和内容)特征词组成关联词对,使用支持向量机(SVM)方法整合关联词对相似度和余弦相似度,从而提出了一种提取要素关联词对报道关系检测方法。所提方法补充表示了报道内容,为检测提供了更多的比较依据,识别代价降低了将近11%。实验结果验证了算法的有效性。
关键词
报道关系识别 检测
关联词对
报道 要素
多向量空间模型
Keywords
story link detection
correlative word
story elements
multi-vector space model
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP301
[自动化与计算机技术—计算机系统结构]