-
题名语义相关度算法在主题抽取中的适用性研究
被引量:2
- 1
-
-
作者
裘江南
罗志成
叶鑫
-
机构
大连理工大学管理学院
武汉大学信息资源研究中心
-
出处
《情报学报》
CSSCI
北大核心
2009年第1期34-39,共6页
-
基金
国家社会科学基金(批准号:07CTQ006),辽宁省自然科学基金(2051066).
-
文摘
语义相关度的计算方法在信息检索、文本挖掘和自然语言处理等方面有着广泛的应用,而其算法种类很多,这些算法针对不同的应用环境具有不同的适用性。本文汇总了多种语义相关度的计算方法,首先全面地概括分析了各类方法的特点,并以应急预案的主题抽取为背景,通过各种语义相关度算法在基于词汇链的主题抽取中的应用,研究了各种算法对主题抽取效果的影响,从而对各种算法在主题抽取中的适用性给出了相应的评价。
-
关键词
语义相关
主题抽取
词汇链
-
Keywords
semantic relatedness, subjects extraction, lexical chain
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
H146.3
[语言文字—汉语]
-
-
题名基于词汇链的应急预案主题抽取方法研究
被引量:5
- 2
-
-
作者
裘江南
罗志成
王延章
-
机构
大连理工大学管理学院
武汉大学信息资源研究中心
-
出处
《情报学报》
CSSCI
北大核心
2008年第6期891-896,共6页
-
基金
国家社会科学基金资助项目(批准号:07CTQ006)
-
文摘
本文针对应急预案自动主题抽取的需求,采用词汇语义相关度计算的方法,构建了一个基于词汇链算法且符合人的主观感受的主题抽取模型。模型根据应急预案文本的特点,运用了自然语言处理技术,改进了原始的词汇链生成算法,提出了一种多因素词语权重算法。通过与人工抽取主题词的实验结果相比较,该主题提取模型在查全率和查准率上都取得了较好的效果。
-
关键词
主题抽取
词汇链
语义相关
应急预案
-
Keywords
subject extraction, lexical chain, semantic relatedness, emergency plans
-
分类号
G250.73
[文化科学—图书馆学]
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于事实知识的实体相关度计算方法
- 3
-
-
作者
孙叔琦
孙珂
赵世奇
李生
王海峰
杨沐昀
-
机构
哈尔滨工业大学计算机科学与技术学院
百度
-
出处
《中文信息学报》
CSCD
北大核心
2016年第3期178-186,共9页
-
基金
国家自然科学基金项目(61272384
61370170
61105072)
-
文摘
在近来出现的面向实体的搜索服务中,准确地预测实体间的相关程度是至关重要的。该文提出了一种基于实体的事实知识,即利用"实体—属性—属性值"(SPO)记录进行实体相关度计算的方法。该文通过基于属性和属性值的两步概率估计,将实体表示为一个属性值词的概率分布列,并通过比对两个实体共享的属性值词汇得出二者的相关度。实验表明,在用于面向实体搜索的相关实体排序问题上,该文方法达到了80.9%的平均top-5准确率,优于词袋方法和基于查询日志共现的方法。此外,该文通过定量分析,考察了不同领域的用户需求特性对实体相关度计算结果的影响。
-
关键词
实体相关度
实体—属性—属性值(SPO)记录
用户需求
面向实体的搜索
-
Keywords
Entity relatedness, subject property-object (SPO) record, user demand, entity-oriented search
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-