-
题名文档相似度综合计算研究
被引量:43
- 1
-
-
作者
宋玲
马军
连莉
张志军
-
机构
山东大学计算机科学与技术学院
山东建筑工程学院计算机科学与技术系
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第30期160-163,共4页
-
文摘
论文对几种传统的、具有代表性的文档相似度的计算方法进行了综述,并分析了各自的应用局限性。针对结构化描述的科技论文的特点,提出一种能综合文档特征信息、上下文领域知识和引用关系的新相似度计算算法,并通过原型系统讨论其有效性。
-
关键词
对象相似性
引文图
结构上下文相似性
层次域结构
-
Keywords
objects similarity,citation graph,structural context similarity,hierarchy domain structure
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名话题句识别中候选话题句评估函数的优化
被引量:3
- 2
-
-
作者
蒋玉茹
宋柔
-
机构
北京工业大学计算机学院
北京信息科技大学计算机学院
北京语言大学信息科学学院
-
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2014年第1期43-48,共6页
-
基金
国家自然科学基金资助项目(61171129)
北京市属高等学校创新团队提升计划资助项目(IDHT20130519)
-
文摘
为了更好地解决汉语标点句句首话题缺失的问题,需要在话题句识别过程中优化用于评估候选话题句优劣的评估函数.为此,提出了话题句生成的上下文相似性特征、话题串与评述相邻接的局部相似性特征,并设计了相关的评估函数.实验结果表明:综合运用这2个评估函数,话题句识别的准确率提高了5.72个百分点.
-
关键词
广义话题
话题句
相似度
上下文相似性
局部相似性
-
Keywords
generalized topic
topic clause
similarity
context similarity
local similarity
-
分类号
U461
[机械工程—车辆工程]
TP308
[自动化与计算机技术—计算机系统结构]
-