期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
周期分类和Single-Pass聚类相结合的话题识别与跟踪方法 被引量:28
1
作者 税仪冬 瞿有利 黄厚宽 《北京交通大学学报》 CAS CSCD 北大核心 2009年第5期85-89,共5页
针对增量式聚类初始时话题模型不够充分和准确,随处理报道数量增加,误检与漏检的累积效应被放大的问题,提出了周期分类和Single-Pass聚类相结合的话题识别与跟踪方法.首先采用增量式聚类算法进行话题识别与跟踪,当新闻文本每积累到一定... 针对增量式聚类初始时话题模型不够充分和准确,随处理报道数量增加,误检与漏检的累积效应被放大的问题,提出了周期分类和Single-Pass聚类相结合的话题识别与跟踪方法.首先采用增量式聚类算法进行话题识别与跟踪,当新闻文本每积累到一定程度之后,对已经聚类的报道进行周期分类,使话题簇精度提高,从而提高后续话题识别与跟踪精度.实验表明这种方法是有效的,能够降低漏检率与错检率,减少归一化错误识别代价. 展开更多
关键词 话题识别与跟踪 增量聚类 文本分类 k-最近邻方法分类
下载PDF
相关实体发现中基于Wikipedia的实体排序 被引量:1
2
作者 张俊三 瞿有利 +1 位作者 税仪冬 田盛丰 《计算机研究与发展》 EI CSCD 北大核心 2014年第6期1359-1372,共14页
针对相关实体发现中基于Wikipedia的实体排序存在的问题:半自动的目标类型获取、粗粒度的目标类型、实体类型相关度二值判断、实体关系相关度计算未考虑停止词作用.设计了一个实体排序框架,从实体相关度、实体类型相关度和实体关系相关... 针对相关实体发现中基于Wikipedia的实体排序存在的问题:半自动的目标类型获取、粗粒度的目标类型、实体类型相关度二值判断、实体关系相关度计算未考虑停止词作用.设计了一个实体排序框架,从实体相关度、实体类型相关度和实体关系相关度3方面的组合计算来对实体进行排序,通过对比多种组合方法获取了最优的方法.提出了一种新的实体类型相关度计算方法,该方法可以自动获取细粒度的目标实体类型,并通过归纳学习获取其下义Wikipedia类别判别规则集合,通过统计候选实体类别信息中符合目标类型下义类别判别规则的类别数来计算实体类型相关度.提出了一种"去停止词重构关系"方法计算候选实体和源实体的关系相关度.实验表明提出的方法可以有效地提高实体排序效果并且降低计算时间耗费. 展开更多
关键词 相关实体发现 实体排序 实体类型相关度 实体关系相关度 WIKIPEDIA
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部