-
题名后缀树算法在舆情聚类中的应用
被引量:1
- 1
-
-
作者
彭静
翟英
冯爽
-
机构
河北科技大学信息科学与工程学院
河北经贸大学信息技术学院
河北科技大学教务处
-
出处
《河北科技大学学报》
CAS
2012年第1期65-68,共4页
-
基金
河北省科技支撑计划项目(10213557)
-
文摘
针对网络舆情分析的需求背景,研究了通过后缀树算法发现文本文档之间的公共短语串,按公共短语串实现文档聚类。网页文档的标题和摘要能代表文档的主要思想,应用后缀树算法实现对标题和摘要自动聚类,从而实现舆情信息自动聚类。
-
关键词
网络舆情
后缀树算法
文本聚类
-
Keywords
internet public opinions
STC algorithm
text clustering
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名STC算法的网络服务分类技术研究
- 2
-
-
作者
邓峰
陈家琪
-
机构
上海理工大学光电信息与计算机工程学院
-
出处
《信息技术》
2013年第9期13-17,共5页
-
基金
上海市教委科研创新项目(12zz146)
-
文摘
针对现有的大部分网络服务分类机制基本上靠人工分类的缺陷,以及半自动分类技术准确率和查全率的效率较低等问题,进行了基于后缀树聚类算法的网络服务自动分类技术研究,同时提出概念与例子层次树结构来表示部分存在上下位关系或者同义关系的聚类标签,在后缀树聚类基础上对这些标签进行二次聚类。通过引入文本预处理和WordNet语义相似度计算的基础上来实现服务自动分类。实验结果表明,该服务自动分类算法具有较好的准备率和查全率,另外根据WordNet提取出抽象的聚类标签,有利于对日益剧增的网络服务进行抽象层次的分类,提高了海量网络服务分类的效率。
-
关键词
网络服务
后缀树聚类(STC)算法
WORDNET
语义相似度计算
-
Keywords
Web service
suffix tree clustering ( STC ) algorithm
WordNet
semantic similaritycalculation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-