-
题名基于局部变化性的网页篡改识别模型及方法
被引量:4
- 1
-
-
作者
魏文晗
邓一贵
-
机构
重庆大学计算机学院
重庆大学信息与网络管理中心
-
出处
《计算机应用》
CSCD
北大核心
2013年第2期430-433,共4页
-
基金
重庆市自然科学基金资助项目(CSTC2011JJA40023)
-
文摘
针对传统的网页远程监控方式局限于静态网页的问题,提出一种适用于动态网页的基于规则的分类模型。该模型考虑到网页的局部变化性,首先根据历史页面的动态更新,划分网页的动态区域和静态区域;其次,对动态区域,根据历史特征计算相关阈值,对静态区域建立分块的MD5历史库;最后,根据定义的IF-THEN规则决定是否发送警报。实验表明,该模型能在更短时间内完成全站检测,对正常页面的误报率较低,对异常页面的检测率较高。
-
关键词
网页篡改
网站监测
篡改检测
IF—THEN规则
领域知识
-
Keywords
Web defacement
website monitoring
defacement detection
IF-THEN rule
domain knowledge
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
-
-
题名基于隐含语义分析的微博话题发现方法
被引量:36
- 2
-
-
作者
马雯雯
魏文晗
邓一贵
-
机构
重庆大学计算机学院
重庆大学信息与网络管理中心
-
出处
《计算机工程与应用》
CSCD
2014年第1期96-100,共5页
-
基金
重庆市自然科学基金(No.cstc2011jjA40023)
-
文摘
随着微博的大量普及和关注度的不断提高,微博热点话题发现已成为当前研究热点。针对于短文本、向量空间模型(VSM)文本表示方法存在高维度、稀疏,以及同义多义问题,导致难以准确度量文本相似度,提出一种基于隐含语义分析的两阶段聚类话题发现方法。引入话题热度的概念来选取具有一定关注度的微博文本,用隐含语义分析(LSA)对数据集进行建模;用层次聚类的CURE算法确定初始类中心;用K-means聚类得到热点话题的聚类结果。真实微博数据集的实验结果验证了该方法的有效性。
-
关键词
隐含语义分析
向量空间模型
话题发现
微博
两阶段聚类
LATENT
SEMANTIC
Analysis(LSA)
Vector
Space
Model(VSM)
-
Keywords
topic detection
micro-blog
two-stage clustering
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-