-
题名高度相似网络文本排重系统研究
- 1
-
-
作者
王芳
-
机构
西安城市建设职业学院基础部
-
出处
《现代科学仪器》
2021年第1期125-128,共4页
-
文摘
随着信息科技的不断进步和网络的迅速普及,互联网中每天都会产生海量的文本信息,其中很大一部分文本在内容上有所重复,这会造成互联网用户浏览时间的浪费和内容提供方存储资源的过度消耗。为此,本文提出了一种高度相似网络文本排重系统,利用simhash算法确定文本内容的相似度,对于被判定为高度相似的文本只赋予一个唯一的标识入库保存,从而减轻了数据库的存储压力,提高了用户搜索与浏览的效率。
-
关键词
网络文本
排重技术
simhash算法
-
Keywords
network text
de duplication technology
simhash algorithm
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名网络信息监控系统设计的研究
被引量:1
- 2
-
-
作者
洪伟铭
-
机构
湛江师范学院信息科学与技术学院
-
出处
《湛江师范学院学报》
2007年第3期112-115,共4页
-
文摘
根据当前网络信息传播的混乱情况,在某种场合进行网络信息监控很有必要.该文提出了网络信息监控的几种实现方法和标准的信息监控流程,讨论设计网络信息监控系统的系统架构方法以及信息监控中应根据实际采用各种不同的技术组合,以达到全方位对网络信息进行监控.
-
关键词
信息监控
监控管理
排重技术
-
Keywords
procedure of internet information monitoring
internet information monitoring system
duplicate detection
-
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
-
-
题名互联网信息监控系统的设计
- 3
-
-
作者
洪伟铭
-
机构
湛江师范学院计算机系
-
出处
《中山大学学报论丛》
2007年第5期119-123,共5页
-
文摘
根据当前互联网络信息的传播情况,提出了互联网的信息监控的几种方法和标准的信息监控流程,讨论设计互联网络信息监控系统的系统架构方法以及信息监控中应采用的各种技术。
-
关键词
信息监控
监控管理
排重技术
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
-