题名 基于自然语言处理的Web内容过滤模型
被引量:6
1
作者
陈阳贵
袁卫忠
谢俊元
机构
南京大学计算机科学与技术系
出处
《计算机应用研究》
CSCD
北大核心
2001年第7期125-128,共4页
文摘
提出了一种基于自然语言处理技术的Web内容过滤模型,引入了中英文两种语言的计算机处理技术,重点讨论了新的具有语义特征的过滤算法,提高了过滤的覆盖率和精确性,并通过实验测试了其性能。
关键词
自然语言处理
web
内容过滤
计算机
Keywords
Natural language processing
web
content filter
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 Web缓存服务器技术研究与应用
被引量:11
2
作者
许艳美
肖宗水
梁昇
机构
山东大学计算机科学与技术学院
出处
《计算机工程与设计》
CSCD
北大核心
2005年第1期126-128,共3页
文摘
Web缓存服务器系统正在Internet及局域网上广泛地应用,对它所采用的技术做了较深入的讨论,指出利用WebCache技术,可减少网络流量,节约资金,提高带宽利用率;同时在Cache服务器端进行内容分析过滤,可提高过滤质量和效率,有效防止有害信息的进一步传播。
关键词
web
CACHE
高速缓存服务器
缓存协议
内容过滤
网络流量
Keywords
web cache
web caching server
cache protocol
content filter
分类号
TP393.07
[自动化与计算机技术—计算机应用技术]
题名 基于信息过滤后的Web内容挖掘
被引量:6
3
作者
谭汉松
李红
机构
中南大学信息科学与工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2003年第30期186-187,共2页
文摘
Internet的迅速发展,使得worldwideweb已经成为一个巨大的、蕴含着具有潜在价值知识的分布式信息空间,为Web挖掘研究提供了丰富的资源的同时也提出了新的挑战。该文首先论述了Web内容挖掘技术的挖掘原理和所面对的困难,然后介绍了信息过滤技术的规则以及过程。最后提出了基于信息过滤的Web内容挖掘的系统方案,较好地解决了当前Web内容挖掘中准确度不高、冗余性大的缺陷。
关键词
信息过滤
web 内容挖掘
Keywords
information filter ing,web content mining
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 Web全文检索中间件的设计与应用
被引量:2
4
作者
张维刚
徐永东
雷小强
何辉
机构
哈尔滨工业大学(威海)计算机科学与技术学院
华中科技大学计算机科学与技术学院
出处
《计算机应用》
CSCD
北大核心
2011年第8期2261-2264,共4页
基金
国家自然科学基金资助项目(60803092)
文摘
为了更好地为Web站内检索提供服务,对Web全文检索的关键技术进行了研究,设计并实现了一个用于Web全文检索的中间件。该中间件通过多线程网页爬虫程序来抓取网页;对抓取结果采用基于Bloom-Filter的大规模URL去重算法来进行高效消重;应用所提出的新的基于标签的正文提取方法来进行网页正文提取,实验结果表明该正文提取方法是有效可行的;此外,为了改善用户的搜索体验,该中间件还提供了一些个性化搜索辅助功能。最后,实现了一个完整的博客搜索系统Boso(博搜)来验证中间件的性能,结果说明该中间件是可以投入实际应用的。
关键词
web 全文检索
中间件
URL去重
网页标签
正文提取
Keywords
web full-text retrieval
middleware
URL filter
web tag
content extraction
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
题名 WEB内容过滤方法的研究与应用
被引量:2
5
作者
张颖江
陈驰
机构
湖北工业大学计算机学院
出处
《武汉科技学院学报》
2005年第4期49-51,共3页
文摘
本文主要对当前Web内容过滤的方法和应用进行了分析与研究,重点描述了一种基于模式匹配技术的内容过滤技术——模式过滤方式,并对其应用进行了分析。
关键词
web 内容过滤
模式匹配
模式过滤
Keywords
web content filter
Pattern matching
Pattern filter
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
题名 基于网页关键词的个性化Web推荐算法
被引量:1
6
作者
袁燚
张璟
李军怀
机构
西安理工大学计算机科学与工程学院
出处
《西安理工大学学报》
CAS
2007年第1期59-61,共3页
基金
陕西省科技攻关资助项目(2006K05-G10)
文摘
个性化Web推荐系统是利用用户的浏览行为定制符合用户结构和内容的过程。在综合应用协作过滤和内容过滤方法的基础上,通过对网站网页关键词的评估,提出了一种新的个性化Web推荐算法,研究了基于网页关键词的个性化模型,网站页面中关键词的权重计算,基于协作过滤的新用户推荐,基于内容过滤的再次推荐方法,以及基于用户群的用户兴趣调整方法。实验证明,本算法能够以较高的效率对用户进行网页推荐。
关键词
个性化
网页关键词
协作过滤
内容过滤
Keywords
personal
web page key words
collaborative filter ing
content -based filter ing
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 SWIM Web防火墙的设计和实现
7
作者
吴志军
陈焕
雷缙
机构
中国民航大学电子信息与自动化学院
出处
《中国民航大学学报》
CAS
2018年第6期10-15,共6页
基金
国家自然科学基金项目(U1533107)
天津市自然科学基金重点项目(17JCZDJC30900)
文摘
广域信息管理系统(SWIM)是国际民航组织(ICAO)推行的下一代空中交通管理信息共享基础网络,采用面向服务的架构实现航空交通运输资源的共享服务。首先设计了SWIM应用的场景——SWIM服务管理中心,进行Web服务的安全策略研究,结合SWIM Web订阅/发布服务请求的高并发特征,设计了SWIM Web防火墙,保障SWIM各客户端之间的安全通信。SWIM Web防火墙基于SWIM服务管理节点架构进行分布式部署,通过实现流量控制、负载均衡和内容过滤功能,达到对服务过滤并合理分配的目的。将该防火墙部署在LNMP平台中进行测试与验证,实验结果表明该防火墙可对数据包合理分配和有效过滤。
关键词
广域信息管理系统
web 防火墙
流量控制
负载均衡
内容过滤
Keywords
SWIM
web firewall
flow control
load balancing
content filter ing
分类号
V243.1
[航空宇航科学与技术—飞行器设计]
题名 对基于HTTP推技术聊天室的研究
被引量:4
8
作者
万长林
鄢志辉
李晓飞
占传杰
机构
南昌大学网络中心
出处
《南昌大学学报(工科版)》
CAS
2005年第1期94-98,共5页
文摘
本文分析了客户端拉(Client-Pull)方式和服务器推 (Server-Push)方式两种类型WEB聊天室的优劣,并给出了推方式WEB聊天室的一种高效的实现方法,在WINDOWS平台上用ISAPI技术实现了一个采用服务器推方式的高性能WEB聊天室系统,探讨了多用户并发访问时的多线程同步安全性设计问题,在和同类系统的性能比较试验中证明该系统不论在资源占用率还是在响应时间上都具有显著的优势.此外,针对信息网络安全的需要,本文还探讨了利用词频技术对聊天内容进行信息过滤,保证信息安全,杜绝不良信息在网上传播.
关键词
推技术
web
多线程
内容过滤
Keywords
push technology
web application
multiple threads
content filter
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
题名 个性化服务技术研究
被引量:20
9
作者
吴辉娟
袁方
机构
河北大学数学与计算机学院
出处
《计算机技术与发展》
2006年第2期32-34,37,共4页
文摘
对个性化服务技术中的用户识别、用户描述文件、个性化推荐技术、个性化服务系统的体系结构及目前的研究方向进行了概述。从实现角度详细讨论了3种个性化推荐技术。个性化服务具有针对性,它的目的就是为了使用户更好地找到需要的信息,通过从用户访问网站的历史记录中得到用户的个人信息,利用个性化推荐的方法将信息推荐给用户。个性化推荐避免用户陷入信息的海洋,提高用户查询效率,使得用户可以得到他们真正想得到的信息,避免繁多的人工搜索。
关键词
个性化
内容过滤
web 日志
协作过滤
Keywords
personalization
content filter ing
web log
eollabarative- filter ing
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
题名 一种信息共享的主动服务框架
被引量:5
10
作者
马卫东
李幼平
周明天
机构
中国工程物理研究院电子工程研究所
电子科技大学计算机学院
出处
《计算机工程与应用》
CSCD
北大核心
2008年第18期25-29,33,共6页
基金
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60272014)
国家高技术研究发展计划(863)(the National High-Tech Research and Development Plan of China under Grant No.2002AA121063)
中国工程院2006年度咨询项目
文摘
信息共享服务是Internet核心功能之一。提出了一种基于Internet与下一代广播网相互融合的信息共享主动服务框架,探讨了网络层次模型、业务流生成及内容解析等核心技术。该系统立足于Internet信息资源,通过对信息合理的收集、组织与分发,结合统一内容定位和信息过滤技术,实现个性化、主动化的信息服务。最后讨论了基于Web服务的信息订阅/发布主动服务系统的实现模型与实现框架。
关键词
信息共享
主动服务
web 服务
统一内容定位
信息过滤
Keywords
information sharing
active services
web services
uniform content s location
information filter
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP393
[自动化与计算机技术—计算机应用技术]
题名 信息过滤技术在搜索引擎中的应用
被引量:3
11
作者
石岩
机构
山东理工大学图书馆
出处
《农业网络信息》
2006年第12期91-93,共3页
文摘
信息过滤技术将在信息服务中起重要作用。文章首先介绍了信息过滤的涵义、特征和分类,以及构建一个基于信息过滤技术的Web信息过滤模型。
关键词
信息过滤
搜索引擎
协作过滤
基于内容的过滤
Keywords
Information filter ing
web sites search system
Collaborative filter ing
content -based filter ing
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 互联网网络文化的趋势和挑战及保障
被引量:1
12
作者
刘慧民
刘功申
机构
上海交通大学信息安全工程学院
出处
《科技情报开发与经济》
2007年第26期129-131,共3页
文摘
分析了互联网内容技术发展趋势,探讨了先进网络文化对传统文化的冲击和挑战,描述了建设互联网先进网络文化的现有技术和管理手段及其存在的不足,在管理和技术两个层面上,提出了建设先进网络文化核心技术和管理思路。
关键词
信息安全
内容安全
信息过滤
网络文化
Keywords
information security
content security
information filter ing
web -culture
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 基于Heritrix的网页内容过滤抓取
13
作者
陈锦伟
徐勇
机构
肇庆学院数学与信息计算科学学院
出处
《现代计算机》
2012年第14期18-22,共5页
文摘
在深入研究开源网页爬虫——Heritrix系统框架和源代码的基础上,对其搜索内容和范围增加过滤处理功能。这些功能扩展的实现是通过面向对象分析与设计技术,定义类对Heritrix中相关的类进行继承。在校园网范围内运行Heritrix进行网页收集实验。实验结果表明,新增的过滤功能运行有效。
关键词
垂直搜索引擎
网络爬虫
HERITRIX
内容过滤
Keywords
Vertical Search Engine
web -Crawlers
Heritrix
content filter ing
分类号
TP393.092
[自动化与计算机技术—计算机应用技术]
题名 安全数据交换的技术现状和发展展望
被引量:2
14
作者
夏峰
机构
上海市公安局科技处
出处
《计算机安全》
2014年第3期64-68,共5页
文摘
安全数据交换主要指不同信息系统间数据的安全交换,数据在交换前的存在形式主要有数据库数据、文件数据、流媒体数据、请求响应数据四种,主要讨论在用网闸作为惟一连接点的网络中两个信息系统进行数据的安全交换,针对上述4种数据形式,可分别采用主动获取交换和被动接受交换两种方式。针对不同数据交换业务,在满足吞吐量、延时、并发业务功能性能需求的同时,根据不同数据形式的安全威胁选择合适的安全技术满足业务安全需求。主要比较分析了不同数据形式采用的不同交换技术,以及不同交换技术下存在的主要安全威胁,并总结了现有的安全技术手段。最后阐述了交换技术在新的技术推动下产生的新问题,并做了交换技术发展展望。
关键词
安全
数据交换
数据安全交换
网络攻击防范
格式检查
内容过滤
病毒查杀
木马查杀
Keywords
security
data exchange
secure data exchange
web attacks prevention
format inspection :content filter ing
virus checking and killing
Trojan horse checking and killing
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
题名 一种基于智能过滤的Web个性化推荐模型
被引量:3
15
作者
苏玉召
赵妍
许德山
机构
中国科学院文献情报中心
中国科学院研究生院
郑州航空工业管理学院
出处
《图书情报工作》
CSSCI
北大核心
2011年第13期112-115,共4页
文摘
Web个性化研究的关键技术是推荐系统,其作用是根据用户模型推荐个性化内容,当前推荐技术的研究主要包括四种模式:基于规则过滤、基于内容过滤、基于协作过滤和混合过滤模式。前三种工作模式采用的是传统技术和方法,根据当前推荐系统研究的重点和热点,提出一种Web个性化应用的智能过滤推荐模式。智能过滤推荐模式组合采用以上三种工作模式的优点、避免前三种单一模式的缺点。该方法的突出特点是根据离线学习模型提取的用户偏好特征,实现在线智能推荐。
关键词
web 个性化推荐系统
web 挖掘
基于规则过滤
基于内容过滤
协作过滤
Keywords
web personalization recommendation system web mining rule-based filter ing content -based filter ing collaborative filter ing
分类号
G202
[文化科学—传播学]