基于INTERNET的在线IP页面信息单元实时解析的设计与实现
摘要
本文实现了任意给定的IP页面信息单元实时在线解析,并完成被解析信息单元库生成。并且实际解析了http://www.hbnu.edu.cn(218.197.16.8)IP页全部文本信息单元、内部包含的全部E_mail地址。证明本解析系统一致适用,从而能有效地进行特征信息的广域发现和对应IP的精确锁定。
出处
《福建电脑》
2009年第6期116-117,共2页
Journal of Fujian Computer
参考文献4
-
1许建潮,侯锟.Web信息的自主抽取方法[J].计算机工程与应用,2005,41(14):185-189. 被引量:15
-
2朱炜,王超,李俊,潘金贵.Web超链分析算法研究[J].计算机科学,2003,30(9):89-93. 被引量:20
-
3曾春,邢春晓,周立柱.基于内容过滤的个性化搜索算法[J].软件学报,2003,14(5):999-1004. 被引量:118
-
4李保利,陈玉忠,俞士汶.信息抽取研究综述[J].计算机工程与应用,2003,39(10):1-5. 被引量:178
二级参考文献54
-
1[16]Hobbs J,Appelt D,Bear J et al.FASTUS:A Cascaded Finite-State Transducer for Extracting Information from Natural-Language Text[C].In:Roche,Schabes eds. Finite State Devices for Natural Language Processing, MIT Press,Cambridge MA, 1996
-
2[17]Appelt D E.Introduction to Information Extraction[J].AI COMMUNICATIONS, 1999; 12(3)
-
3[18]Yangarber R.Scenario Customization for Information Extraction[D].Ph D Thesis.New York University,2001-01
-
4[19]Cowie J, Lehnert W.Information Extraction[J].Communications of the ACM, 1996;39(1)
-
5[20]Grishman R Adaptive information extraction and sublangu age analysis[C].In:Proceedings of IJCAI-2001 Workshop on Adaptive Text Extraction and Mining,2001
-
6[1]Applet D E,Israel D J.Introduction to Information Extraction Technology. A Tutorial for IJCAI-99,1999
-
7[2]Gaizauskas R,Wilks Y.Information Extraction:Beyond Document Retrieval[J].Journal of Documentation, 1997
-
8[3]Sager N.Natural Language Information Processing. Reading,Massachusetts:Addison Wesley, 1981
-
9[4]Dejong G.An Overview of the FRUMP System[C].In:LEHNERT W,RINGLE M h eds. Strategies for Natural Language Processing,Lawrence Erlbaum, 1982:149~176
-
10[5]Grishman R,Sundheim B.Message Understanding Conference-6:A Brief History[C].In :Proceedings of the 16h International Conference on Computational Linguistics(COLING-96),1996-08
共引文献313
-
1沈芳婷,于艳华,李志强,李劼.基于Attention-Comprehension OpenTag的人物属性抽取算法[J].新一代信息技术,2022,5(6):1-5.
-
2李卓玲,王健.基于Web挖掘的个性化服务系统的研究与实现[J].信息技术,2007,31(10):142-145. 被引量:1
-
3王睿,张洁,张由仪,于禛,姚天昉.基于混合模型的中文命名实体抽取系统[J].清华大学学报(自然科学版),2005,45(S1):1908-1914. 被引量:10
-
4蒋宗礼,肖华,赵钦.WebSifter:个性化网络搜索辅助系统[J].清华大学学报(自然科学版),2005,45(S1):1903-1907. 被引量:5
-
5辛治运,顾明,马兆丰.基于粗糙集理论的金融信息推荐算法研究[J].计算机研究与发展,2007,44(z2):262-270.
-
6叶正,林鸿飞,苏绥,刘菁菁.基于支持向量机的人物属性抽取[J].计算机研究与发展,2007,44(z2):271-275. 被引量:11
-
7岳国伟,梁永全.基于Agent的Web页面结构化信息抽取[J].计算机研究与发展,2007,44(z2):344-349.
-
8卫琳,石磊.基于搜索结果的Web预取模型研究[J].计算机研究与发展,2007,44(z2):377-382.
-
9张向喆,王明辉,赵洪波,王起山,潘玉春.生物医学文本中命名实体识别研究[J].上海交通大学学报(农业科学版),2010,28(2):132-139. 被引量:6
-
10李万辉,林瑞明,张文德.台湾科技文献信息抽取与检索平台的设计与实现[J].图书馆学研究(应用版),2010(6):71-75.
-
1Jeff Fellinge,盛青(译者).Sed——实时解析!实时处理!实时操作![J].Windows IT Pro Magazine(国际中文版),2006(3):58-59.
-
2吴盛林,董彦良,由俊生.一种基于附加传感器实时解析的6-6Stewart平台位置正解法[J].机床与液压,2001,29(6):44-45. 被引量:3
-
3孔伯煊,李祥.基于Lucene\XML技术的Web搜索引擎设计与实现[J].航空计算技术,2006,36(4):5-8. 被引量:6
-
4王杰.Word演示文档示例文本快速输入[J].电脑知识与技术(经验技巧),2010(11):40-41.
-
5杨生举,赫莉.基于LDAP的域名实时管理系统设计与实现[J].甘肃科技,2008,24(24):20-23.
-
6张兵,汤进,罗斌.基于超链接和DOM结构树的网页标题实时抽取方法[J].计算机与现代化,2015(8):84-88. 被引量:2
-
7胡荣,未召弟,符杨.基于深度优先遍历算法的配电网拓扑动态检测[J].上海电力学院学报,2010,26(2):109-112. 被引量:7
-
8王若曈,黄向东,张博,王建民,罗兵.海量气象数据实时解析与存储系统的设计与实现[J].计算机工程与科学,2015,37(11):2045-2054. 被引量:49
-
9张帆,竹之涵,刘之尧,陈志光,张弛,李一泉.面向通用对象的变电站事件(GOOSE)实时解析和预警系统[J].电力系统保护与控制,2009,37(23):92-95. 被引量:15
-
10江鹏.手机恶意软件的智能分析方法研究[J].信息系统工程,2017,30(3):149-149. 被引量:1