在线社会网络中近似网页识别方法研究

Research on Approximate Web Page Identification Method in Online Social Network

下载PDF

导出

摘要为了提高用户的网络体验和页面检索性能,提出一种基于核心词汇和语义匹配相结合的在线社会网络近似网页识别方法研究.首先从网页中提取特征核心词汇,对文档概念进行分类和合并,并建立相似度特征模型;基于相似度特征模型,构建特征向量,并对特征向量进行检索和存储,实现社会网络中近似网页的识别.实验证明提出的方法能够有效地降低网络噪声,具有良好的识别准确率和召回率. In order to improve the user＇s Web experience and page retrieval performance, a new method based on key words and semantic matching for online social network is proposed. The first feature extraction of keywords from web pages, classify and merge of document concept, and establish the similarity model; similarity model based on feature vector is constructed, and the retrieval and storage of feature vector, identify the approximate pages in social networks. The experimental results show that the proposed method can effectively reduce the network noise, and has good recognition accuracy and recall rate.

作者张莉孙丽娜郭峰

机构地区郑州成功财经学院信息工程系河南大学民生学院

出处《微电子学与计算机》 CSCD 北大核心 2017年第2期141-144,共4页 Microelectronics & Computer

基金河南省高等学校重点科研项目(教科技[2015]1120号)"现代化跟踪系统目标成像轨迹模拟研究"(16A520093) 河南省科技厅科技攻关项目"基于WiFi的无线存储测试系统设计"(162102210367) 河南省科技攻关项目"基于机器人视觉下的运动目标成像特征提取技术研究"

关键词在线社会网络近似网页识别方法 online social network approximate web page identification method

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1李栋,徐志明,李生,刘挺,王秀文.在线社会网络中信息扩散[J].计算机学报,2014,37(1):189-206. 被引量：63
2黄蓝会.在线社会网络的数据采集方法的研究[J].信息技术,2014,38(2):53-55. 被引量：4
3蔡红云,马晓雪.在线社会网络中基于关系强度的访问控制机制[J].山东大学学报（理学版）,2016,51(7):90-97. 被引量：2
4王栋,李振宇,谢高岗.在线社会网络无偏采样技术[J].计算机研究与发展,2016,53(5):949-967. 被引量：5
5李献礼.在线社会网络多维度链式信任计算算法[J].西南大学学报（自然科学版）,2016,38(8):142-147. 被引量：3
6沙泓州,刘庆云,柳厅文,周舟,郭莉,方滨兴.恶意网页识别研究综述[J].计算机学报,2016,39(3):529-542. 被引量：38
7杨洪娇.基于机器学习的校园网恶意网页检测方法[J].信息与电脑,2016,28(11):175-176. 被引量：2
8卢晓勇,陈木生.基于随机森林和欠采样集成的垃圾网页检测[J].计算机应用,2016,36(3):731-734. 被引量：17
9问延安,赵婷婷.基于CSSCI的国内社会网络研究可视化分析[J].潍坊工程职业学院学报,2016,29(1):67-73. 被引量：2
10孙立晟,何东之.改进无标度网络模型研究[J].电子设计工程,2016,24(6):115-117. 被引量：3

二级参考文献241

1王媛,孙宇清,马乐乐.面向社会网络的个性化隐私策略定义与实施[J].通信学报,2012,33(S1):239-249. 被引量：4
2林舒杨,李翠华,江弋,林琛,邹权.不平衡数据的降采样方法研究[J].计算机研究与发展,2011,48(S3):47-53. 被引量：31
3朱峻茂,杨寿保,樊建平,陈明宇.Grid与P2P混合计算环境下基于推荐证据推理的信任模型[J].计算机研究与发展,2005,42(5):797-803. 被引量：44
4张骞,张霞,文学志,刘积仁,Ting Shan.Peer-to-Peer环境下多粒度Trust模型构造[J].软件学报,2006,17(1):96-107. 被引量：71
5林南.社会资本:关于社会结构与行动的理论[M].张磊,译.上海:上海人民出版社,2005.
6格兰诺维特.镶嵌:社会网与经济行动[M].罗家德,译.北京:社会科学文献出版社,2007:1.
7Goldenberg 1, Libai E, Muller E. Talk of the network: A complex systems look at the underlying process of word-ofmouth. Marketing Letters, 2001, 12(3): 211-223.
8Goldenberg 1, Libai E, Muller E. Using complex systems analysis to advance marketing theory development: Modeling heterogeneity effects on new product growth through stochastic cellular automata. Academy of Marketing Science Review, 2001, 9(3): 1-18.
9Granovetter M. Threshold models of collective behavior. American journal of Sociology, 1987,83(6): 1420-1443.
10Hethcote , Herbert W. The mathematics of infectious diseases. SIAM Review-Society for Industrial and Applied Mathematics, 2000, 42(4): 599-653.

共引文献130

1麻瓯勃,刘雪娇,唐旭栋,周宇轩,胡亦承.基于半监督学习的恶意URL检测方法[J].计算机系统应用,2020(11):11-20. 被引量：3
2赵蓓,张洪忠.议程设置中的时间变化:基于社交机器人、媒体和公众时间滞后分析[J].国际新闻界,2023,45(2):52-80. 被引量：9
3赵卫红.海洋中胶体研究的新进展[J].海洋与湖沼,2000,31(2):221-229. 被引量：11
4陈星铭,赵胜祥.二次曲面截交线投影成圆的条件及应用[J].上海工程技术大学学报,2000,14(1):50-55. 被引量：1
5刘宇,梁循,杨小平.基于Petri网的微博网络信息传播模型[J].中国管理科学,2018,26(12):158-167. 被引量：9
6黄蓝会.基于在线社会网络采集数据的研究[J].宝鸡文理学院学报（自然科学版）,2014,34(3):57-59. 被引量：1
7张素智,孙嘉彬,王威.大数据下的Web数据集成与挖掘研究[J].现代计算机（中旬刊）,2014(10):37-42.
8卫红权,陈鸿昶,刘力雄,兰巨龙.基于概率加权通信社区SIR模型及信息扩散预测方法研究[J].信息工程大学学报,2014,15(6):678-685. 被引量：1
9程晓涛,刘彩霞,刘树新.基于局域信息的社交网络信息传播模型[J].计算机应用,2015,35(2):322-325. 被引量：11
10卢惠林.社会网络中基于集合枚举树的k匿名方法[J].计算机应用研究,2015,32(7):2150-2152.

1杨文忠,彭曙蓉.简报近似网页的一种检测算法[J].微计算机应用,2006,27(1):22-22.
2曹玉娟,牛振东,赵堃,彭学平.基于概念和语义网络的近似网页检测算法[J].软件学报,2011,22(8):1816-1826. 被引量：15
3杜海刚,李先国.一种基于关键词的近似网页检测算法[J].微计算机应用,2008,29(2):41-45. 被引量：2
4彭曙蓉,王耀南.针对小文本的Web数据挖掘技术及其应用[J].微计算机信息,2006,22(07X):203-205. 被引量：10
5闫亮,李先国.基于网页特征关键词的近似检测算法[J].科学技术与工程,2009,9(4):919-923.
6曹玉娟,牛振东,彭学平,江鹏.一个基于特征向量的近似网页去重算法[J].中国索引,2009,7(1):11-14. 被引量：5
7卡卡.开心网和你的朋友一起分享[J].电脑迷,2008,0(19):16-17.
8杨文忠,章兢,彭曙蓉.基于近似网页聚类的Web文本数据挖掘技术[J].长沙交通学院学报,2006,22(1):72-75. 被引量：1
9程芃森,安俊秀.基于特征词群的新闻类重复网页和近似网页识别算法[J].成都信息工程学院学报,2012,27(4):374-379.
10征服高考场中难度系数TOP30核心词汇[J].大学（高考金刊）,2016,0(11):80-82.

微电子学与计算机

2017年第2期

浏览历史

内容加载中请稍等...

在线社会网络中近似网页识别方法研究

参考文献11

二级参考文献241

共引文献130

相关作者

相关机构

相关主题

浏览历史