融合句义结构模型的短文本推荐算法研究被引量：1

Research on Short Text Recommendation Merging Sentential Semantic Structure Model

下载PDF

导出

摘要传统的基于协同过滤的推荐系统需要收集用户兴趣喜好等相关数据,在一定程度上涉及到用户的个人隐私,当前信息安全和隐私保护是数据挖掘领域的热点之一,为了有效避免用户信息泄露带来的安全问题,提出一种融合句义结构模型的短文本推荐方法。该方法以句子为研究对象,首先利用LDA主题模型构建文章-主题矩阵,划分子主题,然后利用句义结构模型抽取句子的语义格得到句子的语义特征,基于LDA主题模型使用句义结构计算句子两两之间的语义相似度,构建相似度矩阵,融合句子的语义特征和关联特征综合加权得到句子权值,以文章内最高单句权值衡量文章权值,将文章权值统一进行排序,按照排序顺序去冗余后依次推荐。在压缩比为0.5%的条件下,ROUGE-1值达到31.388%,ROUGE-SU＊达到15.701%.实验结果表明,以句子为粒度的短文本推荐算法能丰富文本的特征信息、深化语义分析层次,在数据处理过程中未收集用户信息,从而有效避免用户信息泄露等安全问题,实现更加安全、快速向用户推荐文本。 Based on the collaborative filtering traditional recommendation system need to collect relevant data of user’s interests and preferences,to a certain extent involved in the user’s personal privacy, current information security and privacy protection is one of the hot field of data mining, in order to avoid disclosure of user information with to security issues, In this paper, we propose a new short text recommendation method based on sentential semantic structure model. We fist use topic model structure text-theme matrix to several subtopics. We employ sentential semantic structure model to extract semantic features to get sentential semantic features. Then LDA topic model fusing sentential semantic structure model is used to calculate the pairwise sentence similarities and construct the similarity matrix. Then we acquire sentential relationship features. At last,combining both sentential semantic features and relationship features, the most informative text are extracted from each subtopic. Experimental results demonstrate the improvement of our proposed framework , ROUGE-1 value is 31. 388% while ROUGE-SU＊ value is 15. 701% on compress ratio at 0. 5% . The results indicate that introducing sentential semantic structure model can better understand sentential semantic and using both sentential semantic features and relationship features can also enrich the features representation.

作者原玉娇罗森林林萌潘丽敏

机构地区北京理工大学信息与电子学院

出处《信息安全研究》 2015年第1期67-73,共7页 Journal of Information Security Research

基金国家242信息安全计划资助项目(2005C48) 北京理工大学科技创新计划重大项目培育专项(2011CX01015)

关键词微博短文本推荐主题模型自然语言处理信息安全 microblog short text recommendation topic model natural language processing information security

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1路海明,卢增祥,李衍达.基于多Agent混合智能实现个性化网络信息推荐[J].计算机科学,2000,27(7):32-34. 被引量：14
2冯翱,刘斌,卢增祥,路海明,王普,李衍达.Open Bookmark——基于Agent的信息过滤系统[J].清华大学学报（自然科学版）,2001,41(3):85-88. 被引量：18
3罗森林,韩磊,潘丽敏,冯扬,刘盈盈.汉语句义结构模型及其验证[J].北京理工大学学报,2013,33(2):166-171. 被引量：10
4杨潇,马军,杨同峰,杜言琦,邵海敏.主题模型LDA的多文档自动文摘[J].智能系统学报,2010,5(2):169-176. 被引量：23

二级参考文献34

1秦兵,刘挺,李生.基于局部主题判定与抽取的多文档文摘技术[J].自动化学报,2004,30(6):905-910. 被引量：10
2卢志茂,刘挺,李生.统计词义消歧的研究进展[J].电子学报,2006,34(2):333-343. 被引量：28
3刘挺,车万翔,李生.基于最大熵分类器的语义角色标注[J].软件学报,2007,18(3):565-573. 被引量：73
4贾彦德.汉语语义学[M].北京:北京大学出版社,2005:117-130.
5RADEV D R,HOVY E,MCKEOWN K.Introduction to the special issue on text summarization[J].Computational Linguistics,2002,28(4):399-408.
6LEE J H,SUN P,AHN C M,et al.Automatic generic document summarization based on non-negative matrix factorization[J].Information Processing and Management,2009,45(1):20-34.
7HIRAO T,ISOZAKI H,MAEDA E,et al.Extracting important sentences with support vector machines[C]//Proc of the 19th International Conference on Computational Linguistics.Taipei,China,2002:1-7.
8NENKOVA A,VANDERWENDE L.The impact of frequency on summarization:MSR-TR-2005-101[R].Redmond,USA:Microsoft Research,2005.
9LINC Y,HOVY E.The automated acquisition of topic signatures FOR text summarization[C]//Proc of the 18th International Conference on Computational Linguistics.Sarbrflcken,Germany,2000:271-278.
10ANTIQUEIRA L,Jr OLIVEIRA O N.A complex network approach to text summarization[J].Information Science,2009 (179):584-599.

共引文献60

1秦荣环,宋敬刚.刍议图书馆个性化信息服务研究[J].科技情报开发与经济,2005,15(20):20-21.
2石军,王儒敬,王志红.基于群聚个性化搜索引擎[J].农业网络信息,2006(1):45-47.
3费洪晓,巩艳玲,谢文彪,倪敏.基于混合学习策略的多Agent信息过滤系统[J].计算机应用,2006,26(2):267-269. 被引量：3
4曾红.Internet中知识建模[J].湘潭师范学院学报（自然科学版）,2006,28(3):30-32.
5费洪晓,穆珺,巩艳玲,黎成.基于Agent的个性化信息过滤系统的设计与实现[J].计算机技术与发展,2006,16(12):1-3. 被引量：4
6崔虹燕.基于智能Agent的网络信息过滤研究[J].兰州工业高等专科学校学报,2008,15(1):23-25.
7吴秀珍.基于图书馆个性化知识服务的研究[J].世纪桥,2009(19):153-154. 被引量：5
8包敬海,周小珠.基于Agent的门户网站个性化搜索的研究[J].鸡西大学学报（综合版）,2010,10(1):59-60.
9赵麟.基于最大频繁模式挖掘算法进行书目推荐系统的设计与实现[J].现代图书情报技术,2010(5):23-28. 被引量：17
10邱晓俊,刘发升.基于层次向量空间模型的用户兴趣建模研究[J].现代计算机,2010,16(6):16-19. 被引量：3

同被引文献14

1严冬梅,鲁城华.基于用户兴趣度和特征的优化协同过滤推荐[J].计算机应用研究,2012,29(2):497-500. 被引量：20
2朱然,李德华.新闻聚合系统中的数据挖掘技术初探[J].电脑知识与技术,2013(1):148-151. 被引量：2
3陈克寒,韩盼盼,吴健.基于用户聚类的异构社交网络推荐算法[J].计算机学报,2013,36(2):349-359. 被引量：125
4云霞,李红,江肖强.基于环境因素和移动互联网的个性化推荐系统[J].电信快报（网络与通信）,2013(7):18-21. 被引量：1
5扈中凯,郑小林,吴亚峰,陈德人.基于用户评论挖掘的产品推荐算法[J].浙江大学学报（工学版）,2013,47(8):1475-1485. 被引量：29
6王冠楠,陈端兵,傅彦.新闻推荐的多维兴趣模型与传播分析[J].计算机科学,2013,40(11):126-130. 被引量：5
7洪亮,冉从敬,吴志强.移动环境下基于共同兴趣的情境感知信息推荐研究[J].情报理论与实践,2014,37(11):124-128. 被引量：13
8王智圣,李琪,汪静,印鉴.基于隐式用户反馈数据流的实时个性化推荐[J].计算机学报,2016,39(1):52-64. 被引量：31
9王升升,赵海燕,陈庆奎,曹健.个性化推荐中的隐语义模型[J].小型微型计算机系统,2016,37(5):881-889. 被引量：22
10胡伟健,陈俊,李灵芳,何盛国.结合用户特征和兴趣变化的组推荐系统算法研究[J].软件导刊,2016,15(6):60-62. 被引量：6

引证文献1

1任恒妮.基于特征的兴趣推荐系统研究[J].自动化与仪器仪表,2017(9):201-202. 被引量：2

二级引证文献2

1林如意,何丰,赵小龙.基于k-均值聚类的协同过滤算法[J].福建电脑,2017,33(12):6-8. 被引量：1
2许雪晶,林辰玮.基于K-means聚类的协同过滤电商个性化推荐算法[J].鄂州大学学报,2023,30(6):102-104.

1林萌,罗森林,贾丛飞,韩磊,原玉娇,潘丽敏.融合句义结构模型的微博话题摘要算法[J].浙江大学学报（工学版）,2015,49(12):2316-2325. 被引量：5
2罗森林,韩磊,潘丽敏,冯扬,刘盈盈.汉语句义结构模型及其验证[J].北京理工大学学报,2013,33(2):166-171. 被引量：10
3罗森林,王倩,刘莉莉,韩磊.融合C4.5与SVM算法的汉语句义类型识别方法[J].北京理工大学学报,2012,32(10):1036-1041. 被引量：1
4蔡月红,朱倩,程显毅,杨天明.基于句义三维模型的汉语句子相似度计算[J].广西师范大学学报（自然科学版）,2009,27(1):153-156.
5王倩,罗森林,韩磊,潘丽敏.基于谓词及句义类型块的汉语句义类型识别[J].中文信息学报,2014,28(2):8-16. 被引量：3
6熊李艳,赵毅,黄卫春,钟茂生,黄晓辉.基于句义结构分析的中文人名消歧[J].计算机应用研究,2016,33(10):2898-2901. 被引量：3
7罗森林,白建敏,潘丽敏,韩磊,孟强.融合句义特征的多文档自动摘要算法研究[J].北京理工大学学报,2016,36(10):1059-1064. 被引量：3
8郝文江,武捷,李思其.互联网用户信息泄露事件探究[J].信息网络安全,2012(8):22-25. 被引量：2
9陈博.安全测试保障网上银行安全[J].中国金融电脑,2012(8):89-89.
10汤慧.计算机网络安全的实际状况及其应对策略探讨[J].无线互联科技,2015,12(12):49-50. 被引量：1

信息安全研究

2015年第1期

浏览历史

内容加载中请稍等...

融合句义结构模型的短文本推荐算法研究被引量：1

参考文献4

二级参考文献34

共引文献60

同被引文献14

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

融合句义结构模型的短文本推荐算法研究 被引量：1

参考文献4

二级参考文献34

共引文献60

同被引文献14

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

融合句义结构模型的短文本推荐算法研究被引量：1