基于主题特征的问答文本摘要自动生成研究被引量：1

Research on Automatic Generation of Question andAnswer Text Abstract Based on Topic Feature

下载PDF

导出

摘要 [目的/意义]为帮助用户在拥有海量文本信息的问答社区高效率、高质量定位到符合自身需求的信息。[方法/过程]本文提出基于主题特征的问答文本摘要生成模型,该模型融合Word2Vec和SLDA算法多层次表达问答文本语义特征,而后基于图排序的思想,结合MRR冗余控制算法与文本句特征标签,调整句子权重,高效筛选出贴合问题标签的摘要内容。[结果/结论]本文对知乎问答社区多个问题下的问答文本数据进行验证,结果证明该模型具有较高的可行性和有效性。但本文选取了500份回答文本数据进行实证,未来可进一步扩大数据量开展更为充分的验证。 [Purpose/Significance]To help users locate information that meets their own needs with high efficiency and quality in the question and answer community with massive text information.[Method/Process]This paper proposed a question and answer text summary generation model based on topic features.This model combined Word2vec and SLDA algorithms to express the semantic features of question and answer text at multiple levels.Then,based on the idea of graph sorting,combined with MRR redundancy control algorithm and text sentence feature tags,the sentence weight was adjusted,and the summary content fitting the question tag was efficiently screened.[Result/Conclusion]Thise paper verifies the question and answer text data under multiple questions of Zhihu question and answer community,and the results show that the model is highly feasible and effective.However,this paper only selects 500 response text data for empirical analysis,and the data volume can be further expanded to carry out more full verification in the future.

作者刘梦豪熊回香王妞妞贺宇航 Liu Menghao;Xiong Huixiang;Wang Niuniu;He Yuhang(School of Information Management,Central China Normal University,Wuhan 430079,China;Undergraduate School,Central China Normal University,Wuhan 430079,China)

机构地区华中师范大学信息管理学院华中师范大学本科生院

出处《现代情报》 CSSCI 2023年第8期114-124,177,共12页 Journal of Modern Information

基金国家社会科学基金重点项目“数据驱动的在线健康资源挖掘与智慧服务研究”(项目编号:22ATQ004) 2022年度华中师范大学基本科研业务费(人文社科类)交叉科学研究项目“基于量化自我技术的个体健康管理研究”(项目编号:CCNU22JC033) 华中师范大学研究生教育创新资助项目“跨学科科研合作视角下学术群落发现与知识增长点探测研究”(项目编号:2022CXZZ106)。

关键词摘要自动生成知乎问答社区监督主题模型图排序 Word2Vec automatic generation of summary Zhihu Q&A community monitor the subject model graph sorting Word2Vec

分类号 G203 [文化科学—传播学]

引文网络
相关文献

参考文献10

1唐晓波,顾娜,谭明亮.基于句子主题发现的中文多文档自动摘要研究[J].情报科学,2020,38(3):11-16. 被引量：8
2石磊,阮选敏,魏瑞斌,成颖.基于序列到序列模型的生成式文本摘要研究综述[J].情报学报,2019,38(10):1102-1116. 被引量：14
3肖元君,吴国文.基于Gensim的摘要自动生成算法研究与实现[J].计算机应用与软件,2019,36(12):131-136. 被引量：15
4赵美玲,刘胜全,刘艳,郭竹为,符贤哲.基于改进K-means聚类与图模型相结合的多文本自动文摘研究[J].现代计算机（中旬刊）,2017(6):26-30. 被引量：3
5陶兴,张向先,郭顺利,张莉曼.学术问答社区用户生成内容的W2V-MMR自动摘要方法研究[J].数据分析与知识发现,2020,4(4):109-118. 被引量：8
6陈晨,侯景瑞,吴任力,王平.基于多源混合标签的社会化问答社区问题推荐方法研究[J].情报科学,2019,37(7):139-145. 被引量：6
7谷莹,李贺,李叶叶,刘嘉宇.基于在线评论的企业竞争情报需求挖掘研究[J].现代情报,2021,41(1):24-31. 被引量：24
8刘凯鹏,方滨兴.一种基于社会性标注的网页排序算法[J].计算机学报,2010,33(6):1014-1023. 被引量：19
9朱玉佳,祝永志,董兆安.基于TextRank算法的联合打分文本摘要生成[J].通信技术,2021,54(2):323-326. 被引量：9
10程琨,李传艺,贾欣欣,葛季栋,骆斌.基于改进的MMR算法的新闻文本抽取式摘要方法[J].应用科学学报,2021,39(3):443-455. 被引量：11

二级参考文献80

1黄波,刘传才.基于加权TextRank的中文自动文本摘要[J].计算机应用研究,2020,37(2):407-410. 被引量：21
2Page Let al. The pagerank citation ranking: Bringing order to the web. Stanford University, Stanford, CA, USA: Technical Report 1999 -66, 1999.
3Kleinberg J M. Authoritative sources in a hyperlinked environment. Journal of the ACM, 1999, 46(5): 604 632.
4Koutrika Get al. Combating spamin tagging systems//Proceedings of the 3rd International Workshop on Adversarial Information Retrieval on the Web (AIRWeb' 07). Banff, Canada, 2007:57-64.
5Koutrika G et al. Combating spam in tagging systems: An evaluation. ACM Transactions on the Web, 2008, 2 (4): 1-34.
6Heymann P, Koutrika G, Garcia Molina H. Fighting spam on social web sites: A survey of approaches and future chal lenges. IEEE Internet Computing, 2007, 11(6) 36-45.
7Krause Bet al. The anti-social tagger: Detecting spam in social bookrnarking systems//Proceedings of the 4th International Workshop on Adversarial Information Retrieval on the Web(AIRWeb'08). Beijing, China, 2008:61-68.
8Hotho A et al. Information retrieval in folksonomies: Search and ranking. The Semantic Web: Research and Applications, 2006, 4011:411-426.
9Bao S et al. Optimizing web search using social annotations// Proceedings of the 16th International Conference on World WideWeb(WWW'07). Banff, Canada, 2007:501- 510.
10Noll M G et al. Telling experts from spammers: Expertise ranking in folksonomies//Proceedings of the 32nd Interns- tional ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR' 09). Boston, MA, USA, 2009:612 -619.

共引文献102

1丁美荣,冯伟森,黄荣翔,罗嘉俊.基于预训练模型和基础词典扩展的酒店评论情感分析[J].计算机系统应用,2022,31(11):296-308. 被引量：5
2梁媛,王东波,黄水清.面向人民日报语料的新闻自动摘要生成[J].知识管理论坛,2022(4):452-464. 被引量：1
3耿国桐,卢胜军,雷帅,汤珊红,赵柯然,杨湘云.人工智能赋能情报研究的变革与发展[J].情报学进展,2024(1):278-317.
4张祥青,宋雪雁,张伟民.基于MUSA、TOPSIS综合评价方法的社区问答平台可用性测度研究[J].情报科学,2022,40(11):166-175. 被引量：1
5吴运明,王令村,魏子栋,郭顺利.基于Canopy-Kmeans的移动商务用户需求聚合挖掘及分析研究[J].情报科学,2022,40(10):97-106. 被引量：4
6李牧南,王良,赖华鹏.中文科技政策文本分类:增强的TextCNN视角[J].科技管理研究,2023,43(2):160-166. 被引量：5
7周丰,殷丽丽,沈琼,杨怀光.基于word2vec的瓶装水线上评论智能分析[J].包装工程,2022,43(S01):48-55. 被引量：1
8李枫林,何洲芳.面向用户潜在信息需求的检索结果组织研究[J].情报理论与实践,2011,34(5):42-45. 被引量：4
9王健,李志斌,林鸿飞.一种基于社会化标注的网页检索方法[J].计算机工程,2012,38(15):50-52. 被引量：1
10廖志芳,李玲,刘丽敏,李永周.三部图张量分解标签推荐算法[J].计算机学报,2012,35(12):2625-2632. 被引量：17

同被引文献2

1李金鹏,张闯,陈小军,胡玥,廖鹏程.自动文本摘要研究综述[J].计算机研究与发展,2021,58(1):1-21. 被引量：53
2习海旭,章成志,赵毅,田亮.基于层次观点树的社交媒体多维度观点挖掘研究[J].情报学报,2023,42(3):304-315. 被引量：2

引证文献1

1许天翼,颜兆萍,朱恩耀,石进.基于过滤注意力机制的生成式自动社交媒体文本摘要模型[J].现代情报,2024,44(12):40-51.

1叶晓鹏.基于医疗知识图谱自动问答系统的构建研究[J].电脑知识与技术,2023,19(9):22-24. 被引量：1
2张玉玲,尚超.韩国汉语教材研究现状及其文化视角探析[J].你好成都（中英文）,2023(19):0238-0240.
3张琪,范永胜,金独亮.基于MMR和WordNet的新闻文本摘要生成研究[J].西南师范大学学报（自然科学版）,2023,48(5):77-86. 被引量：2
4廖坤.基于北斗卫星导航系统的智能交通运输系统设计[J].无线互联科技,2023,20(9):33-35. 被引量：1
5李媛媛.近两年全国卷诗歌鉴赏命题分析[J].中学语文教学参考,2023(9):67-69.
6刘帅男,王芝浩,王警辉,张悦,薄报学,高欣.970 nm超辐射发光二极管弯曲脊形波导数值分析[J].光电子．激光,2023,34(6):628-635. 被引量：1
7Keliang Du,Luhan Wang,Xiangming Wen,Yu Liu,Haiwen Niu,Shaoxin Huang.ML-SLD:A message-level stateless design for cloud-native 5G core network[J].Digital Communications and Networks,2023,9(3):743-756.
8于谢缘.试论基层博物馆馆藏资源的深层次诠释[J].文物鉴定与鉴赏,2023(10):72-75.

现代情报

2023年第8期

浏览历史

内容加载中请稍等...

基于主题特征的问答文本摘要自动生成研究被引量：1

参考文献10

二级参考文献80

共引文献102

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于主题特征的问答文本摘要自动生成研究 被引量：1

参考文献10

二级参考文献80

共引文献102

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于主题特征的问答文本摘要自动生成研究被引量：1