目标依赖的作者身份识别方法被引量：1

Target-dependent method for authorship attribution

下载PDF

导出

摘要作者身份识别任务旨在判断一篇文档的作者,但目前已有的作者身份识别方法都是目标独立的,意味着这些方法在预测作者身份时假设没有任何限定条件,这与实际情况不相符合。为了解决限定条件下的作者身份识别问题,提出了一种目标依赖的作者身份识别方法TDAA。首先,使用用户评论对应的商品ID作为限定信息;其次,为了使文本建模过程更加具有普适性,使用BERT提取预训练的评论文本特征;然后,使用卷积神经网络(CNN)进行深层次的文本特征提取;最后,为了将两种不同的信息融合起来,讨论了两种不同的融合方式。在亚马逊电影评论(Amazon MovieandTV)和CD评论(CDsandVinyl5)两个数据集上的实验结果表明,所提出的方法在精确率评价指标上较对比方法提高了4%~5%。 Authorship attribution is the task of deciding who is the author of a particular document,however,the traditional methods for authorship attribution are target-independent without considering any constraint during the prediction of authorship,which is inconsistent with the actual problems.To address the above issue,a Target-Dependent method for Authorship Attribution(TDAA)was proposed.Firstly,the product ID corresponding to the user review was chosen to be the constraint information.Secondly,Bidirectional Encoder Representation from Transformer(BERT)was used to extract the pre-trained review text feature to make the text modeling process more universal.Thirdly,the Convolutional Neural Network(CNN)was used to extract the deep features of the text.Finally,two fusion methods were proposed to fuse the two different information.Experimental results on Amazon MovieandTV dataset and CDsandVinyl5 dataset show that the proposed method can increase the accuracy by 4%-5%compared with the comparison methods.

作者李扬张伟彭晨 LI Yang;ZHANG Wei;PENG Chen(School of Computer Science and Technology,East China Normal University,Shanghai 200062,China;Institute of Electronics,Chinese Academy of Sciences,Suzhou Jiangsu 215123,China)

机构地区华东师范大学计算机科学与技术学院中国科学院电子学研究所苏州研究院

出处《计算机应用》 CSCD 北大核心 2020年第2期473-478,共6页 journal of Computer Applications

基金国家自然科学基金青年基金资助项目(61702190)~~

关键词作者身份识别目标依赖卷积神经网络信息融合预训练语言模型 authorship attribution target-dependent Convolutional Neural Network(CNN) information fusion pretrained language model

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献9

1李妮,关焕梅,杨飘,董文永.基于BERT-IDCNN-CRF的中文命名实体识别方法[J].山东大学学报（理学版）,2020,55(1):102-109. 被引量：51
2石春丹,秦岭.基于BGRU-CRF的中文命名实体识别方法[J].计算机科学,2019,46(9):237-242. 被引量：26
3冀相冰,朱艳辉,李飞,徐啸.基于Attention-BiLSTM的中文命名实体识别[J].湖南工业大学学报,2019,33(5):73-78. 被引量：9
4王子牛,姜猛,高建瓴,陈娅先.基于BERT的中文命名实体识别方法[J].计算机科学,2019,46(S11):138-142. 被引量：85
5王伟,孙玉霞,齐庆杰,孟祥福.基于BiGRU-attention神经网络的文本情感分类模型[J].计算机应用研究,2019,36(12):3558-3564. 被引量：61
6古雪梅,刘嘉勇,程芃森,何祥.基于增强BiLSTM-CRF模型的推文恶意软件名称识别[J].计算机科学,2020,47(2):245-250. 被引量：6
7王月,王孟轩,张胜,杜渂.基于BERT的警情文本命名实体识别[J].计算机应用,2020,40(2):535-540. 被引量：41
8杨飘,董文永.基于BERT嵌入的中文命名实体识别方法[J].计算机工程,2020,46(4):40-45. 被引量：92
9王宁,李世林,刘堂亮,赵伟.基于注意力机制的BiGRU判决结果倾向性分析[J].计算机系统应用,2019,28(3):191-195. 被引量：8

引证文献1

1王雪梅,陶宏才.基于深度学习的中文命名实体识别研究[J].成都信息工程大学学报,2020,35(3):264-270. 被引量：4

二级引证文献4

1赵辉,庞海婷,冯珊珊,韩东辰.中文命名实体识别技术综述[J].长春工业大学学报,2021,42(5):444-450. 被引量：7
2王宗泽,张吴波.完全自注意力融合多元卷积的中文命名实体识别研究[J].佳木斯大学学报（自然科学版）,2022,40(5):34-38.
3孙弋,梁兵涛.基于BERT和多头注意力的中文命名实体识别方法[J].重庆邮电大学学报（自然科学版）,2023,35(1):110-118. 被引量：7
4夏青,石明钧.基于MacBERT的徽派古建筑修缮文本实体识别方法研究[J].电脑知识与技术,2023,19(31):44-47.

1曾明睿,袁梦奇,邵曦,鲍秉坤,徐常胜.文本特征提取的研究进展[J].南京信息工程大学学报（自然科学版）,2019,11(6):706-715. 被引量：1
2闻秀萍.谈如何提高高中生物教学的有效性思路构建[J].文学少年,2019,0(11):0242-0242.
3李玲.民航运输专业课堂教学研究[J].视界观,2019,0(20):0174-0174.
4张安伦.高中物理核心素养的培养途径探究[J].东西南北（教育）,2020,0(6):0130-0130.
5梁宇发.信息技术教学的几点体会[J].儿童大世界（教学研究）,2019(11):12-12.
6杨俊峰,尹光花.基于word2vec和CNN的短文本聚类研究[J].信息与电脑,2019,31(24):20-22. 被引量：4
7蒋婷汝.中华优秀传统文化融入中职班级管理的探讨[J].山海经,2020(2):0245-0245.
8毛琼.建筑统计数据质量问题分析[J].智富时代,2019,0(12):0351-0351.
9朱武祥,魏炜.破除独角兽公司定位认知的“信息不对称”[J].中欧商业评论,2020,0(1):63-67.
10于海霞,许少娟,刁立强.校企合作背景下电类基础课程案例教学探索与实践[J].中国现代教育装备,2020(3):103-106. 被引量：3

计算机应用

2020年第2期

浏览历史

内容加载中请稍等...

目标依赖的作者身份识别方法被引量：1

同被引文献9

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

目标依赖的作者身份识别方法 被引量：1

同被引文献9

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

目标依赖的作者身份识别方法被引量：1