Word2vec的核心架构及其应用被引量：68

The Architecture of Word2vec and Its Applications

下载PDF

导出

摘要神经网络概率语言模型是一种新兴的自然语言处理算法,该模型通过学习训练语料获得词向量和概率密度函数,词向量是多维实数向量,向量中包含了自然语言中的语义和语法关系,词向量之间余弦距离的大小代表了词语之间关系的远近,词向量的加减代数运算则是计算机在"遣词造句".近年来,神经网络概率语言模型发展迅速,Word2vec是最新技术理论的合集.首先,重点介绍Word2vec的核心架构CBOW及Skip-gram;接着,使用英文语料训练Word2vec模型,对比两种架构的异同;最后,探讨了Word2vec模型在中文语料处理中的应用. Word2vec is a combination of neural probabilistic language model,which includes CBOW model and Skipgram model in terms of architecture. This paper will introduce the technology of Word2 vec. Firstly,the paper will elaborate the theory of Word2 vec architecture; secondly,an English corpus which is extracted from Wikipedia will be used to train the model,and a set of results will be shown; lastly,the application of Word2 vec in the language of Chinese will be explored,a result will also be presented precisely.

作者熊富林邓怡豪唐晓晟

机构地区北京邮电大学信息与通信工程学院北京邮电大学WTI实验室

出处《南京师范大学学报（工程技术版）》 CAS 2015年第1期43-48,共6页 Journal of Nanjing Normal University(Engineering and Technology Edition)

关键词自然语言处理 Word2vec CBOW Skip-gram 中文语言处理 NPL Word2vec CBOW Skip-gram Chinese-language-processing

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1Bengio Y,Ducharme R, Vincent P. A neural probabilistic language model[ J]. Journal of Machine Learning Research,2003,3(7) :1 137-1 155.
2Michael U G, AapoHyvrinen. Noise-contrastive estimation of unnormalized statistical models,with applications to natural imagestatistics[ J] ? The Journal of Machine Learning Research,2012,13( 2) ;307-361.
3Tomas M,Chen K,Corrado G. Efficient estimation of word representations in vector space[ EB/OL].( 2013-08-18) [ 2013-09-07]http : / / arxiv. org/ abs/1301.3781.
4Bengio Y,LeCun Y. Scaling Learning Algorithms Towards AI [ M ]//Large-Scale Kernel Machines. Cambridge: MIT Press,2007.
5Mikolov T, Karafi M, Burget L, et al. Recurrent neural network based language model [ C]//Proceedings of Interspeech.Chiba,Japan:MIT Press,2010: 131 -138.
6Mikolov T,Ilya S,Kai C,et al. Distributed representations of words and phrases and their compositionality[EB/OL]. [2013-10-16]http:// arxiv.org/ abs/1310.4546.
7Elman J. Finding structure in time[ J]. Cognitive Science, 1990,14(7) : 179-211.
8Rumelhart D E, Hinton G E, Williams R J. Learning internal representations by back-propagating errors[ J]. Nature, 1986,323(9) :533-536.
9Andriy M,Yee W T. A fast and simple algorithm for training neural probabilistic language models[ EB/OL] .(2009-10-12)[2012-06-10] http : / / arxiv. org/ftp/arxiv/papers/12061.
10Frederic M, Yoshua B. Hierarchical probabilistic neural network language model [ C ] //Proceedings of the International Work-shop on Artificial Intelligence and Statistics. Barbados : MIT Press, 2005 : 246-252.

二级参考文献25

1McCarthyJ. Programs with common sense[CJ IIProc of the National Physics Lab. London: HMSO. 1958: 300-307.
2Lenat D. Guha R. Building Large Knowledge-Based Systems: Representation and Inference in the CYC Project[M]. Boston: Addison-Wesley. 1989.
3Miller A. WordNet: An online lexical database for English[J]. Communications of the ACM. 1995. 38(1]): 39-41.
4Ponzetto S. Strube M. Deriving a large scale taxonomy from Wikipedia[CJ IIProc of the 22nd National Conf on Artificial Intelligence. Menlo Park. CA: AAAI Press. 2007: 1440- 1445.
5Liu Kaipeng , Fang Binxing , Zhang Weizhe. Ontology emergence from folksonomies[CJ IIProc of the 19th ACM Int Conf on Information and Knowledge Management. New York: ACM. 2010: 1109-l118.
6Na st ase V. Strube M. Transforming Wikipedia into a large scale multilingual concept network[J]. Artificial Intelligence. 2013.194(1): 62-8,5.
7TangJ ie , Leung Hofung ? Luo Qiong , et al. Towards ontology learning from folksonomies[CJ IIProc of the 21st IntJoint Conf on Artificial Intelligence. Menlo Park. CA: AAAJ Press. 2009: 2089-2094.
8Strube M. Ponzetto S. WikiRelatel Computing semantic relatedness using Wikipedia[C] IIProc of the 21st National Conf on Artificial Intelligence. Menlo Park. CA: AAAI Press , 2006: 1419-1424.
9Gruber T. A translation approach to portable ontology specifications[J]. Knowledge Acquisition. 1993, 5 (2): 199- 220.
10Bu Fan, Hao v?. Zhu Xiaoyan, Semantic relationship discovery with Wikipedia structure[CJ IIProc of the 22nd IntJoint Conf on Artificial Intelligence. Menlo Park. CA: AAAI Press, 2011: 1770-1775.

同被引文献578

1吴蔚.新冠肺炎疫情中的心理危机干预:基于汶川地震心理危机干预的启示[J].中国应急管理科学,2020(5):62-69. 被引量：4
2江溯.人工智能作为刑事责任主体:基于刑法哲学的证立[J].法制与社会发展,2021(3):111-127. 被引量：34
3梁宇.对外汉语教材供求状况的调查与分析[J].辽宁教育行政学院学报,2020,0(1):85-90. 被引量：1
4冯连刚.一种改进的基于N元语法模型的中文分词方法[J].中文科技期刊数据库（全文版）自然科学,2016(10):284-284. 被引量：1
5王锡生.500kV变电站计算机监控系统若干问题的探讨[J].高电压技术,2004,30(z1):122-123. 被引量：3
6高洁,吉根林.文本分类技术研究[J].计算机应用研究,2004,21(7):28-30. 被引量：36
7吕学强,吴宏林,姚天顺.无双语词典的英汉词对齐[J].计算机学报,2004,27(8):1036-1045. 被引量：11
8孙晋文,肖建国.基于SVM的中文文本分类反馈学习技术的研究[J].控制与决策,2004,19(8):927-930. 被引量：16
9李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量：95
10陈炯,张永奎.一种基于词聚类的中文文本主题抽取方法[J].计算机应用,2005,25(4):754-756. 被引量：17

引证文献68

1叶佳鑫,熊回香,蒋武轩.一种融合患者咨询文本与决策机理的医生推荐算法[J].数据分析与知识发现,2020,4(2):153-164. 被引量：9
2相若晨,孙美凤.基于词向量与句法树的中文句子情感分析[J].计算机与现代化,2016(8):27-31. 被引量：2
3李冬白,田生伟,禹龙,艾斯卡尔.艾木都拉,吐尔根.依布拉音.深度学习的维吾尔语语句隐式情感分类[J].计算机工程与设计,2016,37(9):2577-2580. 被引量：5
4张兴厅,文栋,雷健波.基于词向量的消费者体检健康词表研究[J].中国卫生信息管理杂志,2017,14(5):707-711. 被引量：3
5张雷.基于word2vec和TF-IDF算法实现酒店评论的个性化推送[J].电脑与信息技术,2017,25(6):8-11. 被引量：5
6王飞,谭新.一种基于Word2Vec的训练效果优化策略研究[J].计算机应用与软件,2018,35(1):97-102. 被引量：20
7薛炜明,侯霞,李宁.一种基于word2vec的文本分类方法[J].北京信息科技大学学报（自然科学版）,2018,33(1):71-75. 被引量：16
8邬明强,张奎.结合TFIDF方法与Skip-gram模型的文本分类方法研究[J].电子技术与软件工程,2018(6):162-163. 被引量：1
9蒋丽,薛善良.基于改进k-means算法的文本聚类[J].计算机与现代化,2018(4):17-21. 被引量：6
10唐亮,席耀一,彭波,刘香伟,易绵竹.基于词向量的越汉跨语言事件检索研究[J].中文信息学报,2018,32(3):64-70. 被引量：3

二级引证文献421

1胡媛敏,张寿明.基于信息论的TF-IDF算法在文本分类中的应用研究[J].中国水运（下半月）,2021,21(12):31-33. 被引量：6
2刘艳红.自动驾驶的风险类型与法律规制[J].国家检察官学院学报,2024,32(1):114-130. 被引量：5
3嵇海香,任南.基于流行三要素的视频热度影响因素研究——以B站为例[J].知识管理论坛,2022(1):49-60. 被引量：2
4洪海蓝,李文林,杨涛,李玥,梅文静.基于知识图谱的海洋中药智能问答系统的设计与实现[J].世界科学技术-中医药现代化,2023(6):1935-1941. 被引量：4
5余晓蕾,朱笛,王立昊,林军,向剑文.基于知识图谱的嵌入式操作系统测试用例复用推荐模型[J].武汉大学学报（理学版）,2023,69(2):187-194. 被引量：3
6沐乐,徐林云.风险感知对公众谣言接受度的影响机制研究——以新冠肺炎疫情为例[J].风险灾害危机研究,2021(1):166-186. 被引量：2
7刘佳萌.智能音箱语音交互流程及设计方法探寻[J].大众文艺（学术版）,2020(6):125-126. 被引量：2
8热孜瓦姑丽·吾斯曼,艾孜尔古丽·玉素甫.论现代的维吾尔语情感分析方法进展[J].电脑知识与技术,2020,0(4):178-179.
9李茂胜,王天一.基于多特征融合的羊养殖问句相似度评价方法[J].智能计算机与应用,2021,11(12):22-27.
10朱剑华,李莉,张秋实,李赫,李伟凡,徐健.长江航道信息智能推送服务方法研究[J].测绘地理信息,2022,47(5):110-113.

1阳馨,蒋伟,刘晓玲.基于多种特征池化的中文文本分类算法[J].四川大学学报（自然科学版）,2017,54(2):287-292. 被引量：11
2于洁.Skip-Gram模型融合词向量投影的微博新词发现[J].计算机系统应用,2016,25(7):130-136. 被引量：3
3李天彩,刘欣,王波,席耀一,王晓雯.短文本信息流中的用户建模与应用[J].信息工程大学学报,2016,17(2):225-230. 被引量：1
4梁喜涛,顾磊.中文分词与词性标注研究[J].计算机技术与发展,2015,25(2):175-180. 被引量：48
5蔡慧苹,王丽丹,段书凯.基于word embedding和CNN的情感分类模型[J].计算机应用研究,2016,33(10):2902-2905. 被引量：20
6南桥.语言与人生观[J].发现,2013(2):51-52.
7朱波,侯敏.基于边界特征的情感新词提取方法[J].重庆邮电大学学报（自然科学版）,2014,26(6):796-802.
8雷军.影驰750A SLI魔盒版强大的DIY玩家主板[J].微型计算机,2008(24):73-73.
9中文语言资源共享新技术推出[J].河南科技,2003,22(4):39-39.
10侯宏旭,刘群,刘志文,张国强.Skip-N蒙古文统计语言模型[J].内蒙古大学学报（自然科学版）,2008,39(2):220-224. 被引量：8

南京师范大学学报（工程技术版）

2015年第1期

浏览历史

内容加载中请稍等...

Word2vec的核心架构及其应用被引量：68

参考文献13

二级参考文献25

同被引文献578

引证文献68

二级引证文献421

相关作者

相关机构

相关主题

浏览历史

Word2vec的核心架构及其应用 被引量：68

参考文献13

二级参考文献25

同被引文献578

引证文献68

二级引证文献421

相关作者

相关机构

相关主题

浏览历史

Word2vec的核心架构及其应用被引量：68