中文语义组块自动抽取方法被引量：2

Research on automatic extraction of Chinese semantic clustering unit

下载PDF

导出

摘要句子语义表述是当前自然语言处理领域亟待解决的重要问题,是制约自然语言能否取得深度应用的重要因素。根据中文文本的特点,摈弃以前自然语言处理语义与句法相分离的观点,提出语义组块概念,并利用深度信念网络的深度学习方法构建对中文语义组块进行自动抽取的模型,模型以句子中名词为核心,将名词与其前后词语进行组合后构成中文语义组块,之后分别使用神经网络、支持向量机和深度信念网络三种抽取方法构建抽取模型,进行了三组实验,最终结果显示在高维大数据背景下,深度信念网络的方法与支持向量机和神经网络相比较具有更好的抽取效果。 Sentence semantic representation is not only a key problem in natural language processing to be solved at present, but also an important restriction factor whether nature language processing is ability to make deep application. Based on the characteristics of the Chinese text, this paper abandoned the point of separating semantic and grammar, and then put forward a new style of semantic clustering unit, and did a research on information extraction with a deep learning model based on deep belief net, the model took the noun as the core in the sentence and combined the noun with its before and after words to from semantic clustering unit. Then, it used three extraction methods, neural network, support vector machine and depth belief network, to construct the extraction model. Experimentally, there are three groups of experimental, finally results show that under the conditions of large data, deep belief network methods compare with support vector machines and neural networks, which has better effect.

作者钟茂生荆佳琦

机构地区华东交通大学信息工程学院

出处《计算机应用研究》 CSCD 北大核心 2018年第2期396-399,共4页 Application Research of Computers

基金国家自然科学基金资助项目(61462027 61363072)

关键词语义表述深度信念网络深度学习中文语义组块 semantic representation deep belief net deep learning Chinese semantic clustering unit

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1魏晓宁.人工智能在自然语言理解技术上的应用[J].中国科技信息,2005(19A):57-57. 被引量：4
2李珩,朱靖波,姚天顺.基于SVM的中文组块分析[J].中文信息学报,2004,18(2):1-7. 被引量：50
3熊李艳,陈建军,钟茂生.基于E-A-V结构的概念图匹配算法[J].计算机应用研究,2014,31(8):2290-2293. 被引量：5
4陈宇,郑德权,赵铁军.基于Deep Belief Nets的中文名实体关系抽取[J].软件学报,2012,23(10):2572-2585. 被引量：70

二级参考文献27

1车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：116
2张蕾.用概念图表示规则及其推理方法[J].西北大学学报（自然科学版）,1994,24(4):319-322. 被引量：3
3夏克文,李昌彪,沈钧毅.前向神经网络隐含层节点数的一种优化算法[J].计算机科学,2005,32(10):143-145. 被引量：122
4赵健,王晓龙,关毅.中文名实体识别中的特征组合与特征融合的比较[J].计算机应用,2005,25(11):2647-2649. 被引量：7
5赵军,金千里,徐波.面向文本检索的语义计算[J].计算机学报,2005,28(12):2068-2078. 被引量：28
6何婷婷,徐超,李晶,赵君喆.基于种子自扩展的命名实体关系抽取方法[J].计算机工程,2006,32(21):183-184. 被引量：25
7刘克彬,李芳,刘磊,韩颖.基于核函数中文关系自动抽取系统的实现[J].计算机研究与发展,2007,44(8):1406-1411. 被引量：59
8SOWA J F. Conceptual structure:information processing in mind and machine[ M]. [ S. 1. ]:Addison-Wesley, 1984.
9OUNIS I, PASCA M. RELIEF: combining expressiveness and rapidity into a single system[ C]//Proc of the 18th SIGIR Conference. 1998: 266 - 274.
10GUARINO N, MASOLO C, VETERE G. OntoSeek: content-based access to the Web [ J ]. IEEE Intelligent Systems, 1999,14 ( 3 ) :70- 80.

共引文献125

1张立民,刘凯.基于深度玻尔兹曼机的文本特征提取研究[J].微电子学与计算机,2015,32(2):142-147. 被引量：9
2刘凯,张立民,孙永威.基于遗传算法的RBM优化设计[J].微电子学与计算机,2015,32(6):96-100. 被引量：8
3陈晓明,周渝.汉语部分句法分析的研究和发展趋势[J].贵州大学学报（自然科学版）,2004,21(4):384-386. 被引量：2
4干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学报,2005,19(4):17-23. 被引量：14
5林煜明,李优.基于SVM的句子组块识别[J].山东大学学报（理学版）,2006,41(3):33-36.
6吕德新,张桂平,蔡东风,余超.基于语义信息的问题分类[J].沈阳航空工业学院学报,2006,23(3):38-40. 被引量：1
7付斌,樊孝忠.基于神经元网络的问句组块分析[J].计算机技术与发展,2006,16(10):94-96.
8张运良.语义块的多元逻辑组合构成研究[J].计算机应用研究,2006,23(11):15-18.
9黄德根,王莹莹.基于SVM的组块识别及其错误驱动学习方法[J].中文信息学报,2006,20(6):17-24. 被引量：6
10索红光,曹淑英.基于组块的中文自动文摘系统研究[J].计算机系统应用,2007,16(3):97-100. 被引量：2

同被引文献18

1侯玉芳.一种基于统计的文本逻辑段划分算法——Dotplotting算法的原理及其实现[J].现代图书情报技术,2005(10):32-34. 被引量：3
2迟呈英,麻志毅,姚天顺.文本理解与汉语文本结构分析[J].中文信息,1997,14(1):9-11. 被引量：9
3汤世平,樊孝忠,朱建勇.基于潜在语义分析的文本连贯性分析[J].计算机应用与软件,2008,25(2):95-96. 被引量：3
4张美娜,迟呈英,战学刚,亓超.基于篇章结构的文本自动标引算法[J].计算机应用与软件,2008,25(9):122-124. 被引量：9
5单永明.一类规范文本篇章结构的自动标引[J].中文信息学报,1998,12(4):47-52. 被引量：4
6刘挺,王开铸.基于篇章多级依存结构的自动文摘研究[J].计算机研究与发展,1999,36(4):479-488. 被引量：7
7高良才,汤帜,林晓帆,俞银燕,房婧.一种基于聚类技术的图书目录识别方法[J].北京大学学报（自然科学版）,2010,46(4):531-538. 被引量：3
8罗明,黄海量.基于词汇-语义模式的金融事件信息抽取方法[J].计算机应用,2018,38(1):84-90. 被引量：17
9黄霞,郑顺义,桂力,赵丽科,马浩.基于点云的谷粒高通量表型信息自动提取技术[J].农业机械学报,2018,49(4):257-264. 被引量：6
10廖建军.基于标签样式和密度模型的网页正文自动抽取[J].情报科学,2018,36(7):123-129. 被引量：3

引证文献2

1王燕萍,徐洪伟,完泾平,周熠.基于非合作博弈的电力培训平台交互信息自动抽取方法[J].自动化技术与应用,2022,41(8):52-55.
2金鑫,邓河,焦鑫.基于篇章层次结构识别的信息提取方法[J].长沙民政职业技术学院学报,2024,31(2):120-126.

1冒小鹭,何爱琴.不稳定型心绞痛的全方位临床护理对策探讨[J].实用临床护理学电子杂志,2017,2(47):35-35.
2白如江,冷伏海,廖君华.一种基于语义组块特征的改进Cosine文本相似度计算方法[J].数据分析与知识发现,2017,1(6):56-64. 被引量：1
3和志强,王丽鹏,张鹏云.基于词共现的关键词提取算法研究与改进[J].电子技术与软件工程,2018(1):144-146. 被引量：1
4张瑾.浅谈主动服务在优质护理中的效果评价[J].实用临床护理学电子杂志,2017,2(27):45-46.
5万娜.高中英语写作困难的成因及对策[J].青少年日记（教育教学研究）,2017,0(8):38-39.
6谭咏梅,王敏达,牛少彰.使用有序词语移动距离特征进行中文文本蕴含识别[J].北京邮电大学学报,2017,40(5):123-128. 被引量：6
7王浩,孙福明.基于人脸识别的身份识别系统[J].电脑知识与技术,2017,13(11X):211-212.
8张玉环,钱江.基于两种LSTM结构的文本情感分析[J].软件,2018,39(1):116-120. 被引量：26
9何军莉.视频元数据抽取应用于个性化IPTV的研究[J].电脑知识与技术（过刊）,2017,23(6X):190-191.
10田生伟,周兴发,禹龙,冯冠军,艾山.吾买尔,李圃.基于双向LSTM的维吾尔语事件因果关系抽取[J].电子与信息学报,2018,40(1):200-208. 被引量：17

计算机应用研究

2018年第2期

浏览历史

内容加载中请稍等...

中文语义组块自动抽取方法被引量：2

参考文献4

二级参考文献27

共引文献125

同被引文献18

引证文献2

相关作者

相关机构

相关主题

浏览历史

中文语义组块自动抽取方法 被引量：2

参考文献4

二级参考文献27

共引文献125

同被引文献18

引证文献2

相关作者

相关机构

相关主题

浏览历史

中文语义组块自动抽取方法被引量：2