信息熵方法及在中文问题分类中的应用被引量：5

Method of information entropy and its application in Chinese question classification

下载PDF

导出

摘要针对中文问题分类方法中布尔模型提取特征信息损失较大的问题,提出了一种新的特征权重计算方法。在提取问题特征时,通过把信息熵算法和医院本体概念模型结合在一起,进行问题的特征模型计算,在此基础上使用支持向量机方法进行中文问题分类。在城域医院问答系统的中文问题集上进行实验,证明了该方法的有效性,大类准确率及小类准确率分别达到89.0%和87.1%,取得了较好的效果。 Aimed at the problem of greater information loss to use Boolean model to extract the feature during Chinese question classification, a new method which calculated feature weight is proposed. When the question feature is extracted, the model of question feature weight is calculated by a combination of information entropy algorithm and hospital ontology concept model. On that basis, the method of Support Vector Machine is used to classify Chinese questions. The classification method is tested on Chinese question set of the city-domain hospital question answering system. This method is proved to be effective and a better result is achieved. Results show that the accuracy of coarse class and fine class achieves 89.0% and 87.1%.

作者张巍陈俊杰

机构地区山西职工医学院信息中心太原理工大学计算机科学与技术学院

出处《计算机工程与应用》 CSCD 2013年第10期129-131,179,共4页 Computer Engineering and Applications

基金国家自然科学基金(No.60970059) 山西省科技攻关项目(No.20110313019) 山西省卫生厅科技攻关计划项目(No.2011073)

关键词信息熵本体问题分类支持向量机 information entropy ontology question classification support vector machine

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1郑实福,刘挺,秦兵,李生.自动问答综述[J].中文信息学报,2002,16(6):46-52. 被引量：165
2Zhang Dell, Lee Wee Sun.Question classification using sup- port vector machines[C]//SIGIR, 2003 : 26-32.
3余正涛,樊孝忠,郭剑毅.基于支持向量机的汉语问句分类[J].华南理工大学学报（自然科学版）,2005,33(9):25-29. 被引量：20
4LI X, ROTH D.Learning question classifiers[C]//Proceedings of the 19th International Conference on Computational Lin- guistics.Taiwan: Association for Computational Linguistics,2002:556-562.
5Cheung Z,Phan K L,Mahidadia A,et al.Feature extraction for learning to classify questions[C]//Proceedings of Advances in Artificial Intelligence.Australia : Springer Berlin/Heidelberg, 2004: 1069-1075.
6段利国,陈俊杰,牛彦清.一种融合多种语义特征的中文问题分类方法[J].太原理工大学学报,2011,42(5):494-498. 被引量：2
7Gruber T R.A Translation.Approach to portable ontology spec- ifications[J].Knowledge Acquisition, 1993 ( 5 ) : 199-220.
8Dumais S T.Improving the retrieval of information from ex- ternal sources[J].Behaviour Research Methods, Instruments and Computers, 1991,23 ( 2 ) : 229-236.
9张宇,刘挺,文勖.基于改进贝叶斯模型的问题分类[J].中文信息学报,2005,19(2):100-105. 被引量：47
10Hsu CW, Lin CJ.A comparison of methods for multiclass support vector machines[J].IEEE Transactions on Neural net- works, 2002,13 (23) : 415-425.

二级参考文献36

1张宇,刘挺,文勖.基于改进贝叶斯模型的问题分类[J].中文信息学报,2005,19(2):100-105. 被引量：47
2文勖,张宇,刘挺,马金山.基于句法结构分析的中文问题分类[J].中文信息学报,2006,20(2):33-39. 被引量：82
3孙景广,蔡东风,吕德新,董燕举.基于知网的中文问题自动分类[J].中文信息学报,2007,21(1):90-95. 被引量：41
4[8]Ulf Hermjakob. Parsing and Question Classification for Question Answering. Proceeding of the workshop on Open-Domain Question Answering at ACL-2001
5[9]Eugene Agichtein, Steve Lawrence, Luis Gravano. Learning Search Engine Specific Query Transformations for Question Answering. ACM 2001,169- 178
6[10]Soo-Min Kim, ae-Ho Baek, Sang-Beom Kim, Hae-Chang Rim Question Answering Considering Semantic Categories and Co-occurrence Density. Proceedings of the night Text Retrieval Conference (TREC-9)
7[11]Marius Pasca, Sanda Harabagiu. High-Performance Question/Answering. 24th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval ( Sigir-01 ). New Orleans, LA. September 9 - 13,2001
8[1]Ittycheriah,M. Franz,W-J Zhu,A. Ratnaparkhi. IBM's Statistical Question Answering System. Proceedings of the night Text Retrieval Conference (TREC-9)
9[2]D. Elworthy. Question Answering Using a Large NLP System. Proceedings of the night Text Retrieval Conference (TREC-9)
10[3]L. Wu,X-j Huang,Y. Guo,B. Liu,Y. Zhang. FDU at TREC-9:CLIR,Filtering and QA Tasks. Proceedings of the night Text Retrieval Conference(TREC-9)

共引文献205

1林旭东,孙爱东,林丕源,刘汉兴.基于依存关系与支持向量机的中文问题分类方法[J].郑州大学学报（理学版）,2009,41(1):64-68. 被引量：2
2张琳,胡杰,应力,浦丽娜.汉语问答系统概念查询扩展研究[J].郑州大学学报（理学版）,2009,41(1):69-72. 被引量：1
3杨潇,万建成,侯金奎.面向问题分类的汉语句法分析[J].计算机研究与发展,2007,44(z2):27-31. 被引量：1
4余正涛,邓锦辉,韩露,毛存礼,郑志蕴,郭剑毅.受限域FAQ中文问答系统研究[J].计算机研究与发展,2007,44(z2):388-393. 被引量：6
5王婧.基于自动问答技术的智能文本机器人[J].科技创业家,2013(8):11-11. 被引量：1
6陈康,武港山.基于Ontology的信息检索技术研究[J].中文信息学报,2005,19(2):51-57. 被引量：29
7盛秋艳.基于Internet的自动问答系统研究[J].现代情报,2005,25(4):81-82. 被引量：2
8吴友政,赵军,段湘煜,徐波.问答式检索技术及评测研究综述[J].中文信息学报,2005,19(3):1-13. 被引量：48
9侯丽敏,朱一,周舫,葛强.基于网络的智能答疑系统的研究[J].微机发展,2005,15(8):120-123. 被引量：3
10余正涛,樊孝忠,郭剑毅.基于支持向量机的汉语问句分类[J].华南理工大学学报（自然科学版）,2005,33(9):25-29. 被引量：20

同被引文献27

1何海芸,袁春风.基于Ontology的领域知识构建技术综述[J].计算机应用研究,2005,22(3):14-18. 被引量：41
2北京语言学院句型研究小组.现代汉语基本句型(续完).世界汉语教学,1991,1:23-29.
3MOREO A, EISMAN E M, CASTRO J L, et al. Learning reg- ular expressions to template-based FAQ retrieval systems [ J ]. Knowledge-Based Systems, 2013, 53: 108-128.
4ZHANG G, JIANG T, BIE R, et al. The architecture of ProMe instant question answering system [ C ]. Cyber-Enabled Distributed Computing and Knowledge Discovery (CyberC), 2013 International Conference on. IEEE, 2013: 237-242.
5SHAW R S, TSAO C F, WU P W. A study of the application of ontology to an FAQ automatic classification system [ J]. Ex- pert Systems with Applications, 2012, 39 ( 14 ) : 11593-11606.
6YENSJ, WUY C, YANGJ C, et al.A support vector ma- chine-based context-ranking model for question answering [ J ]. Information Sciences, 2013, 224: 77-87.
7FIGUEROA A, ATKINSON J. Contextual language models for ranking answers to natural language definition questions [ J ]. Computational Intelligence, 2012, 28 (4): 528-548.
8QIU Xipeng, ZHANG Qi, HUANG Xuanjing. FudanNLP: a toolkit for Chinese natural language processing [ C ] //Pro- ceedings of Annual Meeting of the Association for Computational Linguistics (ACL), 2013.
9李鑫,黄萱菁,吴立德.基于错误驱动算法组合分类器及其在问题分类中的应用[J].计算机研究与发展,2008,45(3):535-541. 被引量：19
10战学刚,伏圣国,迟呈英.改进的基于模式匹配的答案抽取方法[J].情报理论与实践,2009,32(9):105-108. 被引量：1

引证文献5

1李红梅,丁晟春.基于本体和设计情景的产品设计领域知识问答系统研究[J].情报理论与实践,2015,38(1):130-134. 被引量：1
2张栋,李寿山,周国栋.基于答案辅助的半监督问题分类方法[J].计算机工程与科学,2015,37(12):2352-2357. 被引量：4
3杜泽宇,杨燕,贺樑.基于中文知识图谱的电商领域问答系统[J].计算机应用与软件,2017,34(5):153-159. 被引量：38
4徐健,张栋,李寿山,王红玲.基于双语信息的问题分类方法研究[J].中文信息学报,2017,31(5):171-177. 被引量：5
5王建林,陈萌萌,冶存花,魏天楠.基于知识图谱的档案领域问答系统研究与应用[J].软件工程与应用,2024,13(2):190-198. 被引量：1

二级引证文献49

1张博凯,李想.基于知识图谱的Android端农技智能问答系统研究[J].农业机械学报,2021,52(S01):164-171. 被引量：12
2张栋,李寿山,王晶晶.基于问题与答案联合表示学习的半监督问题分类方法[J].中文信息学报,2017,31(1):1-7. 被引量：7
3徐健,张栋,李寿山,王红玲.基于双语信息的问题分类方法研究[J].中文信息学报,2017,31(5):171-177. 被引量：5
4杨芳权.基于包装产业大数据知识图谱的智能问答系统设计[J].现代电子技术,2018,41(4):143-146. 被引量：10
5徐雄峰,张非凡.基于RDF的学科数据库扩充方法研究[J].电脑知识与技术,2018,14(4):242-244.
6韩朝,苗夺谦,任福继.基于粗糙集理论的中文知识问答的知识谓词分析[J].计算机科学,2018,45(6):183-186.
7马亚玲.云环境下多载体图书信息自动分类方法仿真[J].计算机仿真,2018,35(11):285-288. 被引量：3
8张俊飞.基于课程领域本体的中文自动答疑研究[J].电脑知识与技术,2018,14(11Z):184-186. 被引量：1
9李亚梦,张国鹏,刘浏,肖莉,吴浩然.智能外呼系统研究及设计[J].邮电设计技术,2018(12):77-82. 被引量：9
10黄贤英,谢晋,龙姝言.融合词向量及BTM模型的问题分类方法[J].计算机工程与设计,2019,40(2):384-388. 被引量：10

1尹一麒,苗夺谦,王睿智,李道国.不相容决策表中知识约减算法的比较分析(英文)[J].广西师范大学学报（自然科学版）,2006,24(4):42-45. 被引量：3
2覃泽,韦建忠.CSL中测试属性选择方法[J].微计算机信息,2008,24(6):288-289. 被引量：1
3董才正,刘柏嵩.面向问答社区的中文问题分类[J].计算机应用,2016,36(4):1060-1065. 被引量：10
4邱锡鹏,缪有栋,黄萱菁.基于主动学习的中文问题分类数据集构建[J].哈尔滨工业大学学报,2012,44(5):125-128. 被引量：2
5文勖,张宇,刘挺,马金山.基于句法结构分析的中文问题分类[J].中文信息学报,2006,20(2):33-39. 被引量：82
6张巍,张绚,陈俊杰.流形学习算法在中文问题分类中的应用研究[J].计算机应用与软件,2014,31(8):269-272. 被引量：1
7张慧云,张新明,李双,郭文鹭.基于非下采样Contourlet信息熵的纹理图像检索[J].郑州大学学报（理学版）,2011,43(2):57-61. 被引量：2
8游福成.一种新的分层概念信息熵方法及其应用[J].电子学报,2007,35(B12):136-139.
9李茹,宋小香,王文晶.基于汉语框架网的中文问题分类[J].计算机工程与应用,2009,45(31):111-114. 被引量：8
10涂承媛,曾衍钧.非线性科学及其在医学中的应用[J].中国工程科学,2003,5(8):45-49. 被引量：1

计算机工程与应用

2013年第10期

浏览历史

内容加载中请稍等...

信息熵方法及在中文问题分类中的应用被引量：5

参考文献10

二级参考文献36

共引文献205

同被引文献27

引证文献5

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

信息熵方法及在中文问题分类中的应用 被引量：5

参考文献10

二级参考文献36

共引文献205

同被引文献27

引证文献5

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

信息熵方法及在中文问题分类中的应用被引量：5