基于统计学习的自然语言对话系统的设计与实现

Design and Implementation of a Natural Language Chat System Based on Statistical Learning

下载PDF

导出

摘要通过对大规模自然语言语料库的学习和优化多阶Markov链实现了语料的存储和语言信息统计,基于此我们建立了一个语言统计模型。通过该模型可进行答案文本的自动组织,并通过关键词扩展及改进的TF-IDF算法实现了对对话的主题识别与跟踪;采用基于句子相似度的计算模型进行问答式对话的答案筛选。实现了桌面和在线版本的两个人机对话平台。 Asan experiment in natural language processing,via learning from huge corpus based on the optimized multi -order Markov models, we built a language statistical model. This model can automatically create the answer - text, and can achieve topic detection and track based on the extended keywords and an optimized TF - IDF algorithm. A chat system, with a desktop version and an on - line version, was respectively implemented based on a free text in an Open - Domain.

作者李伟通皮德常

机构地区南京航空航天大学信息科学与技术学院

出处《微计算机应用》 2008年第7期38-46,共9页 Microcomputer Applications

基金 2007年江苏省高等教育教改立项研究课题(项目编号64) 南京航天大学"十一五"人才培养项目资助

关键词自然语言处理问答系统马尔可夫模型信息论 TF—IDF Natural Language Processing, Q - A System, Markov Model, Information Theory, TF - IDF

分类号 TP311.52 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献12

1许晓昕,李安贵.一种基于TFIDF的网络聊天关键词提取算法[J].计算机技术与发展,2006,16(3):122-123. 被引量：15
2林鸿飞,丁洪文,杨志豪,赵晶.基于概念和统计的问答系统实现机制[J].大连理工大学学报,2006,46(2):280-285. 被引量：4
3黄天常.信息熵的内涵与外延[J].陇东学院学报（自然科学版）,2006,16(1):15-18. 被引量：16
4刘浩广,蔡绍洪.信息熵及其随机性[J].贵州大学学报（自然科学版）,2007,24(4):350-351. 被引量：15
5罗杰,陈力,夏德麟,王凯.基于新的关键词提取方法的快速文本分类系统[J].计算机应用研究,2006,23(4):32-34. 被引量：17
6戴文华,焦翠珍,徐斌.基于统计的自然语言处理模型[J].咸宁学院学报,2005,25(3):79-82. 被引量：3
7袁聪,张鸿燕,王新梅.Shannon信息论及其新发展[J].通信技术,2002,35(10X):76-78. 被引量：6
8王宇,战学刚,蔡建山.基于网络的中文问答系统的研究[J].计算机工程与应用,2006,42(7):162-165. 被引量：6
9崔桓,蔡东风,苗雪雷.基于网络的中文问答系统及信息抽取算法研究[J].中文信息学报,2004,18(3):24-31. 被引量：46
10吴晨,张全.基于内容分析的中文问答处理算法及系统实现[J].计算机应用研究,2006,23(9):139-142. 被引量：4

二级参考文献67

1欧健文,董守斌,蔡斌.模板化网页主题信息的提取方法[J].清华大学学报（自然科学版）,2005,45(S1):1743-1747. 被引量：70
2荆涛,左万利.基于可视布局信息的网页噪音去除算法[J].华南理工大学学报（自然科学版）,2004,32(z1):84-87. 被引量：21
3常育红,姜哲,朱小燕.基于标记树表示方法的页面结构分析[J].计算机工程与应用,2004,40(16):129-132. 被引量：24
4王琦,唐世渭,杨冬青,王腾蛟.基于DOM的网页主题信息自动提取[J].计算机研究与发展,2004,41(10):1786-1792. 被引量：81
5于满泉,陈铁睿,许洪波.基于分块的网页信息解析器的研究与设计[J].计算机应用,2005,25(4):974-976. 被引量：55
6唐振民,靳从,杨静宇,李远复.一种用于自动标引系统的主题词自动切分方法[J].南京理工大学学报,1995,19(5):401-404. 被引量：2
7吕铁强,于满泉,孟庆发,周立德.基于网页分块的个性化信息采集的研究与设计[J].微电子学与计算机,2005,22(10):120-123. 被引量：10
8黄天常.信息熵的内涵与外延[J].陇东学院学报（自然科学版）,2006,16(1):15-18. 被引量：16
9黄曾阳.HNC（概念层次网络）理论[M].北京:清华大学出版社,1998..
10杨力.美国口语大观,中英文对照[M].合肥:中国科学技术大学出版社,2001..

共引文献153

1李乐强,唐常杰,左劼,邱源枞,段磊,李川.基于同现度和自学习的中文字符组合发现[J].计算机研究与发展,2007,44(z3):268-272. 被引量：2
2邹疆,白明亮,张玉华,陈玲,孙亚萍,丁怀东.中国书画文物修复装裱知识系统构筑及实现[J].云南大学学报（自然科学版）,2009,31(S1):27-30.
3吴友政,赵军,段湘煜,徐波.问答式检索技术及评测研究综述[J].中文信息学报,2005,19(3):1-13.
4陈卫平,王永成,刘传汉.面向对话文本的自动摘要系统的研究[J].计算机仿真,2005,22(5):226-230. 被引量：3
5付鸿鹄.基于W eb的开放领域问答系统研究[J].现代图书情报技术,2005(9):36-40. 被引量：3
6海无颜,严睿.物美集团的人才开发[J].人才资源开发,2005(10):57-57.
7王常亮,滕至阳.语句相似度计算在FAQ中的应用[J].计算机时代,2006(2):24-26. 被引量：10
8王宇,战学刚,蔡建山.基于网络的中文问答系统的研究[J].计算机工程与应用,2006,42(7):162-165. 被引量：6
9何靖.一种问答式检索系统布尔查询生成方法[J].山东大学学报（理学版）,2006,41(3):20-24.
10余正涛,樊孝忠,郭剑毅,耿增民.基于潜在语义分析的汉语问答系统答案提取[J].计算机学报,2006,29(10):1889-1893. 被引量：44

1钱纪蘅.浅谈基于行为理论的工作流模型[J].硅谷,2011,4(8):157-158.
2梁丽.教你用MSN语言对话[J].科技展望（幻想大王）,2007(09X):28-28.
3王志军.Office Web Apps：技术预览版体验报告[J].电脑时空,2009(11):118-119.
4曹叡,王锐,崔亮.赛博空间数据特点分析与管理策略[J].飞航导弹,2014(8):35-40.
5冯晓波,李蕾,刘冬雪.中文问答系统中问题理解的研究[J].中国电子商情（通信市场）,2010(3):142-146.
6叶得学.中文问答系统中问题理解的算法研究[J].数字技术与应用,2012,30(12):101-102.
7周静.瓦特森的一大步[J].知识就是力量,2011(10):1-1.
8王占波.中钢:只用一种语言对话[J].软件世界,2010(2):76-77.
9陈梁.云计算引领组态软件产业革命[J].自动化技术与应用,2010(10):136-137.
10肖喜,翟起滨,田新广,陈小娟,叶润国.基于Shell命令和多阶Markov链模型的用户伪装攻击检测[J].电子学报,2011,39(5):1199-1204. 被引量：6

微计算机应用

2008年第7期

浏览历史

内容加载中请稍等...

基于统计学习的自然语言对话系统的设计与实现

参考文献12

二级参考文献67

共引文献153

相关作者

相关机构

相关主题

浏览历史