MIS智能接口中汉语分词系统的设计与应用被引量：5

The Design and Application of Chinese Word Segmentation System in a MIS Intelligent Interface

下载PDF

导出

摘要提供汉语检索接口是MIS应用的一大趋势,其主要困难在于如何让计算机理解汉语检索用语,为此本文构建了MIS智能检索接口中的汉语分词系统,并提出了分词策略。对汉语切分中的歧义问题进行了深入的探讨,应用互信息和t-信息差完成了消歧算法的设计。实验表明,该系统具有较高的切分正确率与效率。 It is a trend that MIS provide a Chinese indexing interface,its main difficulty is how to let the computer comprehend Chinese In this paper we set up a word segmentation system of Chinese intelligent indexing interface and propose its word segmentation strategy. After disussing the ambiguity problems of Chinses word segmentation, we give a diambiguity alogrithem based on mutual information and difference t-test. The experimental results show that it has a high segmentation accuracy rate and efficiency.

作者谈文蓉杨宪泽谈进刘莉

机构地区西南民族大学计算机科学与技术学院西南财经大学经济信息工程学院

出处《计算机科学》 CSCD 北大核心 2006年第7期204-206,共3页 Computer Science

基金四川省重点科技攻关项目(05SG022-016) 西南民族大学自然科学研究项目(05NY003)

关键词 MIS 自动分词切分歧义交集型歧义组合型歧义 MIS, Automatic word segmentation, Word segmentation ambiguity, Crossing ambiguity, Combination ambi- guity

分类号 TP391.12 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1Michacl R G, Nils J N. Logical Foundation of Artificial Intelligence. Morgan.Kaufmken Publishers,Inc, 1987
2Nguyend T, Vindrow B. Nearal networks tor Self-Learning Control Systems. IEEE CSM 1990, 10(3) : 18-23
3Christopher D .Manning，Hinrich Schutze．统计自然语百处理基础[M]．苑春法，等译．北京：电子工业出版社，2005．143-163.
4孙茂松,肖明,邹嘉彦.基于无指导学习策略的无词表条件下的汉语自动分词[J].计算机学报,2004,27(6):736-742. 被引量：37
5谈文蓉,杨宪泽.MIS智能处理的近似评判法及其算法研究[J].计算机科学,2005,32(3):226-228. 被引量：6
6曹娟,周经野.一种计算汉字串之间相关程度的新方法[J].中文信息学报,2004,18(4):55-59. 被引量：6
7孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳.利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J].计算机研究与发展,1997,34(5):332-339. 被引量：66
8杨宪泽,谈文蓉,唐向阳,秦沿海.一种混合式机器翻译方法及其算法[J].计算机应用与软件,2005,22(9):142-144. 被引量：6

二级参考文献30

1杨宪泽.基于规则的高效索引算法和排序算法[J].中文信息学报,1993,7(2):67-72. 被引量：13
2周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量：43
3冯志伟.论歧义结构的潜在性[J].中文信息学报,1995,9(4):14-24. 被引量：61
4周强.基于语料库和面向统计学的自然语言处理技术[J].计算机科学,1995,22(4):36-40. 被引量：25
5黄萱菁,吴立德,王文欣,叶丹瑾.基于机器学习的无需人工编制词典的切词系统[J].模式识别与人工智能,1996,9(4):297-303. 被引量：24
6孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳.利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J].计算机研究与发展,1997,34(5):332-339. 被引量：66
7Lai B Y，Proc of ROCLING-IV，1991年
8Zhang J S，Proc of ROCLING-IV，1991年
9王晓龙，科学通报，1989年，13页
10梁南元，中文信息学报，1987年，1期

共引文献103

1刘莉,谈文蓉.统计学习方法在语义消歧中的应用研究[J].西南民族大学学报（自然科学版）,2007,33(1):193-196.
2肖升,胡金柱,姚双云,吴锋文.关系词搭配的联列分析[J].宁夏大学学报（人文社会科学版）,2009,31(6):75-79. 被引量：2
3许桢.基于语义网的文本分类系统设计与实现[J].硅谷,2009,2(18).
4张素娟,郑庆华,胡云华,孙霞.一种面向网络答疑的汉语切分歧义消除算法[J].计算机工程与应用,2004,40(25):55-58. 被引量：4
5孙茂松,肖明,邹嘉彦.基于无指导学习策略的无词表条件下的汉语自动分词[J].计算机学报,2004,27(6):736-742. 被引量：37
6冯志伟.汉字和汉语的计算机处理[J].当代语言学,2001,3(1):1-21. 被引量：23
7孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：101
8张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005,17(1):138-143. 被引量：60
9陈笑蓉,秦进,汪维家,陆汝占.中文文本校对技术的研究与实现[J].计算机科学,2003,30(11):53-55. 被引量：7
10费洪晓,康松林,朱小娟,谢文彪.基于词频统计的中文分词的研究[J].计算机工程与应用,2005,41(7):67-68. 被引量：68

同被引文献43

1刘春辉,金顺福,刘国华,李颖.基于优化最大匹配与统计结合的汉语分词方法[J].燕山大学学报,2009,33(2):124-129. 被引量：9
2彭京,杨冬青,唐世渭,王腾蛟,高军.基于概念相似度的文本相似计算[J].中国科学（F辑:信息科学）,2009,39(5):534-544. 被引量：17
3刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：198
4孙茂松,肖明,邹嘉彦.基于无指导学习策略的无词表条件下的汉语自动分词[J].计算机学报,2004,27(6):736-742. 被引量：37
5谈文蓉,杨宪泽.MIS智能处理的近似评判法及其算法研究[J].计算机科学,2005,32(3):226-228. 被引量：6
6卢志茂,刘挺,李生.统计词义消歧的研究进展[J].电子学报,2006,34(2):333-343. 被引量：28
7罗智勇,宋柔.现代汉语通用分词系统中歧义切分的实用技术[J].计算机研究与发展,2006,43(6):1122-1128. 被引量：19
8肖红,许少华,李欣.具有三级索引词库结构的中文分词方法研究[J].计算机应用研究,2006,23(8):49-51. 被引量：16
9翟凤文,赫枫龄,左万利.字典与统计相结合的中文分词方法[J].小型微型计算机系统,2006,27(9):1766-1771. 被引量：42
10孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳.利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J].计算机研究与发展,1997,34(5):332-339. 被引量：66

引证文献5

1谈文蓉,杨宪泽.MIS智能接口中统计排歧方法的研究与应用[J].西南民族大学学报（自然科学版）,2008,34(5):1035-1038.
2袁健,张劲松,马良.二次回溯中文分词方法[J].计算机应用研究,2009,26(9):3321-3323. 被引量：3
3张彩琴,袁健.改进的正向最大匹配分词算法[J].计算机工程与设计,2010,31(11):2595-2597. 被引量：11
4谈文蓉,冯山,刘莉.语义分析在汉语相似性文献检测中的应用研究[J].四川师范大学学报（自然科学版）,2010,33(4):554-558. 被引量：1
5谈文蓉,刘莉.基于汉语相似性文献检测的特征提取算法研究[J].西南民族大学学报（自然科学版）,2011,37(3):464-468.

二级引证文献14

1崔岩.脚本测试技术在列控中心开发测试中的运用[J].铁路通信信号工程技术,2013,10(S1):149-153. 被引量：2
2梁桢,李禹生.基于Hash结构词典的逆向回溯中文分词技术研究[J].计算机工程与设计,2010,31(23):5158-5160. 被引量：5
3谈文蓉,刘莉.基于汉语相似性文献检测的特征提取算法研究[J].西南民族大学学报（自然科学版）,2011,37(3):464-468.
4蒋建洪,赵嵩正,罗玫.词典与统计方法结合的中文分词模型研究及应用[J].计算机工程与设计,2012,33(1):387-391. 被引量：18
5陈勇,王昌明.基于自然语言理解的故障诊断方法研究[J].计算机测量与控制,2012,20(3):610-613. 被引量：2
6胡阿明,王卫东.中文分词歧义识别算法的优化[J].现代电子技术,2012,35(8):107-109. 被引量：2
7郑阳,莫建文.基于专业术语提取的中文分词方法[J].大众科技,2012,14(4):20-23. 被引量：1
8王成平.计算机彝文自动分词技术的设计研究[J].湘潭大学自然科学学报,2012,34(3):107-113. 被引量：4
9莫建文,郑阳,首照宇,张顺岚.改进的基于词典的中文分词方法[J].计算机工程与设计,2013,34(5):1802-1807. 被引量：40
10李鑫星,陈英义,李道亮,傅泽田,张领先.面向移动终端的农业知识文语转换系统[J].农业机械学报,2015,46(1):266-271. 被引量：2

1史晓东,卢亚军.央金藏文分词系统[J].中文信息学报,2011,25(4):54-56. 被引量：30
2刘禹孜,何中市.一种基于SVM和规则消除组合型歧义的算法[J].重庆大学学报（自然科学版）,2005,28(10):50-53. 被引量：2
3娄珽,宋柔,李卫亮,罗智勇.现代汉语分词系统通用接口设计与实现[J].中文信息学报,2001,15(5):1-7. 被引量：6
4王中立.汉语自动分词中切分歧义及处理技术[J].许昌学院学报,2006,25(2):118-121. 被引量：1
5程冲,黄水清.自适应分词算法中的未登录词识别技术研究[J].情报学报,2009,28(4):530-536. 被引量：5
6张辉丽,孟昭鹏,王慧芝.汉语自动分词中的歧义处理[J].微计算机应用,2006,27(6):685-688. 被引量：3
7袁鼎荣,李新友,邵延振.用于中文分词的组合型歧义消解算法[J].计算机应用与软件,2011,28(6):57-58. 被引量：5
8李萍.试论现代汉语词语的切分技术[J].中国新技术新产品,2010(24):232-232.
9葛锐.汉语分词技术初探[J].软件,2013,34(3):140-141. 被引量：4
10沈达阳,孙茂松,黄昌宁.汉语分词系统中的信息集成和最佳路径搜索方法[J].中文信息学报,1997,11(2):34-47. 被引量：13

计算机科学

2006年第7期

浏览历史

内容加载中请稍等...

MIS智能接口中汉语分词系统的设计与应用被引量：5

参考文献8

二级参考文献30

共引文献103

同被引文献43

引证文献5

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

MIS智能接口中汉语分词系统的设计与应用 被引量：5

参考文献8

二级参考文献30

共引文献103

同被引文献43

引证文献5

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

MIS智能接口中汉语分词系统的设计与应用被引量：5