数据库受限汉语自然语言查询的分词研究与实现被引量：1

The research and implementation of word segmentation of database natural language query based on restricted Chinese

下载PDF

导出

摘要对数据库受限汉语自然语言查询语句进行分词处理.分词算法分为两个部分,第一部分对最大匹配法进行改进,改进的核心思想是体现整句长词优先的原则,改进后的算法能够减少切分歧义;第二部分根据实例数据库的查询需要处理姓名和不稳定的属性值两类未登录词,未登录词的识别对后续句子的理解起着至关重要的作用. This paper describes the word segmentation of database natural language query based on restricted Chinese. The word segmentation algorithm is made up of two parts. The first part improves the maximum matching segmentation algorithm that fully embodies the principle of priority of long word on a whole sentence. The improved algorithm can decrease the ambiguity of segmentation. The second part processes two sort of unlisted words that are name and unstable property value according to the requirement of instance database. The recognition of unlisted words plays an important role in the following understanding to sentence.

作者胡婕李跃新

机构地区湖北大学数学与计算机科学学院

出处《湖北大学学报（自然科学版）》 CAS 北大核心 2005年第4期331-335,共5页 Journal of Hubei University：Natural Science

关键词受限汉语自然语占分词算法最大匹配法长词优先术登录词 natural language based on restricted Chinese word segmentation algorithm maximum mate hing （ MM ） segmentation algorithm priority of long word unlisted word

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1马东坡.Internet中文智能搜索引挚汉语自动分词系统设计[D]中国优秀博硕士论文全文数据库[DB].,2002:48～49.

同被引文献14

1信息处理用现代汉语词类标记集规范[J].语言文字应用,2001(3):16-20. 被引量：13
2马晓娜,杨承磊.自然语言查询系统中的句法分析与算法实现[J].山东建筑工程学院学报,2005,20(1):76-81. 被引量：2
3马竹根.一种自然语言理解中语法分析的算法设计和实现[J].计算机时代,2005(10):8-10. 被引量：5
4胡晓军.数据库自然语言查询接口探讨[J].福建电脑,2006,22(5):78-79. 被引量：2
5PANG YAO, LONG YI, QIAN CHENYANG, et al. Researchin a Chinese Word Segmentation Method Based on Spatial Infor-mation Query of GIS[C] //Geoinformatics 2008 and Joint Con-ference on GIS and Built Environment. Proceedings of SP1E.Riga, Latvia,2008, 7143:714301-1-8.
6LEVENSHTE1N V. Binary Codes Capable of Correcting Dele-tions ,Insertions,and Reversals [ J ] . Soviet Physics Doklady,1966,10(8);707-710.
7丁振波.浅析智能信息检索系统中存在的问题及解决思路[J].科教文汇,2009(8):279-279. 被引量：1
8明小娜,龙毅,钱程扬,张翎.基于受限自然语言的GIS命令解析方法[J].地球信息科学,2009,11(2):183-188. 被引量：3
9邓敏,黄雪萍,刘慧敏,李光强.利用自然语言空间关系的空间查询方法研究[J].武汉大学学报（信息科学版）,2011,36(9):1089-1093. 被引量：7
10袁晓峰.基于《知网》的词语相似度计算研究[J].成都大学学报（自然科学版）,2011,30(4):339-341. 被引量：5

引证文献1

1盖森,刘建忠,熊伟,张心悦,李江鹏.自然语言空间查询中应用编辑距离的规则匹配模型[J].测绘科学技术学报,2015,32(4):416-421. 被引量：1

二级引证文献1

1李诚,毛曦,路文娟,王继周,董文洁.基于知识图谱的自然语言式地名查询方法研究[J].测绘科学,2024,49(4):187-195.

1姚磊岳,熊建英.一种基于中文分词算法的信息过滤技术[J].科技广场,2007(7):111-113.
2金在全,赵照,杜秀全,张东.一种改进的增字最大匹配算法[J].科学技术与工程,2007,7(18):4761-4764. 被引量：12
3路永刚,赵伟.一种改进的MM分词方法的研究与实现[J].长春工业大学学报,2006,27(4):320-323. 被引量：3
4赵晓凡,胡顺义.基于正向最大匹配的汉语分词[J].安阳师范学院学报,2010(5):13-15. 被引量：2
5尚文刚.医学文献全文检索的中文分词方法研究[J].广东医学院学报,2005,23(4):473-475. 被引量：1
6拉毛措,安见才让.基于ASP.NET的藏文分词系统设计与实现[J].计算机光盘软件与应用,2014,17(23):267-268. 被引量：1
7张玉茹.中文分词算法之最大匹配算法的研究[J].现代计算机,2011,17(16):24-26. 被引量：5
8梁胜,成卫青.基于组合型中文分词技术的改进[J].南京邮电大学学报（自然科学版）,2013,33(6):112-117. 被引量：2
9岳晓光,梁晓诚,麦范金,赵子强.基于.NET的中文分词系统设计与实现[J].微计算机信息,2010,26(12):215-216. 被引量：7
10王中立.汉语自动分词中切分歧义及处理技术[J].许昌学院学报,2006,25(2):118-121. 被引量：1

湖北大学学报（自然科学版）

2005年第4期

浏览历史

内容加载中请稍等...

数据库受限汉语自然语言查询的分词研究与实现被引量：1

参考文献1

同被引文献14

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

数据库受限汉语自然语言查询的分词研究与实现 被引量：1

参考文献1

同被引文献14

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

数据库受限汉语自然语言查询的分词研究与实现被引量：1