-
题名一种面向中文信息检索的汉语自动分词方法
被引量:7
- 1
-
-
作者
孙巍
-
机构
黑龙江大学信息管理学院
-
出处
《现代图书情报技术》
CSSCI
北大核心
2006年第7期33-36,共4页
-
文摘
阐述信息检索对汉语分词技术的要求,分析中文信息检索与汉语分词技术结合过程中有待解决的关键问题,并重点针对这些要求及关键问题提出一种面向中文信息检索的汉语自动分词方法。
-
关键词
中文信息检索
汉语自动分词
词典
互联网
正反向最大增字匹配法
-
Keywords
Chinese information retrieval Chinese automatic word segmentation Dictionary
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名论汉语自动分词方法
被引量:55
- 2
-
-
作者
揭春雨
刘源
梁南元
-
出处
《中文信息学报》
CSCD
1989年第1期1-9,共9页
-
文摘
文章简单考查了目前中文信息处理领域中已有的几种主要的汉语自动分词方法,提出自动分词方法的结构模型ASM(d,a,m),对各种分词方法的时间复杂度进行了计算,对于时间复杂度对分词速度的影响,以及分词方法对分词精度的影响也进行了分析;同时指出并论证在自动分词中设立“切分标志”是没有意义的。
-
关键词
汉语自动分词
分词方法
时间复杂度
中文信息处理
匹配法
自然语言理解
字符串匹配
增字
汉字编码方案
自动识别
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语自动分词系统的设计与实现
- 3
-
-
作者
袁琳琳
陈红平
-
机构
贵州职业技术学院
贵州众智物联科技有限公司
-
出处
《信息与电脑(理论版)》
2014年第7期166-168,共3页
-
基金
贵阳市科技局高层次创新型青年科技人才项目(筑科合同[2012HK]209-24号)
贵阳国家高新技术产业开发区管理委员会科技型中小企业技术创新基金(GXCX2013-006)
-
文摘
基于.NET技术,采用改进的增字最大匹配算法3、"退一字组合法"5、自定义规则和Lucene.Net技术实现了汉语自动分词系统。实验证明系统在保证歧义、人名、数字、邮箱识别等方面的切分精度的同时,还保证了较高的切分效率。文章介绍了汉语中的三种歧义定义和示例、系统实现的技术方案、分词算法、系统实现概述与实验结果。
-
关键词
汉语自动分词
分词算法
字串
歧义现象
匹配算法
组合法
分词方法
增字
匹配法
中文信息处理
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
TP391.1
[自动化与计算机技术—计算机应用技术]
-