-
题名全二分最大匹配快速分词算法
被引量:39
- 1
-
-
作者
李振星
徐泽平
唐卫清
唐荣锡
-
机构
北京航空航天大学机械工程及自动化学院
中国科学院计算技术研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2002年第11期106-109,共4页
-
文摘
分词对于中文信息处理的诸多领域都是一个非常重要的基本组成部分,对于诸如搜索引擎等海量信息处理的应用,分词的速度是至关重要的。该文在对中文编码体系和中文分词的算法进行研究的基础上,提出一种新的分词词典,基于这种分词设计了一种快速的分词算法,给出了算法的实现过程。
-
关键词
全二分最大匹配快速分词算法
自动分词
中文信息处理
数据结构
-
Keywords
Automatic segmentation,Chinese information process,Data structure
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名一种改进的中文分词算法
被引量:5
- 2
-
-
作者
祁文青
-
机构
黄石理工学院计算机学院
-
出处
《黄石理工学院学报》
2007年第4期23-25,37,共4页
-
文摘
汉语自动分词是汉语信息处理的前提,词库是汉语自动分词的基础。文章提出了一种在对词库进行改造的基础上改进的匹配算法,突破了最大匹配分词算法分词的长度限制,提高了中文分词的速度和效率。
-
关键词
中文信息处理
中文分词
最大匹配法分词算法
-
Keywords
Chinese information processing
Chinese word segmentation
Maximum Matching Method for Chinese Word Segmentation
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名课程知识检索系统中检索器模块的实现
被引量:1
- 3
-
-
作者
薛醒思
-
机构
福建工程学院计算机与信息科学系
-
出处
《闽江学院学报》
2008年第5期74-77,共4页
-
文摘
提出了一个基于领域本体的课程知识检索系统,探讨了个性化检索技术在系统的检索器模块中的应用,并详细介绍了检索器模块中基于本体的逆向最大匹配分词算法(RMM)和分层遍历森林算法的实现,为课程知识检索系统进一步的开发工作奠定了基础.
-
关键词
课程知识检索系统
领域本体
逆向最大匹配分词算法
分层遍历森林算法
-
Keywords
course knowledge retrieval system
domain ontology
reverse directional maximum matchmethod
hierarchical traversal of forest method
-
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
-
-
题名课程词典系统的设计
- 4
-
-
作者
于张红
蹇玉清
张海涛
王建猛
王纲
-
机构
河北科技师范学院计算机系
河北科技师范学院网络与现代教育技术中心
河北科技师范学院人事处
-
出处
《河北科技师范学院学报》
CAS
2007年第3期50-53,58,共5页
-
文摘
采用面向对象的编程工具和数据库技术,使用改进的机械分词方法,开发了适合教学方面的中文索引和检索服务系统(课程词典)。系统负责搜索和获取指定范围内的有关数据。对检索服务系统的工作原理和关键技术进行了讨论和分析。该系统基于"自然语言理解"的智能检索,背景为对教学方面信息检索系统的设计与开发。系统中,无论是对用户提问的分析,还是对所检索的信息都是以汉语自动分词为基础加工处理,因而将汉字串切分为汉词串的分词问题即为该系统研发的前提和关键。
-
关键词
中文信息处理
分词技术
信息检索
最大匹配分词算法
-
Keywords
Chinese information processing
word segmentation technology
information retrieving
Max Matchword segmentation arithmetic
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-