-
题名全二分最大匹配快速分词算法
被引量:39
- 1
-
-
作者
李振星
徐泽平
唐卫清
唐荣锡
-
机构
北京航空航天大学机械工程及自动化学院
中国科学院计算技术研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2002年第11期106-109,共4页
-
文摘
分词对于中文信息处理的诸多领域都是一个非常重要的基本组成部分,对于诸如搜索引擎等海量信息处理的应用,分词的速度是至关重要的。该文在对中文编码体系和中文分词的算法进行研究的基础上,提出一种新的分词词典,基于这种分词设计了一种快速的分词算法,给出了算法的实现过程。
-
关键词
全二分最大匹配快速分词算法
自动分词
中文信息处理
数据结构
-
Keywords
Automatic segmentation,Chinese information process,Data structure
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名农村信息化综合网站中信息采集设计与实现
- 2
-
-
作者
王海龙
赵冬
-
机构
中原工学院计算机学院
-
出处
《计算机应用与软件》
CSCD
2010年第6期126-127,190,共3页
-
基金
河南省教育厅软科学项目(2008B520046)
-
文摘
结合农村综合信息网站的数据需求,设计了一个面向农业领域、基于垂直搜索技术搜索引擎的农村信息采集平台模型,并重点讨论了该模型中网页采集、分析及网页分类的运行原理和具体实现过程。运行实践表明,该模型对于农业信息网站,相关性和准确性都较好。
-
关键词
信息采集
垂直搜索
农村信息化词典
全二分最大匹配分词
农村信息化
-
Keywords
Information collection Vertical search Dictionary oriented rural informatization Full binary-search maximal match for Chinese word segmentation Rural informatization
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-