-
题名全二分最大匹配快速分词算法
被引量:39
- 1
-
-
作者
李振星
徐泽平
唐卫清
唐荣锡
-
机构
北京航空航天大学机械工程及自动化学院
中国科学院计算技术研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2002年第11期106-109,共4页
-
文摘
分词对于中文信息处理的诸多领域都是一个非常重要的基本组成部分,对于诸如搜索引擎等海量信息处理的应用,分词的速度是至关重要的。该文在对中文编码体系和中文分词的算法进行研究的基础上,提出一种新的分词词典,基于这种分词设计了一种快速的分词算法,给出了算法的实现过程。
-
关键词
全二分最大匹配快速分词算法
自动分词
中文信息处理
数据结构
-
Keywords
Automatic segmentation,Chinese information process,Data structure
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名基于有向图的双向匹配分词算法及实现
被引量:7
- 2
-
-
作者
陈耀东
王挺
-
机构
国防科学技术大学计算机学院
-
出处
《计算机应用》
CSCD
北大核心
2005年第6期1442-1444,共3页
-
基金
国家 863计划项目
国家自然科学基金资助项目(60403050)
-
文摘
在分析了现有各种汉语分词算法及其优缺点的基础上,提出以句子覆盖率和分词覆盖率作为评价分词方法的指标,详细介绍了基于网络有向图的双向匹配分词算法的设计与实现,该算法对经典的最大匹配分词算法进行了改进,通过带覆盖歧义标志的有向图生成多候选分词序列。与最大匹配算法和全切分算法的比较实验显示,基于有向图的双向匹配算法以低复杂度实现了高覆率盖。
-
关键词
句子覆盖率
分词覆盖率
双向最大匹配算法
全切分
网络有向图
-
Keywords
sentence-coverage rate
word-coverage rate
Bi-directional Maximum Match
omni-segmentation
directed graph
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名一种改进的逆向匹配快速切分算法
- 3
-
-
作者
李娟
周贤善
-
机构
长江大学计算机科学学院
-
出处
《信息系统工程》
2010年第2期133-134,142,共3页
-
文摘
在中文切分算法设计上,好的算法一般要注重两个方面,一个是提高切分精度,另一个是提高切分速度。本文在逆向最大匹配的算法切分基础上,结合临近匹配算法在中文切分速度方面的优势,提出了一种逆向匹配快速切分算法。此算法由于使用了索引排序查找,所以在速度上比一般的全库扫描更快;在切分精度上,根据汉语语句中心语偏后的特点,采用了逆序匹配,可以更进一步提高切分精度。并通过在综合语料库中的语料上的分析,交集型歧义的自动消解上有着很好的优势。
-
关键词
中文自动分词
逆向最大匹配算法
临近匹配算法
改进的逆向匹配快速切分算法
交集型歧义消解
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名综合最大匹配和歧义检测的中文分词粗分方法
被引量:3
- 4
-
-
作者
李国和
刘光胜
秦波波
吴卫江
李洪奇
-
机构
中国石油大学地球物理与信息工程学院
中国石油大学(北京)油气资源与探测国家重点实验室
石大兆信数字身份管理与物联网技术研究院
-
出处
《计算机工程与应用》
CSCD
2012年第14期139-142,167,共5页
-
基金
国家自然科学基金(No.60473125)
国家高新技术研究发展计划(No.2009AA062802)
+1 种基金
中国石油(CNPC)石油科技中青年创新基金(No.05E7013)
国家重大专项子课题(No.G5800-08-ZS-WX)
-
文摘
中文分词是中文文本信息处理的重要预处理。针对目前中文分词中存在的准确率低和粗分结果集大的问题,在最大匹配算法基础上,采用文本切分时的组合歧义检测和交叉歧义检测以及全切分算法,提高了文本粗分的准确率,并减小了粗分结果集的规模,为进一步正确分词奠定基础。通过公共语料库数据集的实验对比,取得很好的效果。
-
关键词
中文分词
粗分
最大匹配算法
全切分算法
歧义检测
-
Keywords
Chinese word segmentation
rough segmentation
maximum match algorithm
omni-segmentation algorithm
ambiguity detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于最大匹配和歧义检测的中文分词粗分方法
被引量:1
- 5
-
-
作者
李国和
刘光胜
吴卫江
孙红军
唐先明
韩宝东
-
机构
中国石油大学地球物理与信息工程学院
中国石油大学(北京)油气资源与探测国家重点实验室
中国石油化工股份有限公司石油勘探开发研究院信息所
-
出处
《北京信息科技大学学报(自然科学版)》
2010年第S2期84-88,共5页
-
基金
国家自然科学基金(60473125)
中国石油(CNPC)石油科技中青年创新基金(5E7013)
国家重大专项子课题(G5800-08-ZS-WX)
-
文摘
中文分词是中文文本信息处理的重要预处理。针对目前中文分词中存在的准确率低和粗分结果集大的问题,在最大匹配算法基础上,采用文本切分时的组合歧义检测和交叉歧义检测以及全切分算法,提高了文本粗分的准确率,并减小了粗分结果集的规模,为进一步正确分词奠定基础。通过公共语料库数据集的实验对比,取得很好效果。
-
关键词
中文分词
粗分
最大匹配算法
全切分算法
歧义检测
-
Keywords
Chinese word segmentation
rough segmentation
maximum match algorithm
omni-segmentation algorithm
ambiguity detection
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名一种改进的位平面匹配运动估计算法
被引量:1
- 6
-
-
作者
李进伟
陈更生
尹文波
-
机构
复旦大学专用集成电路与系统国家重点实验室
-
出处
《计算机工程》
CAS
CSCD
2012年第2期259-260,263,共3页
-
基金
上海市科委2008年集成电路设计专项基金资助项目(08706200100)
-
文摘
为进一步提高视频的编码效率,提出一种改进的位平面匹配(BPM)算法,通过调整阈值的选取方式,减少搜索次数,利用改进的运动矢量计算方法提高搜索准确性,提升图像质量。实验结果表明,与传统BPM算法相比,该算法能提高位平面的区分能力,增强运动估计效果。
-
关键词
运动估计
全搜索算法
快速搜索算法
位平面
位平面匹配算法
-
Keywords
motion estimation
Full Search(FS) algorithm
fast search algorithm
Bit Plane(BP)
Bit Plane Matching(BPM) algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名全数字化摄影测量系统(VirtuoZo NT)
- 7
-
-
-
出处
《全球定位系统》
2003年第3期52-52,共1页
-
文摘
全数字化摄影测量系统VirtuoZo NT作为可以直接从数字影像中获取测绘信息的软件平台是一个全软件化设计、功能齐全、高度智能化的摄影测量解决方案,可提供从自动空中三角测量到测绘地形图的整体作业流程。VirtuoZo NT采用国际最先进的超快速匹配算法确定同名点,匹配速度高达500—1000点/秒,可处理航空影像、SPOT影像和近景影像,包括8bit黑白影像和24bit彩色影像。多种高效。
-
关键词
VirtuoZoNT
全数字化摄影测量系统
超快速匹配算法
空中三角测量
AAT
-
分类号
P231.5
[天文地球—摄影测量与遥感]
-
-
题名农村信息化综合网站中信息采集设计与实现
- 8
-
-
作者
王海龙
赵冬
-
机构
中原工学院计算机学院
-
出处
《计算机应用与软件》
CSCD
2010年第6期126-127,190,共3页
-
基金
河南省教育厅软科学项目(2008B520046)
-
文摘
结合农村综合信息网站的数据需求,设计了一个面向农业领域、基于垂直搜索技术搜索引擎的农村信息采集平台模型,并重点讨论了该模型中网页采集、分析及网页分类的运行原理和具体实现过程。运行实践表明,该模型对于农业信息网站,相关性和准确性都较好。
-
关键词
信息采集
垂直搜索
农村信息化词典
全二分最大匹配分词
农村信息化
-
Keywords
Information collection Vertical search Dictionary oriented rural informatization Full binary-search maximal match for Chinese word segmentation Rural informatization
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-