期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
异或哈希算法查找中文词组性能评价 被引量:2
1
作者 林亚平 《中文信息学报》 CSCD 1995年第1期42-48,共7页
本文根据汉字机内码的特点,利用异或哈希算法建立中文词库和查找中文词组.根据不同规模的中文词库,给出了相应的改进算法。对实际的中文词库测试表明,此哈希算法分布均匀、冲突较少,且速度快,因此具有较好的实用性。
关键词 异或哈希算法 中文词组 中文词库 中文信息处理
下载PDF
中文词组的快速查找算法 被引量:1
2
作者 张钟澍 《中文信息学报》 CSCD 1992年第1期16-20,共5页
本文提出按数据文件的关键字(中文词组)中每个汉字笔划数的权值之和进行分桶存贮,在查找中文词组串时,也采取按桶检索的查找算法,并证明了该查找算法的平均化费为O(N),优O(N log N)于的二分查找算法。
关键词 计算机 数据结构 中文词组 查找
下载PDF
基于中文词组查找的散列算法
3
作者 杨宪泽 《计算机与现代化》 1995年第2期23-29,共7页
本文从研究汉字机内码表示(ASCII码)出发,提出新的中文词组查找的散列算法。这种散列算法的特点是:(1)如果中文词组直接桶存储,在服从一般概率分布条件下,查找的平均工作量为O(N);(2)如果分级存储,对不同的中文... 本文从研究汉字机内码表示(ASCII码)出发,提出新的中文词组查找的散列算法。这种散列算法的特点是:(1)如果中文词组直接桶存储,在服从一般概率分布条件下,查找的平均工作量为O(N);(2)如果分级存储,对不同的中文信息处理环境,无论关键字状况怎样,都能以相同方法建立索引,其查找平均工作量也为O(N)。此外,本文还给出了算法在自动分词,规则匹配等方面的应用。 展开更多
关键词 查找 散列算法 信息处理 中文词组
下载PDF
基于字词重复模式及错字率的中文词组语料校对策略
4
作者 王云 杨存榜 陈红素 《教学与科技》 2014年第4期38-42,共5页
经过统计发现在中文词组语料中具有字词重复特性的词组具有较高的错字率。对词组的字训重复模式进行了分类统计,统计了不同重复模式的出错率。了解到高错字率的重复模式。比如重复字词出现在词组尾部,或者出现连续性重复,则出错概率... 经过统计发现在中文词组语料中具有字词重复特性的词组具有较高的错字率。对词组的字训重复模式进行了分类统计,统计了不同重复模式的出错率。了解到高错字率的重复模式。比如重复字词出现在词组尾部,或者出现连续性重复,则出错概率较大。基于字词重复模式的出错率数据,推荐了两种对人肌模词组语料进行人工校对的优化策略。 展开更多
关键词 中文词组语料 校对策略 字词重复模式 错字率
下载PDF
简讯
5
《通信技术》 2004年第12期23-23,共1页
N-Gage QD多媒体娱乐手机国内上市;2004年国际通信展酷派续演黑马传奇;英特尔通信联盟首次亮相中国;英特尔扩展网络处理器产品线;Mio 136隆重发布;中文T9词组输入1.2及T9拉丁文7.2推出;德州仪器在京举办数码精品巡展……
关键词 N-GAGE QD 多媒体娱乐手机 2004年国际通信展 中文T9词组输入 T9拉丁文7.2
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部