期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于双哈希结构的整词二分词典机制 被引量:3
1
作者 张贤坤 李亚南 田雪 《计算机工程与设计》 CSCD 北大核心 2014年第11期3956-3960,共5页
为提高逆向最大匹配分词算法的速率,分析传统的整词二分词典机制,针对哈希结构尾字词典的不足,提出一种基于双哈希结构的整词二分词典机制,并改进对应的逆向最大匹配算法。利用记录词长的尾字词典机制,使用双哈希结构保存词条,降低词典... 为提高逆向最大匹配分词算法的速率,分析传统的整词二分词典机制,针对哈希结构尾字词典的不足,提出一种基于双哈希结构的整词二分词典机制,并改进对应的逆向最大匹配算法。利用记录词长的尾字词典机制,使用双哈希结构保存词条,降低词典的词条匹配时间复杂度。实验结果表明,该词典机制将逆向最大匹配算法的分词速率提高近一倍。 展开更多
关键词 中文分词 词典机制 尾字词典 哈希结构 逆向最大匹配算法
下载PDF
基于双字哈希结构的最大匹配算法机制改进 被引量:6
2
作者 刘勇 魏光泽 《电子设计工程》 2017年第16期11-15,共5页
中文分词是计算机进行文本分析的关键技术。基于提高分词效率以满足日益增长的文本分析需求,通过分析常用的基于词典的机械分词算法与词典机制的优缺点,在对最大匹配算法进行改进的同时,采用双字哈希词典设计了适合此算法的双字哈希余... 中文分词是计算机进行文本分析的关键技术。基于提高分词效率以满足日益增长的文本分析需求,通过分析常用的基于词典的机械分词算法与词典机制的优缺点,在对最大匹配算法进行改进的同时,采用双字哈希词典设计了适合此算法的双字哈希余字分组的词典结构,提出了基于双字哈希结构的最大匹配改进算法。该算法在保证原最大匹配算法分词精度的前提下,大大提高了分词速度。经实验证明,改进后的算法性能明显提升。 展开更多
关键词 中文分词 最大正向匹配算法 词典 哈希结构 哈希函数
下载PDF
哈希结构模拟文件系统
3
作者 杨东 《电脑编程技巧与维护》 2013年第7期27-29,39,共4页
使用哈希结构模拟了文件系统中的文件记录,讲述了以哈希算法实现文件记录的保存、查找和删除的方法,以算法流程图与C语言结合的方式演示了模拟的过程。
关键词 哈希结构 哈希算法 文件系统 文件记录
下载PDF
基于Hash结构的逆向最大匹配分词算法的改进 被引量:26
4
作者 丁振国 张卓 黎靖 《计算机工程与设计》 CSCD 北大核心 2008年第12期3208-3211,3265,共5页
分析中文的语义,首先要对句子进行分词。中文分词是中文信息处理中最重要的预处理,分词的速度和精度直接影响信息处理的结果。对传统的分词词典和算法进行了改进,提出了基于Hash结构的分词词典机制,并给出了一种改进的逆向最大匹配分词... 分析中文的语义,首先要对句子进行分词。中文分词是中文信息处理中最重要的预处理,分词的速度和精度直接影响信息处理的结果。对传统的分词词典和算法进行了改进,提出了基于Hash结构的分词词典机制,并给出了一种改进的逆向最大匹配分词算法(RMM)。该算法在重点考虑切分速度的同时兼顾了切分精度,在很大程度上消除了传统的最大匹配算法可能产生的歧义。实验结果表明,该分词算法在运行效率和结果的准确性方法有了很大的提高。 展开更多
关键词 中文分词 哈希结构 逆向最大匹配算法 分词词典 消除歧义
下载PDF
基于Hash结构词典的逆向回溯中文分词技术研究 被引量:5
5
作者 梁桢 李禹生 《计算机工程与设计》 CSCD 北大核心 2010年第23期5158-5160,F0003,共4页
为了提高现有的中文分词效率,提出了基于Hash结构词典的逆向回溯中文分词方法。针对首字Hash结构词典的不足,设计了能够记录词长的Hash结构尾字词典,然后对逆向最大匹配分词算法进行了分析,为了解决其存在的中文分词歧义问题,设计出一... 为了提高现有的中文分词效率,提出了基于Hash结构词典的逆向回溯中文分词方法。针对首字Hash结构词典的不足,设计了能够记录词长的Hash结构尾字词典,然后对逆向最大匹配分词算法进行了分析,为了解决其存在的中文分词歧义问题,设计出一种逆向回溯最大匹配算法,该改进算法采用的回溯机制能够有效消除分词中可能存在的一些歧义问题。实验结果表明,该方法实现了提高中文分词速度并减少交集型歧义字符串切分错误的设计目标。 展开更多
关键词 中文分词 哈希结构 尾字词典 逆向最大匹配算法 分词歧义 逆向回溯算法
下载PDF
内存计算环境下基于索引结构的内存优化策略 被引量:2
6
作者 英昌甜 王维庆 +3 位作者 于炯 卞琛 国冰磊 祁雷 《新疆大学学报(自然科学版)》 CAS 2018年第1期13-21,共9页
由于内存计算能够较好的满足在线数据密集型应用的需求,近年来受到了研究者的广泛关注.内存云存储数据时使用哈希结构来提高写入和恢复效率,然而该结构会降低系统读性能,同时增加系统清理回收内存的开销.为了解决这个问题,提出一种基于... 由于内存计算能够较好的满足在线数据密集型应用的需求,近年来受到了研究者的广泛关注.内存云存储数据时使用哈希结构来提高写入和恢复效率,然而该结构会降低系统读性能,同时增加系统清理回收内存的开销.为了解决这个问题,提出一种基于索引压缩存储的内存优化策略.在存储时,将内存划分为两部分,哈希存储和排序存储.在系统繁忙时,对于实时写入和更新的数据存储时采用占用空间较多、插入效率较高的哈希存储;在系统空闲时段时,利用基于索引压缩的排序存储算法,将哈希存储转换为占用内存空间较少、查找效率较高的排序存储.实验结果表明,同未进行优化的Tachyon单一哈希结构存储策略相比,该策略能够很好地均衡系统的写入和读取访问的效率. 展开更多
关键词 内存计算 存储策略 哈希结构 排序存储
下载PDF
改进的基于词典的中文分词方法 被引量:40
7
作者 莫建文 郑阳 +1 位作者 首照宇 张顺岚 《计算机工程与设计》 CSCD 北大核心 2013年第5期1802-1807,共6页
为了能够快速、准确地进行中文分词,在传统分词词典构造及相应算法的基础上,提出了改进的基于词典中文分词方法。该方法结合双字哈希结构,并利用改进的正向最大匹配分词算法进行中文分词,既提高了分词速度,同时解决了传统最大匹配分词... 为了能够快速、准确地进行中文分词,在传统分词词典构造及相应算法的基础上,提出了改进的基于词典中文分词方法。该方法结合双字哈希结构,并利用改进的正向最大匹配分词算法进行中文分词,既提高了分词速度,同时解决了传统最大匹配分词算法中的歧义问题。实验结果表明,该方法在一定程度上提高了中文词语切分的准确率,同时大大缩短了分词时间。 展开更多
关键词 中文分词 词典 哈希结构 正向最大匹配算法 歧义
下载PDF
高密度RFID事件流上的复杂事件检测 被引量:1
8
作者 徐传飞 林树宽 +1 位作者 乔建忠 于戈 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第5期627-631,共5页
由于高密度事件流具有实时性和海量性特点,应用已有的复杂事件检测技术处理时,存在时间效率不高、占用内存空间较大等不足.针对这些问题,提出了一种基于哈希链表结构的复杂事件检测算法.该算法设计有效的哈希映射分类来保存中间结果,加... 由于高密度事件流具有实时性和海量性特点,应用已有的复杂事件检测技术处理时,存在时间效率不高、占用内存空间较大等不足.针对这些问题,提出了一种基于哈希链表结构的复杂事件检测算法.该算法设计有效的哈希映射分类来保存中间结果,加快了匹配过程,同时,提出高效的更新机制及时删除内存中过期的数据.针对常见的事件流的乱序现象,对原有自动机处理机制进行了改进.实验和分析证明,复杂事件流检测方法具有理论上的可行性和操作上的高效性与正确性. 展开更多
关键词 高密度事件流 复杂事件检测 哈希结构 更新机制 乱序
下载PDF
用Perl语言实现Huffman编码 被引量:1
9
作者 刘学军 《北京工商大学学报(自然科学版)》 CAS 2006年第2期23-26,共4页
Perl是一种功能强大的编程语言.Hu ffm an编码是压缩文件的一种常用算法.采用Perl语言编程来产生Hu ffm an编码,并阐述了用Perl编写此程序的基本思想及其数据类型的使用技巧.最后根据此程序的输出结果,简要讨论并分析了Hu ffm an算法对... Perl是一种功能强大的编程语言.Hu ffm an编码是压缩文件的一种常用算法.采用Perl语言编程来产生Hu ffm an编码,并阐述了用Perl编写此程序的基本思想及其数据类型的使用技巧.最后根据此程序的输出结果,简要讨论并分析了Hu ffm an算法对文件的压缩率随字符种类及其出现频率的变化规律. 展开更多
关键词 PERL 文件压缩 HUFFMAN编码 哈希结构
下载PDF
一种GIS的中文分词算法研究 被引量:2
10
作者 杨晓军 王一莉 《微电子学与计算机》 CSCD 北大核心 2010年第7期173-176,180,共5页
提出了一种应用于GIS领域的中文分词算法.采用将首字和尾种类词用哈希表管理,其余中间字串用Trie树来实现的"首位Hash-Trie树"结构作为词典载体来实现地学词典的高效率存取操作,简化了Trie树的深度,并基于一种改进的正向最大... 提出了一种应用于GIS领域的中文分词算法.采用将首字和尾种类词用哈希表管理,其余中间字串用Trie树来实现的"首位Hash-Trie树"结构作为词典载体来实现地学词典的高效率存取操作,简化了Trie树的深度,并基于一种改进的正向最大匹配的算法,很好的解决了切分歧义和未登录词的问题.实验结果表明,该算法为GIS中文查询语句的正确理解提供了有效的语义信息. 展开更多
关键词 地理信息系统 中文分词 TRIE树 哈希结构 分词词典
下载PDF
Redis的多链融合技术在航空通信系统中的应用 被引量:1
11
作者 陈丹丹 《单片机与嵌入式系统应用》 2020年第12期58-61,共4页
为解决航空电子通信应用中多数据链来源数据存在数据量大、信息多样化、信息冗余度高、信息精度不一等问题,在实际应用中,引入基于Redis内存数据库的多链融合技术实现了对异类信息的归一化、综合分析与计算,提高了数据的处理效率、精度... 为解决航空电子通信应用中多数据链来源数据存在数据量大、信息多样化、信息冗余度高、信息精度不一等问题,在实际应用中,引入基于Redis内存数据库的多链融合技术实现了对异类信息的归一化、综合分析与计算,提高了数据的处理效率、精度与完整度等,提升了航空电子通信系统中对数据综合处理分析的效能。 展开更多
关键词 多链融合技术 Redis内存数据库 哈希结构 有序键值对 跨平台基础服务
下载PDF
基于关键词筛选分词算法的企业级搜索引擎
12
作者 吴亮 李树广 《微型电脑应用》 2010年第7期37-40,5,共4页
随着计算机技术与数据库学科不断发展,数字化信息已经成为当今存储数数据的首要选择,并且借助大型搜索引擎,使用户可以快速找到对应信息。应用于企业级的高效搜索引擎成为当前研究的重要课题。本文提出了基于关键词筛选KWS(Key Word Sel... 随着计算机技术与数据库学科不断发展,数字化信息已经成为当今存储数数据的首要选择,并且借助大型搜索引擎,使用户可以快速找到对应信息。应用于企业级的高效搜索引擎成为当前研究的重要课题。本文提出了基于关键词筛选KWS(Key Word Selection)的搜索引擎机制,针对电网与大型发电厂智能管理系统的数据结构,通过构建双字哈希词典和双字耦合消歧分词与结果的语义筛选,将筛选后的分词结果放入Sphinx和MySQL数据库进行全文搜索并加以缓存,既提高了搜索速度又提高搜索的准确度。 展开更多
关键词 企业级数据库 哈希结构 双字耦合 分词算法 缓存
下载PDF
通过ECID技术实现半导体测试流程优化 被引量:1
13
作者 刁维虎 《中国集成电路》 2013年第11期62-63,共2页
本文介绍了如何通过程序有效地解读ECID文件,提取有用信息,并通过ECID数据解决半导体测试中无效复测问题的方法。
关键词 ECID 半导体测试 制程优化 哈希结构
下载PDF
基于双向Chord的即时通讯系统的设计与实现
14
作者 李建军 熊选东 《计算机工程与设计》 CSCD 北大核心 2009年第24期5601-5604,共4页
首先介绍了Chord协议及查找算法,在此基础上,针对传统即时通讯系统中服务器负载较重,提出了一种结合双向查找和结构化可控哈希函数的新Chord。仿真实验表明,该设计在保持覆盖网络与物理网络相符的同时提高了查找速度,减少了查找跳数。... 首先介绍了Chord协议及查找算法,在此基础上,针对传统即时通讯系统中服务器负载较重,提出了一种结合双向查找和结构化可控哈希函数的新Chord。仿真实验表明,该设计在保持覆盖网络与物理网络相符的同时提高了查找速度,减少了查找跳数。最后通过编程实现了基于该改进算法的即时通讯系统,在减轻服务器负载的基础上,实现了消息通讯、文件传输等功能。 展开更多
关键词 CHORD协议 即时通讯系统 双向查找 结构化可控哈希函数 对等网
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部