期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于后缀数组的克隆检测 被引量:7
1
作者 史庆庆 张丽萍 +1 位作者 尹丽丽 刘东升 《计算机工程》 CAS CSCD 2013年第9期123-127,共5页
程序员对源代码的拷贝、粘贴及修改活动会导致软件中出现大量克隆代码,增加软件开发和维护的成本。为解决该问题,提出一种新的克隆检测方法。利用基于后缀数组的算法查找重复的Token子串,进而检测出克隆代码,开发相应的克隆检测工具SaCD... 程序员对源代码的拷贝、粘贴及修改活动会导致软件中出现大量克隆代码,增加软件开发和维护的成本。为解决该问题,提出一种新的克隆检测方法。利用基于后缀数组的算法查找重复的Token子串,进而检测出克隆代码,开发相应的克隆检测工具SaCD,用其检测29款C语言开源软件。实验结果表明,SaCD能快速有效地检测软件中的Type-1和Type-2语句克隆,其检测速度比传统的克隆检测工具CCFinderx快了近20倍。 展开更多
关键词 克隆代码 克隆检测 Token串 后缀数组 重复子串 DC3算法
下载PDF
关于两类右分配的强双幺半群的自由对象
2
作者 田径 孙晓青 李江华 《西安理工大学学报》 CAS 北大核心 2014年第1期63-66,共4页
基于泛代数的观点,通过在全体后缀码的集族上添加两个二元运算和两个常元,构造两个满足右分配律的强双幺半群,说明它们对其所属代数类具有泛映射性质。给出两类满足右分配律的强双幺半群簇的自由对象模型。
关键词 强双幺半群 右分配律 后缀码 自由对象
下载PDF
相似代码检测工具及其案例分析 被引量:2
3
作者 李卓 邓明荣 《计算机工程与科学》 CSCD 北大核心 2010年第4期71-74,135,共5页
软件系统中的相似代码给软件维护带来很大困难,也是最易见的重构对象。如何有效地检测相似代码是软件工程领域的一个重要研究课题。本文介绍了常见的基于文本匹配的相似代码检测算法,尤其是检测源文件之间相似代码的动态文本匹配算法和... 软件系统中的相似代码给软件维护带来很大困难,也是最易见的重构对象。如何有效地检测相似代码是软件工程领域的一个重要研究课题。本文介绍了常见的基于文本匹配的相似代码检测算法,尤其是检测源文件之间相似代码的动态文本匹配算法和源文件内部相似代码的后缀树算法,并将这两种算法结合起来,实现一个相似代码检测工具。该工具提供了时空代价平衡的相似代码检测能力,提供了精确有效的相似代码检测手段,帮助开发人员锁定相似代码,提高了重构活动的效率。本文介绍了该工具的架构和内部处理流程,并应用该工具搜索了若干实际应用系统的重复代码,检验了工具的可用性。还简单讨论了该工具和其他一些相似代码检测工具的优劣。 展开更多
关键词 相似代码检测 动态文本匹配 后缀树 重构
下载PDF
一类后缀码的代数性质
4
作者 田径 胡钢 《纯粹数学与应用数学》 CSCD 2014年第4期360-366,共7页
利用自由含幺半群X*上的一个偏序关系,介绍了一类特殊的后缀码.通过定义这类后缀码上的两种二元运算,研究了这类后缀码的代数性质.证明了该子类在这两种运算下形成一个加法导出是半格的半环,并且满足吸收律.从而提供了一个满足吸收律的... 利用自由含幺半群X*上的一个偏序关系,介绍了一类特殊的后缀码.通过定义这类后缀码上的两种二元运算,研究了这类后缀码的代数性质.证明了该子类在这两种运算下形成一个加法导出是半格的半环,并且满足吸收律.从而提供了一个满足吸收律的半格序半群的例子. 展开更多
关键词 后缀码 半格序 半环
下载PDF
语言和码的半环结构
5
作者 陈培慈 《江西师范大学学报(自然科学版)》 CAS 1997年第4期293-296,311,共5页
该文建立含两个无穷和代数运算的双闭半环概念,证明了:字母表∑上全体语言之集P(∑)与布尔半环B={0,1}上的形式幂级数全体之集B《∑》近双闭半环同构,进而用半环对∑上的前(后)缀码给出了刻划.
关键词 双闭半环 前缀码 语言 半环 代数结构
下载PDF
语言幺半群中子幺半群的自由性
6
作者 喻秉钧 《四川师范大学学报(自然科学版)》 CAS CSCD 1998年第6期599-602,共4页
证明了强左奇异且右奇异语言及{1}之集是语言幺半群的自由子幺半群;由此给出了强双侧奇异语言幺半群自由性的一个简化证明.进而讨论了极大前(后、双)缀码子幺半群的自由性问题.
关键词 自由幺半群 可消语言 语言幺半群 子幺半群
下载PDF
一种基于CAVLC解码的快速码表查找算法 被引量:1
7
作者 黄明政 王建华 +1 位作者 韩一石 孙运龙 《计算机工程》 CAS CSCD 2013年第2期23-26,33,共5页
在分析和研究基于上下文的自适应可变长度编码(CAVLC)码表结构特点的基础上,结合码表统计规律,提出一种新的CAVLC解码码表查找算法。根据码字前缀0的个数和码字长度之间的关系共同决定输入码字后缀位数和数值,实现对输入码流的快速确定... 在分析和研究基于上下文的自适应可变长度编码(CAVLC)码表结构特点的基础上,结合码表统计规律,提出一种新的CAVLC解码码表查找算法。根据码字前缀0的个数和码字长度之间的关系共同决定输入码字后缀位数和数值,实现对输入码流的快速确定,对确定的输入码字,只需再查一次表便可以得到其对应的解码输出。测试结果表明,该优化算法在解码查表速度方面比原算法提高约20%。 展开更多
关键词 基于上下文的自适应可变长度编码 码表查找 码字前缀 码字后缀 码字长度
下载PDF
单阅读器移动RFID系统下改进的标签防碰撞算法 被引量:1
8
作者 李欣怡 李晓武 +3 位作者 游进国 贾连印 丁家满 李润鑫 《化工自动化及仪表》 CAS 2021年第5期486-490,共5页
在单阅读器移动RFID系统中采用尾码应答机制,并将固定帧时隙ALOHA和后退式二进制搜索算法相结合,提出一种改进算法,通过理论分析和MATLAB仿真实验证明,改进后的算法能使系统所花时间成本降低,系统效率提高。
关键词 单阅读器 尾码应答机制 帧时隙ALOHA 后退式二进制搜索
下载PDF
一种可实现零内存存取的CAVLC解码算法 被引量:1
9
作者 黄明政 韩一石 《计算机工程》 CAS CSCD 2014年第3期278-282,共5页
在基于上下文的自适应可变长度编码(CAVLC)解码算法中,对非结构化自适应可变长度编码码表进行解码时需要反复查找码表进行码字匹配,从而导致解码速度慢和需要大量内存存取的问题。为此,提出一种可实现零内存存取的CAVLC解码算法。将CAVL... 在基于上下文的自适应可变长度编码(CAVLC)解码算法中,对非结构化自适应可变长度编码码表进行解码时需要反复查找码表进行码字匹配,从而导致解码速度慢和需要大量内存存取的问题。为此,提出一种可实现零内存存取的CAVLC解码算法。将CAVLC码字前缀0的个数作为一级索引,同时通过一级索引获得输入码流的可能长度。将码字后缀作为二级索引并获得码字的值,直接通过码字快速获得解码结果。对于确定的输入码字,只需通过无码表查找代码操作即可得到对应的解码输出。测试结果表明,该算法不仅可以实现零内存存取的CAVLC解码,而且其解码速度比标准算法提高了45%。 展开更多
关键词 基于上下文的自适应可变长度编码 零内存存取 码字前缀 一级索引 码字后缀 二级索引
下载PDF
基于DC3算法的非编码区序列最大串联重复识别 被引量:1
10
作者 周文鹃 刘自伟 陈昌平 《兵工自动化》 2009年第3期42-44,共3页
非编码区信息结构分析是目前生物信息学研究的热点之一。运用DC3算法构建的后缀数组以及最长公共前缀(LCP)作为辅助工具构造一个算法,用于对非编码区中存在的重复序列进行搜索,进而研究可能与其相关的功能元件,从而揭示出非编码区的结... 非编码区信息结构分析是目前生物信息学研究的热点之一。运用DC3算法构建的后缀数组以及最长公共前缀(LCP)作为辅助工具构造一个算法,用于对非编码区中存在的重复序列进行搜索,进而研究可能与其相关的功能元件,从而揭示出非编码区的结构信息。通过实验证明其实用性。 展开更多
关键词 非编码区 重复序列 后缀数组 最长公共前缀
下载PDF
软件源代码中的代码克隆现象及其检测方法 被引量:1
11
作者 叶青青 《计算机应用与软件》 CSCD 北大核心 2008年第9期147-149,159,共4页
如果软件源程序中的一个代码段和同一程序中的另一个代码段在结构或语义上类似,这些代码段就成了代码克隆。概述代码克隆存在的各种形式,分析代码克隆产生的原因,并在概括了代码克隆检测的一般过程以后进一步阐述两类代码克隆检测方法:... 如果软件源程序中的一个代码段和同一程序中的另一个代码段在结构或语义上类似,这些代码段就成了代码克隆。概述代码克隆存在的各种形式,分析代码克隆产生的原因,并在概括了代码克隆检测的一般过程以后进一步阐述两类代码克隆检测方法:基于语义抽象树的检测方法和基于Token序列的检测方法。 展开更多
关键词 代码克隆 软件维护 软件理解 语义抽象树 后缀树 频繁项集挖掘
下载PDF
基于后缀树的二进制可执行代码的克隆检测算法 被引量:2
12
作者 张凌浩 桂盛霖 +1 位作者 穆逢君 王胜 《计算机科学》 CSCD 北大核心 2019年第10期141-147,共7页
如何发现代码克隆,是软件维护和软件侵权纠纷案件中的一个关键问题。由于商业保密等原因,在商业软件的侵权纠纷案中往往无法使用基于源代码比对的克隆检测技术。因此,针对这类无法获得源代码进行代码克隆检测的场景,文中提出一种针对二... 如何发现代码克隆,是软件维护和软件侵权纠纷案件中的一个关键问题。由于商业保密等原因,在商业软件的侵权纠纷案中往往无法使用基于源代码比对的克隆检测技术。因此,针对这类无法获得源代码进行代码克隆检测的场景,文中提出一种针对二进制可执行文件分析的代码克隆检测方法。首先,通过反编译与指令类型抽象得到二进制可执行目标文件的指令类型序列;然后,对指令类型序列构建后缀树,利用后缀树的性质获取函数级的指令序列间的克隆信息,并通过消除沙砾指令进一步提高检测性能;最后,基于MIPS32指令集,使用Linux内核和经过混淆处理的代码分别作为克隆级别0-级别2与级别1-级别4的二进制可执行文件代码克隆测试样本,并与源代码检测工具进行对比测试。结果表明,所提算法在缺少源代码的场景下同样能进行细粒度的克隆分析,且对各级代码克隆均具有较好的检测性能。 展开更多
关键词 代码克隆 二进制可执行文件 后缀树 性能优化
下载PDF
稠密极大双缀码
13
作者 金莲 艳刘云 《玉溪师范学院学报》 2013年第12期1-4,共4页
证明了稀疏极大双缀码的8个等价刻画在去掉稀疏性条件后将互不等价.这充分体现了刻画稠密极大双缀码的复杂性和困难性.
关键词 双缀码 前缀码 后缀码 极大双缀码 稠密语言
下载PDF
SF-7700C中文电脑记事簿与计算机的通信
14
作者 李聪 耿欣 《山东电子》 1998年第1期19-20,22,共3页
本文介绍SF-7700C中文电脑记事簿与计算机的通信规约及其软、硬件的实现,揭开了长期以来人们对中文电脑记事薄软件系统的不解之迷,为对其开发利用打下了深厚的基础。
关键词 8250芯片 串行异步通信 中文电脑记事簿 接口
下载PDF
一个基于压缩后缀数组的乐纹索引算法
15
作者 刘学政 史有群 +1 位作者 罗辛 陶然 《计算机科学》 CSCD 北大核心 2015年第S1期462-464 488,488,共4页
在基于乐纹的音乐检索系统中,提取的乐纹的多少决定了检索结果的匹配度,这就造成了数据库大小与检索匹配度不能兼顾的矛盾。提出使用压缩后缀数组来压缩乐纹索引的方法,解决全文索引时索引空间过大的问题。主要利用有序乐纹数据中较高... 在基于乐纹的音乐检索系统中,提取的乐纹的多少决定了检索结果的匹配度,这就造成了数据库大小与检索匹配度不能兼顾的矛盾。提出使用压缩后缀数组来压缩乐纹索引的方法,解决全文索引时索引空间过大的问题。主要利用有序乐纹数据中较高位特征出现重复的概率大的特点,使用游程编码对乐纹序列进行无损压缩。实验结果表明,该方法在包含2000首歌曲的数据库中仅需要使用原来80%的乐纹数据空间,在包含12000首歌曲的数据库中只需要使用原来30%的乐纹数据空间。与传统的后缀数组索引方法相比,该方法需要的索引存储空间仅为原来的60%。 展开更多
关键词 乐纹 压缩后缀数组 索引压缩 游程编码 垂直编码
下载PDF
基于后缀法与遗传退火算法的简约树构建
16
作者 刘清雪 王亮 《长春工业大学学报》 CAS 2021年第3期274-278,共5页
利用二进制树通过后缀法编码将N个物种的系统发生树与后缀法编码进行一一对应,并在遗传算子的设计中引入退火算子,通过遗传算法与退火算法相组合寻找全局最优解。计算结果表明,改进算法在简化树存贮的同时,还提高了运行速度。
关键词 系统发生树 最大简约法 遗传算法 后缀法编码
下载PDF
基于模拟后缀数组索引结构的实现
17
作者 杨炜鸿 张毅 于洪梅 《情报科学》 CSSCI 北大核心 2009年第12期1834-1836,1862,共4页
实现了一种基于模拟后缀数组的索引的结构,并在实现索引功能的同时对索引结构进行有效压缩。首先,对传统的哈夫曼编码压缩小波树时出现的空白编码进行了处理,应用正则哈夫曼编码有效的去掉了空白编码;其次,通过相关函数操作在已压缩的... 实现了一种基于模拟后缀数组的索引的结构,并在实现索引功能的同时对索引结构进行有效压缩。首先,对传统的哈夫曼编码压缩小波树时出现的空白编码进行了处理,应用正则哈夫曼编码有效的去掉了空白编码;其次,通过相关函数操作在已压缩的小波树上模拟实现了后缀数组功能。理论分析和实验结果表明,这种结构具有很小的空间占用,并不影响索引结构的运行效率。 展开更多
关键词 全文索引 后缀数组 BW变换 哈夫曼编码
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部