题名 改进的基音检测方法及在音乐检索中的应用
被引量:3
1
作者
李鹏
周明全
夏小亮
黎南杉
机构
北京师范大学教育技术学院
北京师范大学信息科学与技术学院
出处
《计算机工程与应用》
CSCD
北大核心
2011年第6期127-130,共4页
基金
国家自然科学基金No.60673100
国家自然科学基金重大项目(No.60736008)
北京市自然科学基金重点项目(No.4081002)~~
文摘
基音检测是音频分析和基于内容的音乐检索中的关键技术,是基于内容音乐检索中实现哼唱检索的基础。提出一种改进的自相关函数(autocorrelation function,ACF)方法进行基音检测。从对音频信号进行去噪预处理、清浊音判断及后处理等方面对ACF进行改进,使之能够生成规整的音高变化曲线。在音乐检索的实现中,提出一种有限长度的最长公共子序列(Local Longest Common String,LLCS)方法,该方法可有效解决传统方法存在的误检问题。开发实现了一个通过哼唱/歌唱进行歌曲检索的原型系统。对大量的歌曲哼唱的实验表明,提出的改进ACF算法和LLCS算法对于提高检索正确率是正确有效的。
关键词
基音检测
哼唱检索
自相关函数
最长公共子序列
Keywords
pitch detection
query by humming
auto-correlation function
longest common string
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 基于序列比对检测的优化SRE多态蠕虫防御方法
被引量:2
2
作者
赵荷
赵海燕
宁多彪
谭良
机构
成都东软学院计算机科学与技术系
四川师范大学计算机学院
出处
《计算机工程与设计》
北大核心
2017年第9期2379-2384,共6页
基金
四川省教育厅基金项目(14ZA0366)
中央高校财政专项校级基金项目(2015NYB03)
文摘
针对简化正则表达式(SRE)的多态蠕虫防御方法不足以处理蠕虫的不变部分和距离限制等问题,提出一种利用序列比对检测的优化SRE。比对一个序列在另一个序列上编写字符的过程包括3个步骤,即初始化步骤、矩阵填充和回溯步骤。初始化矩阵用于比较两个序列间字符的得分;填充矩阵选择最大数,保持指针指向导出参数的先前得分位置;回溯的每个分支代表一个最优的比对。考虑到上述步骤最大化了匹配总数量,而非匹配连续子串,采用逐对序列比对检测,对最长公共子串(LCS)的字符串进行匹配。评价结果表明,优化SRE方法能够成功获得连续序列,保留了多态蠕虫的所有通配符,相比于Autograph、Polygraph和SRE方法,其生成的特征码更加精确和高效。
关键词
多态蠕虫
简化正则表达式
匹配
最长公共子串
序列比对检测
Keywords
polymorphic worm
simplified regular expression
matching
longest common string
sequence alignment detection
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 多种字符串相似度算法的比较研究
被引量:37
3
作者
牛永洁
张成
机构
延安大学计算中心
延安大学网络中心
出处
《计算机与数字工程》
2012年第3期14-17,共4页
基金
陕西省教育厅自然科学项目:SOC关键技术研究及应用(编号:11JK1054)资助
文摘
对计算字符串相似度的编辑距离算法、最长公共子串算法、贪心字符串匹配算法、RKR-GST等多种算法,根据匹配过程是否有序,对这些算法进行了分类。然后对每种算法的实现原理进行了描述,并给出每个算法的运行步骤,结合一个实际的例子列出了算法运行的结果,最后给出每种算法计算相似度的计算公式和算法时间复杂度及应用领域。由于字符串相似度具有广泛的应用领域,对其中经典的几种算法进行总结对比是一件十分有意义的研究工作。
关键词
字符串相似度
编辑距离
最长公共子串
贪心字符串匹配
RKR-GST
Keywords
string similarity
levenshtein distance
longest common subsequences
greedy string tiling
RKR-GST
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 一种基于熵的文本相似性计算方法
被引量:13
4
作者
李圣文
凌微
龚君芳
周长征
机构
中国地质大学信息工程学院
国网十堰供电公司
出处
《计算机应用研究》
CSCD
北大核心
2016年第3期665-668,共4页
基金
国家自然科学基金资助项目(61272470)
中国地质大学(武汉)中央高校基本科研业务费专项资金资助项目(2012119039
2012119145)
文摘
文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法,在对文本间字符信息的提取基础上,建立共同子文本串度量维度,然后采用熵的方法进行相似度度量。实验表明,该方法具有更平滑的相似度曲线,从而验证了算法的有效性和准确性。
关键词
文本相似性
字符串匹配
编辑距离算法
最长公共子序列
Keywords
text similarity
string match
Levenshtein distance algorithm
longest common sequence
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 基于比对相似度动态矩阵聚类算法在基因序列中的应用
被引量:1
5
作者
张白妮
骆嘉伟
汤德佑
机构
湖南大学计算机与通信学院
出处
《计算机应用》
CSCD
北大核心
2004年第8期35-37,共3页
基金
湖南省自然科学基金项目 (0 3JJY30 95)
文摘
基于BAG图的聚类算法 ,利用聚类单元引导类的分割 ,保证聚类结果不会产生过多的类碎片 ,但其相似分数阈值Cutoff初始值和最长公共子串最小长度阈值Threshold如何确定并没有明确给出。提出基于比对相似度动态矩阵的聚类算法 ,并在此基础上明确给出了确定cutoff初始值和Threshold阈值的方法。实验结果表明该算法可以获得较好的聚类正确率。
关键词
生物序列
聚类
最长公共子串
比对相似度动态矩阵
Keywords
biology sequences
clustering
longest common child string
SZDM(Similar Zscores Dynamic Matrix)
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 代码抄袭检测中串匹配算法的比较
被引量:1
6
作者
朱波
郑虹
孙琳琳
机构
长春工业大学计算机科学与工程学院
出处
《长春工业大学学报》
CAS
2014年第6期672-676,共5页
基金
吉林省科技厅自然科学基金资助项目(20130101060JC)
吉林省教育厅"十二五"科学技术研究项目(2014132
2014125)
文摘
对程序代码抄袭检测中多种字符串匹配算法的实现原理进行了描述,给出匹配算法计算相似度的公式以及相对应的时间复杂度。由于字符串匹配算法在程序代码抄袭检测中应用较为广泛,对其中的B-F(Brute-Force)朴素算法、LCS(Longest Common Subsequence)最长公共字串算法、GST(Greedy String Tiling)贪心字符串匹配算法等经典算法的总结比较是一件有意义的研究工作。
关键词
字符串匹配算法
抄袭检测
最长公共字串
GST
Keywords
string matching algorithm
copy detection
the longest common string
GST (Greedystring Tiling).
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 字符串匹配的自动机方法
被引量:1
7
作者
王世昌
机构
烟台大学数学与信息科学系
出处
《计算机应用》
CSCD
1996年第4期26-28,共3页
文摘
本文讨论了字符串的连续匹配、离散匹配及求解最长公共子串的自动机算法。
关键词
字符串
匹配
自动机
最长公共子串
Keywords
string ,Matching,Automata,longest common substring
分类号
TP301.1
[自动化与计算机技术—计算机系统结构]
题名 求解最长循环公共子序列问题的两个算法
被引量:3
8
作者
郑子君
王洪
余成
机构
重庆理工大学机械工程学院
重庆交通大学河海学院
出处
《计算机应用研究》
CSCD
北大核心
2020年第11期3334-3337,3358,共5页
基金
国家自然科学基金青年项目(11702046)
重庆市教委科学研究项目(KJ1600910)。
文摘
最长循环公共子序列(LCCS)是两个字符串在所有可能的循环移位操作下能得到的最长公共子序列(LCS)。针对穷举移位量求解LCCS效率过低的问题,设法对候选移位量进行筛选。通过证明循环移位操作对两字符串间LCS长度增量影响的上下限,得到最优移位量的必要条件,从而减小了求解LCCS的枚举量;在此基础上,建立了求解LCCS的迭代方法,只经过少数几次迭代便可消除绝大部分无效候选移位量;此外,还提出一个可在O(mn)时间复杂度下快速估算LCCS长度的近似算法。大量随机模拟表明,当两字符串间的相似度明显高于随机字符串的相似度时,提出的两种算法表现良好。
关键词
最长公共子序列
循环字符串
文本相似度
动态规划
Keywords
longest common subsequence(LCS)
circular string
text similarity
dynamic programming
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]