期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
LCS算法在术语抽取中的应用研究 被引量:11
1
作者 潘虹 徐朝军 《情报学报》 CSSCI 北大核心 2010年第5期853-857,共5页
本文介绍了一种基于最大公共子串(Longest Common Substring,LCS)算法的术语抽取方法:按标点符号对领域文档进行切分;抽取切分后的语句片断的所有最大公共子串作为候选术语集;通过停用词过滤、对照领域词筛选和术语嵌套子串筛选等规... 本文介绍了一种基于最大公共子串(Longest Common Substring,LCS)算法的术语抽取方法:按标点符号对领域文档进行切分;抽取切分后的语句片断的所有最大公共子串作为候选术语集;通过停用词过滤、对照领域词筛选和术语嵌套子串筛选等规则进行判别,得到最终的术语集。通过学前教育领域术语抽取的实验,验证了该算法可以有效地抽取中文领域术语:术语抽取平均准确率达84.2%;4~6字符双词术语抽取的效果尤佳,准确率接近100%。 展开更多
关键词 最大公共子串算法 术语抽取
下载PDF
基于相对链码和改进LCS算法的图形匹配实现 被引量:1
2
作者 杨平 刘在英 《计算机与现代化》 2013年第12期106-109,共4页
研究相对链码和字符串的匹配算法,采用相对链码和改进的LCS算法实现图形的轮廓匹配。首先通过轮廓提取算法得到图形的轮廓,再通过轮廓跟踪算法得到轮廓的链码,由链码计算得到图形的相对链码,最后采用改进的最大公共子串算法计算两图形... 研究相对链码和字符串的匹配算法,采用相对链码和改进的LCS算法实现图形的轮廓匹配。首先通过轮廓提取算法得到图形的轮廓,再通过轮廓跟踪算法得到轮廓的链码,由链码计算得到图形的相对链码,最后采用改进的最大公共子串算法计算两图形的相似度。该图形轮廓匹配算法具有计算量小,平移、旋转的不变性等优点。在Android系统上进行实验,实验结果表明该算法计算速度快,与人的视觉相吻合。 展开更多
关键词 FREEMAN链码 相对链码 最大公共子串 图形匹配 轮廓提取
下载PDF
基于熵的音频指纹检索技术研究与实现 被引量:7
3
作者 王伟 陈志高 +1 位作者 孟宪凯 李伟 《计算机科学》 CSCD 北大核心 2017年第S1期551-556,共6页
介绍了一种基于熵的音频指纹检索技术,该技术采用音频的熵特征作为音频的指纹特征(AFP),在检索中,该指纹特征可以用多种串匹配算法进行信息比对。实验采用最大公共字串(LCS)、编辑距离(Levenshtein Distance)和动态时间规整(DTW)算法实... 介绍了一种基于熵的音频指纹检索技术,该技术采用音频的熵特征作为音频的指纹特征(AFP),在检索中,该指纹特征可以用多种串匹配算法进行信息比对。实验采用最大公共字串(LCS)、编辑距离(Levenshtein Distance)和动态时间规整(DTW)算法实现指纹特征匹配,并采用一定数量的歌曲文件作为实验的测试集。每首歌曲都有一个带有不同的较大失真的音频文件或由不同歌唱家演唱的不同版本,这些带有不同的较大失真的音频文件由原曲经过不同的严重音频处理得到,比如添加噪声、加快速度、剪辑等。实验结果显示,使用的3种匹配算法均可以将训练集中所有的歌曲正确地识别出来,从而证明了基于熵的音频指纹检索技术具有准确性、鲁棒性、区分性等优良性质。 展开更多
关键词 音频指纹 检索 最大公共子串 编辑距离 动态时间规整
下载PDF
网络维吾尔文判别及其文本长度下界的探讨 被引量:2
4
作者 倪耀群 曹鹏 +2 位作者 许洪波 唐慧丰 程学旗 《中文信息学报》 CSCD 北大核心 2012年第6期109-115,共7页
将维吾尔文从阿拉伯文、哈萨克文、柯尔克孜文等以阿拉伯字母为基础书写的类似文字中识别出来,是维文信息处理的基础。作者对维吾尔字符的编码优化后使用N元语法模型实现了维吾尔文的快速语种判别,准确率超过98%。经过错误分析,发现错... 将维吾尔文从阿拉伯文、哈萨克文、柯尔克孜文等以阿拉伯字母为基础书写的类似文字中识别出来,是维文信息处理的基础。作者对维吾尔字符的编码优化后使用N元语法模型实现了维吾尔文的快速语种判别,准确率超过98%。经过错误分析,发现错误判别的文本主要集中在论坛和微博客中,这些文本有效字符数太少,语言特征不充分。最后作者计算了四种语言真实网络文本中的所有公共子串,并对文种判别所需要的最短字符串长度进行了分析。 展开更多
关键词 老维文 语种识别 最大公共子串
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部