期刊文献+
共找到122篇文章
< 1 2 7 >
每页显示 20 50 100
融合语言模型的化验单文字识别矫正研究
1
作者 张煜楠 吕学强 +4 位作者 黄庆浩 游新冬 何健 董志安 黄跃 《计算机应用与软件》 北大核心 2023年第10期179-184,221,共7页
针对自然场景下化验单文字识别容易出现混淆的问题,提出一种融合语言模型的自然场景下的化验单文字识别后处理矫正方法。该方法通过引入统计语言模型,对识别区域矩阵进行条件概率统计,预测符合医学词库的最佳识别结果,使用基于融合的编... 针对自然场景下化验单文字识别容易出现混淆的问题,提出一种融合语言模型的自然场景下的化验单文字识别后处理矫正方法。该方法通过引入统计语言模型,对识别区域矩阵进行条件概率统计,预测符合医学词库的最佳识别结果,使用基于融合的编辑距离和最长公共子序列方法进行检验项名称矫正,根据检验项对应关系对其他指标进行矫正。引入该方法的后处理结果与不加后处理的识别结果相比,在医疗化验单的识别任务上,获得了准确率、召回率、F1值不同程度的提高。对比实验表明,该方法能够进一步提高文本框文字的识别精度,为后期化验单解读奠定了基础。 展开更多
关键词 化验单 文字识别 语言模型 编辑距离 最长公共子序列
下载PDF
基于几何相似特征的石窟造像装饰图案生成方法 被引量:1
2
作者 裴卉宁 邵星辰 +1 位作者 郭任哲 张新新 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2023年第9期1333-1343,共11页
针对石窟造像装饰图案设计中图案基元的组合方式不够灵活多变、画面布置与调整耗时、图案基元间的交叉重叠问题,提出一种基于几何相似特征的图案生成方法.首先明确图案属性,利用Freeman链码描述图案基元轮廓信息;然后利用最长公共子序... 针对石窟造像装饰图案设计中图案基元的组合方式不够灵活多变、画面布置与调整耗时、图案基元间的交叉重叠问题,提出一种基于几何相似特征的图案生成方法.首先明确图案属性,利用Freeman链码描述图案基元轮廓信息;然后利用最长公共子序列计算图案基元间的几何相似性特征;接着基于计算结果对图案基元进行设计布局,完成子图案的效果生成;最后依据检测和识别出的图案空间分布模式将子图案进行扩充生成.采用响堂山石窟中的装饰图案基元数据进行实验的结果表明,所提方法不仅解决了图案基元组合优化问题,而且能实现复杂图案的快速生成设计,该方法在图案基元的匹配时间为19.2 s,比人工方法的36.1 s更优. 展开更多
关键词 图案基元 FREEMAN 最长公共子序列 几何相似特征 子图案
下载PDF
基于SAX及空间信息熵的谐振接地系统单相接地故障选线方法 被引量:1
3
作者 田业 刘轩 +3 位作者 姚雪松 冯培磊 赵玉 李琰 《南方电网技术》 CSCD 北大核心 2023年第7期103-114,共12页
针对含多电缆谐振接地系统健全线路零序电流相似性减弱以及单相高阻接地因故障信息微弱且易被干扰而使选线正确率下降的问题,提出一种基于符号化聚合近似(symbolic aggregate approximation,SAX)及空间信息熵的选线方法。首先通过FIR滤... 针对含多电缆谐振接地系统健全线路零序电流相似性减弱以及单相高阻接地因故障信息微弱且易被干扰而使选线正确率下降的问题,提出一种基于符号化聚合近似(symbolic aggregate approximation,SAX)及空间信息熵的选线方法。首先通过FIR滤波器提取暂态低频零序电流并标准化,然后将所得电流序列及其差值序列在多尺度域上符号化,通过最长公共子序列校验后生成三维故障空间并定义空间信息熵,最后比较线路间熵值差异度完成选线。仿真结果表明,所述选线方法灵敏度高,硬件要求低,能够克服采样不同步、三相不平衡等困难。 展开更多
关键词 谐振接地系统 单相接地故障选线 符号化聚合近似 空间信息熵 最长公共子序列
下载PDF
Implementation of Rapid Code Transformation Process Using Deep Learning Approaches
4
作者 Bao Rong Chang Hsiu-Fen Tsai Han-Lin Chou 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第7期107-134,共28页
Our previous work has introduced the newly generated program using the code transformation model GPT-2,verifying the generated programming codes through simhash(SH)and longest common subsequence(LCS)algo-rithms.Howeve... Our previous work has introduced the newly generated program using the code transformation model GPT-2,verifying the generated programming codes through simhash(SH)and longest common subsequence(LCS)algo-rithms.However,the entire code transformation process has encountered a time-consuming problem.Therefore,the objective of this study is to speed up the code transformation process signi􀀀cantly.This paper has proposed deep learning approaches for modifying SH using a variational simhash(VSH)algorithm and replacing LCS with a piecewise longest common subsequence(PLCS)algorithm to faster the veri􀀀cation process in the test phase.Besides the code transformation model GPT-2,this study has also introduced MicrosoMASS and Facebook BART for a comparative analysis of their performance.Meanwhile,the explainable AI technique using local interpretable model-agnostic explanations(LIME)can also interpret the decision-making ofAImodels.The experimental results show that VSH can reduce the number of quali􀀀ed programs by 22.11%,and PLCS can reduce the execution time of selected pocket programs by 32.39%.As a result,the proposed approaches can signi􀀀cantly speed up the entire code transformation process by 1.38 times on average compared with our previous work. 展开更多
关键词 Code transformation model variational simhash piecewise longest common subsequence explainable AI LIME
下载PDF
信息技术企业股票关联网络风险
5
作者 张晓黎 《系统工程学报》 CSCD 北大核心 2023年第6期812-823,共12页
为分析贸易冲突对中国信息技术业的影响,基于整数编码模式最长公共子序列相似度算法,根据网络结构自适应设置相似度阈值构建股票关联网络,利用双向作用相继失效模型分析企业间的风险传染。结果表明,中国信息技术企业股票关联网络形成了1... 为分析贸易冲突对中国信息技术业的影响,基于整数编码模式最长公共子序列相似度算法,根据网络结构自适应设置相似度阈值构建股票关联网络,利用双向作用相继失效模型分析企业间的风险传染。结果表明,中国信息技术企业股票关联网络形成了16个团体.关系回路加剧了大团体内企业间的风险传染积聚.大量企业按资产择优受不同程度攻击的风险传染时长、倒闭企业数量高于按网络位置择优的.关联网络上的企业创新投入分布不均,仅能阻滞风险传染速度,不能削弱风险破坏力.信息技术大型企业开发新产品,建立技术创新合作和寻求供应新关系时,应与其它产业融合,加强关联关系链条的协同创新,避免业内关系闭环引发积聚性风险. 展开更多
关键词 时间序列 最长公共子序列 关联网络 级联失效风险
下载PDF
基于相似度的装备数据聚合方法
6
作者 杨杉 《空军工程大学学报》 CSCD 北大核心 2023年第2期98-103,共6页
现代战争需要对多源异构的装备数据进行高效集成。针对不同来源数据中装备名称不一致的问题,设计了装备数据的聚合模型和聚合流程,在综合分析现有算法的基础上,结合装备名称特点为该模型提供了一种新的相似度匹配算法,算法将Jaro-Winkle... 现代战争需要对多源异构的装备数据进行高效集成。针对不同来源数据中装备名称不一致的问题,设计了装备数据的聚合模型和聚合流程,在综合分析现有算法的基础上,结合装备名称特点为该模型提供了一种新的相似度匹配算法,算法将Jaro-Winkler和最长公共子序列相结合,以提高匹配的精度。最后通过实验进行了验证,结果表明该算法与传统相似度算法相比具有较高的适配性和鲁棒性,可以为装备数据聚合工作提供有效支撑。 展开更多
关键词 装备数据 数据聚合 文本相似度 Jaro-Winkler 最长公共子序列
下载PDF
基因序列相似程度的LCS算法研究 被引量:14
7
作者 王映龙 杨炳儒 +2 位作者 宋泽锋 陈卓 唐建军 《计算机工程与应用》 CSCD 北大核心 2007年第31期45-47,共3页
首先重新审视了采用穷举法求解LCS问题的困难,以及对应的优点;随后针对穷举法的优点进行了两类优化;最后给出了算法实现的图示以及算法的结论。通过实验证明,算法的效率较传统的动态规划的LCS算法有了很大的提升。
关键词 最长公共子序列 穷举法 基因序列排比
下载PDF
一种基于熵的文本相似性计算方法 被引量:13
8
作者 李圣文 凌微 +1 位作者 龚君芳 周长征 《计算机应用研究》 CSCD 北大核心 2016年第3期665-668,共4页
文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法... 文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法,在对文本间字符信息的提取基础上,建立共同子文本串度量维度,然后采用熵的方法进行相似度度量。实验表明,该方法具有更平滑的相似度曲线,从而验证了算法的有效性和准确性。 展开更多
关键词 文本相似性 字符串匹配 编辑距离算法 最长公共子序列
下载PDF
两种基于双向比较的最长公共子串算法 被引量:9
9
作者 王开云 孔思淇 +3 位作者 付云生 潘泽友 马卫东 赵强 《计算机研究与发展》 EI CSCD 北大核心 2013年第11期2444-2454,共11页
查找两个给定字符串的最长公共子串(LCSstr)是一类重要字符串分析问题,在字符串近似匹配、计算机病毒特征码对比等方面有着广泛的用途.最长公共子串算法目前主要包括动态规划算法(LCSstrDP)和后缀数组算法(LCSstrSA),分别用于短串和长... 查找两个给定字符串的最长公共子串(LCSstr)是一类重要字符串分析问题,在字符串近似匹配、计算机病毒特征码对比等方面有着广泛的用途.最长公共子串算法目前主要包括动态规划算法(LCSstrDP)和后缀数组算法(LCSstrSA),分别用于短串和长串的最长公共子串计算.前者代码简洁,但计算速度较慢,后者速度很快但算法非常复杂.提出两种基于双向比较的最长公共子串算法,即LCSstrSeL和LCSstrSCeL.LCSstrSeL跨越已有的最长公共子串长度,与LCSstrDP相比,代码同样简洁,平均计算效率提高近一个数量级,并且不需要额外的存储空间.LCSstrSCeL是在LCSstrSeL的基础上,增加字符跨越、连续同值区间跨越等机制,平均效率较LCSstrSeL亦有一定程度的提高,内存开销与LCSstrDP相近,在中小长度的字符串LCSstr计算中,平均计算效率高于LCSstrSA,某些情况下的计算效率可达到亚线性的速度. 展开更多
关键词 最长公共子串 双向比较 连续同值区间 跨越 亚线性
下载PDF
结合Hausdorff距离和最长公共子序列的轨迹分类 被引量:25
10
作者 魏龙翔 何小海 +1 位作者 滕奇志 高明亮 《电子与信息学报》 EI CSCD 北大核心 2013年第4期784-790,共7页
为了提高运动目标轨迹分类的准确性,该文综合考虑了轨迹的位置信息和方向信息,提出了一种结合Hausdorff距离和最长公共子序列(Longest Common SubSequence,LCSS)的轨迹分类算法。该算法首先采用改进的Hausdorff距离对轨迹的位置信息进... 为了提高运动目标轨迹分类的准确性,该文综合考虑了轨迹的位置信息和方向信息,提出了一种结合Hausdorff距离和最长公共子序列(Longest Common SubSequence,LCSS)的轨迹分类算法。该算法首先采用改进的Hausdorff距离对轨迹的位置信息进行相似性测量,然后采用改进的LCSS算法对轨迹的方向信息进行相似性测量。与其他轨迹聚类算法不同,该算法融合了Hausdorff距离和LCSS两种算法的优点,提高了轨迹分类的准确性。此外,为了进一步降低计算复杂度,该文还实现了一种基于插值的保距变换算法和一种LCSS快速算法。实验结果表明,该轨迹分类算法可以明显提高轨迹的聚类准确率,聚类准确率可达到96%;基于插值的保距变换算法和LCSS快速算法可以很大程度上降低算法的计算复杂度,下降幅度最大可达到80%。该方法可以同时满足轨迹分类对精确度、实时性和鲁棒性的要求。 展开更多
关键词 图像处理 轨迹分类 HAUSDORFF距离 最长公共子序列(LCSS) 保距变换 LCSS快速算法
下载PDF
带约束最长公共子序列快速算法 被引量:7
11
作者 业宁 朱大铭 +1 位作者 张倩倩 沈丽容 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第5期576-584,共9页
带约束最长公共子序列(CLCS)问题有很深的生物学应用背景,常被用来表示同源基因序列相似性的度量,但计算CLCS时间代价很高,最早的CLCS算法的时间复杂度为O(rn4),目前,最快的CLCS算法的时间复杂性为O(rn2).运用对偶原理将带约束最长公共... 带约束最长公共子序列(CLCS)问题有很深的生物学应用背景,常被用来表示同源基因序列相似性的度量,但计算CLCS时间代价很高,最早的CLCS算法的时间复杂度为O(rn4),目前,最快的CLCS算法的时间复杂性为O(rn2).运用对偶原理将带约束最长公共子序列问题转换为带约束最小覆盖集问题,并建立带权的ref树结构,构造包含约束序列的约束覆盖子集,约简带约束覆盖子集并从中搜索关键路径,再通过关键路径构造CLCS,该算法将算法时间复杂度提升到O(nlogn+(q+r)L),r是约束序列的长度,q是两序列序偶的个数,L是两序列的最长公共子序列(LCS)长度. 展开更多
关键词 带约束最长公共子序列 快速算法 对偶算法
下载PDF
基于聚类分析的内核恶意软件特征选择 被引量:14
12
作者 陈志锋 李清宝 +1 位作者 张平 冯培钧 《电子与信息学报》 EI CSCD 北大核心 2015年第12期2821-2829,共9页
针对现有基于数据特征的内核恶意软件检测方法存在随特征的增多效率较低的问题,该文提出一种基于层次聚类的特征选择方法。首先,分析相似度计算方法应用于数据特征相似度计算时存在的困难,提出最长公共子集并设计两轮Hash求解法计算最... 针对现有基于数据特征的内核恶意软件检测方法存在随特征的增多效率较低的问题,该文提出一种基于层次聚类的特征选择方法。首先,分析相似度计算方法应用于数据特征相似度计算时存在的困难,提出最长公共子集并设计两轮Hash求解法计算最长公共子集;其次,设计基于最长公共子集的层次聚类算法,有效地将相似特征聚类成簇;在此基础上,设计基于不一致系数的内核恶意软件特征选择算法,大大减少特征数,提高检测效率。实验结果验证了方法的有效性,且时间开销在可接受的范围内。 展开更多
关键词 数据特征 最长公共子集 层次聚类 特征选择 内核恶意软件
下载PDF
基于最大匹配原则的变电运行培训仿真评估新方法 被引量:8
13
作者 何桦 顾全 夏可青 《电力系统自动化》 EI CSCD 北大核心 2008年第18期59-62,共4页
在分析调度员培训仿真评估和变电运行培训仿真评估之间差异的基础上,提出了一种以最大匹配原则为指导的变电运行培训仿真评估新方法。引入了最长公共子序列的动态规划求解方法,包括设置标准答案、手动编码、自动编码、自动比对、自动着... 在分析调度员培训仿真评估和变电运行培训仿真评估之间差异的基础上,提出了一种以最大匹配原则为指导的变电运行培训仿真评估新方法。引入了最长公共子序列的动态规划求解方法,包括设置标准答案、手动编码、自动编码、自动比对、自动着色以及评价打分等步骤。应用这一评估方法能大量减少教员培训评估总的工作量,保证培训评估的公正性。分析表明,应用最大匹配原则的评估方法适用于大多数的培训仿真教案。实用结果表明,所述方法在变电运行培训仿真系统的评估中具有很好的实用性。 展开更多
关键词 变电运行培训仿真 培训评估 最长公共子序列
下载PDF
基于改进的模糊C-Means航迹聚类方法研究 被引量:18
14
作者 王超 王明明 王飞 《中国民航大学学报》 CAS 2013年第3期14-18,共5页
为指导飞行程序的改善和发现管制员的指挥模式,在分析历史飞行航迹特征基础上,应用最小描绘长度(MDL)原理对航迹特征点进行划分,运用融合了遗传算法和模拟退火算法的改进的模糊C-Means算法对特征点进行聚类,通过最长公共子序列(LCS)算... 为指导飞行程序的改善和发现管制员的指挥模式,在分析历史飞行航迹特征基础上,应用最小描绘长度(MDL)原理对航迹特征点进行划分,运用融合了遗传算法和模拟退火算法的改进的模糊C-Means算法对特征点进行聚类,通过最长公共子序列(LCS)算法得到航迹相似性矩阵,利用矩阵得到航迹簇,最后形成中心航迹,算例仿真验证了新算法的有效性。 展开更多
关键词 航迹聚类 遗传模拟退火算法 模糊C—Means 最长公共子序列
下载PDF
基于主题词的微博热点话题发现 被引量:11
15
作者 叶成绪 杨萍 刘少鹏 《计算机应用与软件》 CSCD 2016年第2期46-50,共5页
近年来,微博网站已成为海量信息的发布平台。微博丰富的信息为用户提供便利的同时,也带来了信息过载的风险。针对热点话题发现能够降低信息过载的风险,改善用户体验。结合最长公共子串和维基百科知识,提出一种基于主题词的中文微博热点... 近年来,微博网站已成为海量信息的发布平台。微博丰富的信息为用户提供便利的同时,也带来了信息过载的风险。针对热点话题发现能够降低信息过载的风险,改善用户体验。结合最长公共子串和维基百科知识,提出一种基于主题词的中文微博热点话题发现方法。首先,获取微博数据的高频最长公共子串,作为描述话题的候选主题词;其次,利用维基百科知识,对候选主题词进行筛选;最后,对主题词集合聚类以发现话题,并计算每个话题的能量,从中选取热点话题。在真实数据集上的实验表明,该方法能有效发现微博热点话题。 展开更多
关键词 主题词 维基百科 最长公共子串 热点话题发现 微博
下载PDF
最长公共子序列算法在程序代码相似度度量中的应用 被引量:7
16
作者 于海英 赵俊岚 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第2期225-229,共5页
阐述了最长公共子序列算法在程序代码结构相似度度量中的应用,列举了两种计算最优值和一种获取最长公共标识符子序列的算法.根据最优值得到结构相似度值,进而可以查找出结构相似程序对.最后探讨了程序代码相似度的实际应用.
关键词 最长公共子序列算法 最优值 结构相似度 最长公共标识符子序列
下载PDF
基于word2vec的大中华区词对齐库的构建 被引量:6
17
作者 王明文 徐雄飞 +1 位作者 徐凡 李茂西 《中文信息学报》 CSCD 北大核心 2015年第5期76-83,共8页
该文针对大陆、香港和台湾地区(简称大中华区)存在同一种语义但采用不同词语进行表达的语言现象进行分析。首先,我们抓取了维基百科以及简繁体新闻网站上的3 200 000万组大中华区平行句对,手工标注了一致性程度达到95%以上的10 000组大... 该文针对大陆、香港和台湾地区(简称大中华区)存在同一种语义但采用不同词语进行表达的语言现象进行分析。首先,我们抓取了维基百科以及简繁体新闻网站上的3 200 000万组大中华区平行句对,手工标注了一致性程度达到95%以上的10 000组大中华区平行词对齐语料库。同时,我们提出了一个基于word2vec的两阶段大中华区词对齐模型,该模型采用word2vec获取大中华区词语的向量表示形式,并融合了有效的余弦相似度计算方法以及后处理技术。实验结果表明我们提出的大中华区词对齐模型在以上两种不同文体的词对齐语料库上的F1值显著优于现有的GIZA++和基于HMM的基准模型。此外,我们在维基百科上利用该词对齐模型进一步生成了90 029组准确率达82.66%的大中华区词语三元组。 展开更多
关键词 大中华区 词对齐 最长公共子序列 word2vec
下载PDF
基于句子相似度的论文抄袭检测模型研究 被引量:9
18
作者 冷强奎 秦玉平 王春立 《计算机工程与应用》 CSCD 北大核心 2011年第24期199-201,共3页
提出一种基于句子相似度的论文抄袭检测模型。利用局部词频指纹算法对大规模文档进行快速检测,找出疑似抄袭文档。根据最长有序公共子序列算法计算句子间的相似度,并标注抄袭细节,给出抄袭依据。在标准中文数据集SOGOU-T上进行的实验表... 提出一种基于句子相似度的论文抄袭检测模型。利用局部词频指纹算法对大规模文档进行快速检测,找出疑似抄袭文档。根据最长有序公共子序列算法计算句子间的相似度,并标注抄袭细节,给出抄袭依据。在标准中文数据集SOGOU-T上进行的实验表明,该模型具有较强的局部信息挖掘能力,在一定程度上克服了现有的论文抄袭检测算法精度不高的缺点。 展开更多
关键词 句子相似度 抄袭检测 局部词频 最长有序公共子序列
下载PDF
相关航空器的冲突探测与调度研究 被引量:4
19
作者 武晓光 张军峰 郑乐 《武汉理工大学学报(交通科学与工程版)》 2015年第1期166-170,共5页
为了及时探测潜在冲突,保证调度的实施,在先到先服务(FCFS)及固定航路航迹预测条件下,对相关航空器进行冲突的探测,通过合理调度解脱冲突.文中提出最长公共子序列(LCS)思想的初步探测及基于4D航迹的再次探测方法,提高探测效率,以数据统... 为了及时探测潜在冲突,保证调度的实施,在先到先服务(FCFS)及固定航路航迹预测条件下,对相关航空器进行冲突的探测,通过合理调度解脱冲突.文中提出最长公共子序列(LCS)思想的初步探测及基于4D航迹的再次探测方法,提高探测效率,以数据统计方法挖掘解脱路径用以冲突的解脱,以浦东机场进场航班实现仿真,验证冲突探测及调度的有效性. 展开更多
关键词 相关航空器 冲突探测 调度 最长公共子序列
下载PDF
基于动态规划的汉语句子相似度算法 被引量:8
20
作者 冯凯 王小华 谌志群 《计算机工程》 CAS CSCD 2013年第2期220-224,共5页
传统汉语句子相似度计算算法在处理大量专业词汇时准确率较低。为此,提出一种基于动态规划的汉语句子相似度算法。通过获取2个句子的公共子串集合,结合链表消重机制,从集合中获取2个句子的所有最长公共子串,并以此计算相似度。实验结果... 传统汉语句子相似度计算算法在处理大量专业词汇时准确率较低。为此,提出一种基于动态规划的汉语句子相似度算法。通过获取2个句子的公共子串集合,结合链表消重机制,从集合中获取2个句子的所有最长公共子串,并以此计算相似度。实验结果表明,对于含有大量专有名词的问题集合,该算法的测试正确率达93.6%,计算效率较高。 展开更多
关键词 句子相似度 动态规划 自动问答 最长公共子串 消重链表
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部