期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
朝鲜文字信息结构的研究 被引量:1
1
作者 崔荣一 金世珍 《中文信息学报》 CSCD 北大核心 2011年第5期114-119,共6页
该文研究了朝鲜文字空间结构中不同位置上的基本字母对文字结构的分类所提供的信息贡献。首先,提出了文字的结构距离的概念与计算方法,描述了不同结构之间的差异;其次,研究了文字结构的等价类划分方法以及文字结构的概率分布;最后,通过... 该文研究了朝鲜文字空间结构中不同位置上的基本字母对文字结构的分类所提供的信息贡献。首先,提出了文字的结构距离的概念与计算方法,描述了不同结构之间的差异;其次,研究了文字结构的等价类划分方法以及文字结构的概率分布;最后,通过计算结构分类时不同位置上的基本字母的信息增益,刻画了文字中信息的分布结构。对实际朝鲜语文档的实验表明,c1-v2、c1-v1-c3、c1-v2-c3型结构的文字具有显著的高概率特性,v1、v2类型和c3类型字母对结构分类的影响最大。 展开更多
关键词 朝鲜文字 文字结构等价类 结构距离 信息增益
下载PDF
基于编辑距离的中文机构名简称检索方法研究 被引量:1
2
作者 赵亚慧 《内蒙古科技与经济》 2010年第7期69-70,共2页
文章针对基于中文机构名简称的检索方法,研究了机构名的结构特征,提出了中文机构名简称和全称匹配的一种新算法的应用,通过计算中文机构名简称与机构名全称的编辑距离,达到快速检索目标机构的目的。仿真实验结果表明:所提的方法准确性较... 文章针对基于中文机构名简称的检索方法,研究了机构名的结构特征,提出了中文机构名简称和全称匹配的一种新算法的应用,通过计算中文机构名简称与机构名全称的编辑距离,达到快速检索目标机构的目的。仿真实验结果表明:所提的方法准确性较好,首选准确率较高,达到了适用要求。 展开更多
关键词 编辑距离 文本分类 分词算法 模糊匹配
下载PDF
车辆识别与样本自动采集方法的研究
3
作者 王齐 金小峰 《延边大学学报(自然科学版)》 CAS 2015年第2期164-169,共6页
为解决车辆样本采集困难的问题,在研究车辆识别与跟踪的基础上提出了样本的自动采集方法.首先,采用Blob分析技术从视频流中检测出车辆;其次,结合Blob和CamShift跟踪算法跟踪运动车辆;再次,通过分析车辆的运动轨迹判定其停驶状态;最后,... 为解决车辆样本采集困难的问题,在研究车辆识别与跟踪的基础上提出了样本的自动采集方法.首先,采用Blob分析技术从视频流中检测出车辆;其次,结合Blob和CamShift跟踪算法跟踪运动车辆;再次,通过分析车辆的运动轨迹判定其停驶状态;最后,控制云台变焦摄像机获取车辆的细节图像,以此作为车辆的样本.实验结果表明,本文提出的方法实时性高,对车辆的识别与跟踪、停驶判断具有较高的准确性,获取的车辆样本图像细节丰富,能够满足车辆样本库建设的基本要求. 展开更多
关键词 车辆识别与跟踪 BLOB分析 CAMSHIFT 车辆样本采集 车辆样本库
下载PDF
线性化朝鲜文字的歧义性研究 被引量:2
4
作者 蔡京哲 崔荣一 《中文信息学报》 CSCD 北大核心 2008年第5期121-128,共8页
该文研究了线性化朝鲜文字重构过程中存在的固有的歧义性问题,并讨论了歧义性消除方案。首先,研究了描述朝鲜文字结构的形式化方法,给出朝鲜文字组成的基本规则和相应的有限状态自动机;其次,给出文字线性化与重构的数学描述,论证了文字... 该文研究了线性化朝鲜文字重构过程中存在的固有的歧义性问题,并讨论了歧义性消除方案。首先,研究了描述朝鲜文字结构的形式化方法,给出朝鲜文字组成的基本规则和相应的有限状态自动机;其次,给出文字线性化与重构的数学描述,论证了文字重构时存在歧义性的必要条件和充分条件,并分析了线性化文字序列歧义度的本质和歧义性发生的概率;最后,讨论了文字重构歧义性消除的方案,给出了基于基本字母的在线式朝鲜文字序列输入算法和核心步骤,通过仿真实验验证了该方案的可靠性和有效性。 展开更多
关键词 计算机应用 中文信息处理 朝鲜文字 线性化文字序列 文字重构 文字序列歧义性
下载PDF
基于分布式图计算的学术论文推荐算法 被引量:5
5
作者 潘峰 怀丽波 崔荣一 《计算机应用研究》 CSCD 北大核心 2019年第6期1629-1632,1642,共5页
针对海量论文数据导致的应用效率低下问题,提出一个基于层次混合模型的推荐算法WSVD++。该模型根据学术论文良好的结构特征,构建一个加权的论文二部图模型。首先对论文进行特征提取,按不同特征的权重构建论文的复合关系图;其次对关系图... 针对海量论文数据导致的应用效率低下问题,提出一个基于层次混合模型的推荐算法WSVD++。该模型根据学术论文良好的结构特征,构建一个加权的论文二部图模型。首先对论文进行特征提取,按不同特征的权重构建论文的复合关系图;其次对关系图采用一种改进的PPR算法,计算每篇论文的重要程度,依此来对用户—论文关系进行加权;然后在构建好的加权二部图模型上混合SVD++图算法进行推荐。实验结果表明,改善了推荐算法学术论文的推荐效果,并且基于分布式图计算框架GraphX,扩展性好,适合大数据处理。 展开更多
关键词 混合模型推荐 协同过滤 SVD++ 分布式图计算 GraphX
下载PDF
改进的跨语种说话人确认方法的研究
6
作者 朱虹 金小峰 《延边大学学报(自然科学版)》 CAS 2017年第2期184-188,共5页
提出了一种基于改进的语音融合特征和GMM模型相结合的跨语种说话人确认方法.首先,采用Teager能量算子提取语音中的浊音段,消除与说话人声道特征无关的静音段和清音段.其次,提取基音周期参数,并与16维的MFCC参数融合形成本文的语音融合特... 提出了一种基于改进的语音融合特征和GMM模型相结合的跨语种说话人确认方法.首先,采用Teager能量算子提取语音中的浊音段,消除与说话人声道特征无关的静音段和清音段.其次,提取基音周期参数,并与16维的MFCC参数融合形成本文的语音融合特征.最后,将本文方法与文献[9]的方法分别进行了单语种和跨语种的说话人确认对比实验,实验结果表明本文方法识别准确率和平均判别时间均优于文献[9]的方法,证明本文提出的方法有效,可用于跨语种的说话人确认应用领域. 展开更多
关键词 说话人确认 跨语种 浊音段提取 融合特征
下载PDF
改进的Apriori算法在成绩分析中的应用研究
7
作者 侯继文 徐善针 《延边大学学报(自然科学版)》 CAS 2015年第2期160-163,共4页
针对经典Apriori算法会产生大量冗余规则的缺点,在两方面对算法进行了改进:一方面是对产生频繁项集方式的改进,使算法只产生包含目标项的频繁项集;另一方面是对产生规则方式的改进,使算法只产生关联后件中包含目标项的关联规则.Apriori... 针对经典Apriori算法会产生大量冗余规则的缺点,在两方面对算法进行了改进:一方面是对产生频繁项集方式的改进,使算法只产生包含目标项的频繁项集;另一方面是对产生规则方式的改进,使算法只产生关联后件中包含目标项的关联规则.Apriori算法改进前后的对比表明:改进后的Apriori算法可以避免非目标规则的产生,使算法更符合成绩分析的需要,提高算法的执行效率.将改进的Apriori算法应用于成绩分析中表明,改进后的算法能够挖掘出各门前导课程成绩对后续课程成绩的影响,因此可为教师制定有针对性的教学计划提供参考. 展开更多
关键词 关联规则 改进的Apriori算法 成绩分析
下载PDF
基于改进遗传算法的排课问题研究 被引量:3
8
作者 范明杰 怀丽波 《计算技术与自动化》 2018年第1期89-94,共6页
针对遗传算法在解决排课问题中易陷入局部最优解的缺陷,提出一种改进的遗传算法。在传统遗传算法基础之上,融合模拟退火思想,使交叉得到的子代以一定概率进入下一代,并对传统的基于概率的计算方法进行改进,编排出优质的课表。实验结果... 针对遗传算法在解决排课问题中易陷入局部最优解的缺陷,提出一种改进的遗传算法。在传统遗传算法基础之上,融合模拟退火思想,使交叉得到的子代以一定概率进入下一代,并对传统的基于概率的计算方法进行改进,编排出优质的课表。实验结果表明改进算法不仅加快了前期进化速度,而且解决了遗传算法后期易陷入局部最优解的缺陷。 展开更多
关键词 遗传算法 排课 模拟退火
下载PDF
融合项目属性特征的SVD协同过滤推荐算法研究 被引量:1
9
作者 潘峰 怀丽波 崔荣一 《延边大学学报(自然科学版)》 CAS 2017年第4期334-338,共5页
针对协同过滤方法中用户-项目评分矩阵的极端稀疏性问题,提出了一种基于层次的混合推荐方法.首先利用TF-IDF提取项目属性特征,并利用余弦相似度对评分矩阵的缺失值进行填充;然后通过对填充的矩阵做SVD,寻找隐性特征,建立隐语义模型;最... 针对协同过滤方法中用户-项目评分矩阵的极端稀疏性问题,提出了一种基于层次的混合推荐方法.首先利用TF-IDF提取项目属性特征,并利用余弦相似度对评分矩阵的缺失值进行填充;然后通过对填充的矩阵做SVD,寻找隐性特征,建立隐语义模型;最后将本文的算法分别与众数填充和无填充模型进行对比实验,结果表明本文提出的方法有效提高了推荐的精度. 展开更多
关键词 稀疏性问题 混合推荐方法 协同过滤 隐语义模型
下载PDF
跨语言文献相似度的分析方法 被引量:2
10
作者 刘娇 崔荣一 +1 位作者 赵亚慧 张振国 《延边大学学报(自然科学版)》 CAS 2016年第2期151-155,共5页
对不同语言的句对齐文献资料进行分析,提出了基于多语主题模型的跨语言文献相似度的计算方法.首先,对收集整理的不同语言(中文、英文、韩文)文献构建数据模型,通过分词、分词结果修正及选择、词权重计算等预处理工作构造词项-文档矩阵.... 对不同语言的句对齐文献资料进行分析,提出了基于多语主题模型的跨语言文献相似度的计算方法.首先,对收集整理的不同语言(中文、英文、韩文)文献构建数据模型,通过分词、分词结果修正及选择、词权重计算等预处理工作构造词项-文档矩阵.其次,建立多语主题语义空间,将译成3种不同语言的文献映射到语义空间,在语义空间中每一主题都由3种语言构成.最后,通过其语义空间中对应的主题计算比较不同语言间的文献相似度.实验结果显示,不同语言之间的文献相似度可以直接在语义空间中计算,且相似度计算的准确性在90%以上,验证了本文方法在跨语言文献相似度计算时的有效性. 展开更多
关键词 多语主题模型 跨语言 语义相似度
下载PDF
基于基本图像特征的中朝文种辨识方法
11
作者 张鹏 崔荣一 《延边大学学报(自然科学版)》 CAS 2017年第2期173-178,共6页
提出了一种基于基本图像特征、适用于不同分辨率自然文本图像的中朝文种辨识方法.在训练阶段,首先构造标准文字图像库,然后提取文字的形态学骨架,最后利用骨架的基本图像特征来训练BP神经网络;在辨识阶段,首先对自然文本图像进行倾斜校... 提出了一种基于基本图像特征、适用于不同分辨率自然文本图像的中朝文种辨识方法.在训练阶段,首先构造标准文字图像库,然后提取文字的形态学骨架,最后利用骨架的基本图像特征来训练BP神经网络;在辨识阶段,首先对自然文本图像进行倾斜校正后做二值化处理以提高字符分割的效果,然后进行垂直投影、水平投影、字符分割和提取每个字符的骨架信息,最后基于字符骨架的基本图像特征利用BP神经网络来进行文种辨识.实验表明,本文提出的方法在中朝文种辨识中综合辨识准确率可达到87%. 展开更多
关键词 文种辨识 形态学骨架 基本图像特征 BP神经网络
下载PDF
基于MapReduce的朴素贝叶斯算法在新闻分类中的应用 被引量:4
12
作者 徐保鑫 怀丽波 崔荣一 《延边大学学报(自然科学版)》 CAS 2017年第1期55-59,共5页
针对传统单点串行的分类算法在面对新闻数据规模较大、分类属性较多时存在效率低的问题,本文研究了朴素贝叶斯分类算法在MapReduce下的并行实现方法.首先对新闻信息进行分词、格式转换等预处理,然后进行特征提取、分类模型构造;最后进... 针对传统单点串行的分类算法在面对新闻数据规模较大、分类属性较多时存在效率低的问题,本文研究了朴素贝叶斯分类算法在MapReduce下的并行实现方法.首先对新闻信息进行分词、格式转换等预处理,然后进行特征提取、分类模型构造;最后进行了分类测试.测试结果表明,在大数据量的情况下,并行化的贝叶斯算法较传统的贝叶斯算法具有更好的执行效率和较高的扩展性. 展开更多
关键词 HADOOP 朴素贝叶斯 MAPREDUCE 文本分类 新闻文本
下载PDF
基于Kinect的跌倒行为识别算法 被引量:2
13
作者 罗凯 金小峰 《延边大学学报(自然科学版)》 CAS 2016年第2期156-160,共5页
根据人体跌倒时的骨架特征,提出了一种人体跌倒行为识别方法.首先,依据跌倒行为的定义,将人体的头部和重心节点作为表征跌倒行为的特征参数,通过Kinect传感器获取人体骨架信息;其次,采用滑动窗口和阈值方法确定行为的发生阶段,并提取其... 根据人体跌倒时的骨架特征,提出了一种人体跌倒行为识别方法.首先,依据跌倒行为的定义,将人体的头部和重心节点作为表征跌倒行为的特征参数,通过Kinect传感器获取人体骨架信息;其次,采用滑动窗口和阈值方法确定行为的发生阶段,并提取其运动特征向量;最后,通过人工神经网络对本文提取的跌倒行为特征进行训练和识别.实验结果表明,本文提出的方法高效准确,识别率达到90.5%. 展开更多
关键词 KINECT 人体骨架信息 跌倒行为识别 人工神经网络
下载PDF
基于梯度阈值和特征抑制的运动目标检测算法 被引量:1
14
作者 魏琳 崔荣一 金璟璇 《延边大学学报(自然科学版)》 CAS 2017年第1期37-42,共6页
提出了一种基于梯度阈值和特征抑制的光流运动目标检测算法.首先将LK光流法和HS光流法思想进行互补,在梯度值较大的点使用亮度约束,梯度值较小的点使用平滑约束;然后采用特征抑制方法,筛选能够确定运动目标位置的光流点;最后检测出完整... 提出了一种基于梯度阈值和特征抑制的光流运动目标检测算法.首先将LK光流法和HS光流法思想进行互补,在梯度值较大的点使用亮度约束,梯度值较小的点使用平滑约束;然后采用特征抑制方法,筛选能够确定运动目标位置的光流点;最后检测出完整的运动目标.实验结果表明,本文算法提高了运动目标检测的准确度,而且实时性较好. 展开更多
关键词 光流法 梯度阈值 特征抑制 目标检测
下载PDF
基于最大Jaccard相似度的互激励实体验证算法 被引量:1
15
作者 刘宝超 崔荣一 《延边大学学报(自然科学版)》 CAS 2015年第1期42-45,共4页
针对基于规则的信息抽取技术提出了一种互激励实体验证算法.该算法兼顾了信息抽取过程中互激励算法的优点,并在此基础上引入了实体等待队列,用于存储未被成功验证的实体,并以最大Jaccard相似度为原则进行实体验证.实验结果表明,将该算... 针对基于规则的信息抽取技术提出了一种互激励实体验证算法.该算法兼顾了信息抽取过程中互激励算法的优点,并在此基础上引入了实体等待队列,用于存储未被成功验证的实体,并以最大Jaccard相似度为原则进行实体验证.实验结果表明,将该算法应用在基于规则的参考文献命名实体抽取中,其抽取的准确率要比SermeX系统高约15%,比Para Tools系统高约40%. 展开更多
关键词 互激励 信息抽取 参考文献 实体验证
下载PDF
基于帧符号化的语音相似性度量方法
16
作者 刘双君 金小峰 崔荣一 《延边大学学报(自然科学版)》 CAS 2014年第1期45-48,共4页
提出了将语音帧符号化后度量语音相似性的方法.首先,去除语音段中的静音部分,并提取每帧语音的MFCC参数;其次,将MFCC参数进行k均值聚类和KNN分类,并根据分类结果对语音信号进行符号化;最后,采用编辑距离计算语音段之间的相似性.实验表明... 提出了将语音帧符号化后度量语音相似性的方法.首先,去除语音段中的静音部分,并提取每帧语音的MFCC参数;其次,将MFCC参数进行k均值聚类和KNN分类,并根据分类结果对语音信号进行符号化;最后,采用编辑距离计算语音段之间的相似性.实验表明,将语音符号化后,音频之间的可区分性更加明显,识别率也有了明显提高. 展开更多
关键词 K均值聚类 KNN分类 符号化 编辑距离
下载PDF
面向cocos2dx的代码混淆器的设计与实现
17
作者 王晓宇 蔡京哲 《延边大学学报(自然科学版)》 CAS 2015年第1期64-67,共4页
针对目前使用的代码混淆技术不能完全适用于手机的问题,在分析常用的代码混淆技术的基础上,提出用于手机引擎cocos2dx的基于代码匹配的混淆方法,即在外形(layout)混淆的基础上利用代码匹配技术搜索相同功能的代码并替换成更难让人读懂... 针对目前使用的代码混淆技术不能完全适用于手机的问题,在分析常用的代码混淆技术的基础上,提出用于手机引擎cocos2dx的基于代码匹配的混淆方法,即在外形(layout)混淆的基础上利用代码匹配技术搜索相同功能的代码并替换成更难让人读懂的形态.试验分析表明,该方法的混淆效果好于传统外形混淆效果,执行程序过程中不仅没有降低运行效率,在某些情况下运行效率还有所提升. 展开更多
关键词 代码混淆 手机软件 代码匹配
下载PDF
基于术语自动抽取的科技文献翻译辅助系统的设计 被引量:4
18
作者 黄政豪 崔荣一 《延边大学学报(自然科学版)》 CAS 2017年第3期259-263,共5页
设计了一种中韩科技信息综合平台中的翻译辅助系统.首先,依据关键词确定的组词特证获取候选术语,并使用互信息评估候选术语以实现术语自动提取.其次,将已有术语、抽取到的新术语、术语译文和历史翻译记录等信息存储到系统数据库中建立... 设计了一种中韩科技信息综合平台中的翻译辅助系统.首先,依据关键词确定的组词特证获取候选术语,并使用互信息评估候选术语以实现术语自动提取.其次,将已有术语、抽取到的新术语、术语译文和历史翻译记录等信息存储到系统数据库中建立术语库.最后,设计翻译工作者的用户接口,使其通过该接口获取已有术语的译文信息、新术语的相似译文信息和译文记忆库为基础的历史翻译数据.测试结果表明,本文设计的术语自动抽取功能和辅助译文生成功能达到了预定的设计目标,术语自动抽取算法召回率达到61.8%,结合优化方法进行优化后达到66.9%;辅助译文生成平均延时为0.031s,MRR为0.951,测试结果满足用户需求. 展开更多
关键词 术语自动识别 术语抽取 翻译辅助系统
下载PDF
交通场景静态显著性区域检测 被引量:4
19
作者 方志明 崔荣一 金璟璇 《激光与光电子学进展》 CSCD 北大核心 2017年第5期280-286,共7页
交通场景的显著目标检测能够为自动决策或辅助驾驶系统提供重要信息。基于视觉的底层特性,提出了一种基于亮度空间和对立颜色空间的多特征空间奇异值分解的交通场景显著性区域快速检测方法,为交通标志检测和场景语义分析提供有效信息。... 交通场景的显著目标检测能够为自动决策或辅助驾驶系统提供重要信息。基于视觉的底层特性,提出了一种基于亮度空间和对立颜色空间的多特征空间奇异值分解的交通场景显著性区域快速检测方法,为交通标志检测和场景语义分析提供有效信息。首先,在亮度空间中,利用奇异值分解确定强光区域并进行强光抑制,检测抑制强光后的亮度特征显著性区域;其次,在双对立颜色空间中保留部分奇异值重构的区域作为颜色特征显著性区域;最后,对各个特征空间的显著性区域进行线性相加并将相加结果中的显著性区域作为交通场景目标检测的候选区域。实验结果表明,算法在复杂光照和背景下具有较好的稳健性。 展开更多
关键词 机器视觉 显著性区域 奇异值分解 交通场景 强光抑制
原文传递
一种快速的随机分块文本检索算法
20
作者 赵亚慧 刘金广 崔荣一 《武汉理工大学学报》 CAS CSCD 北大核心 2010年第23期135-139,共5页
针对向量空间模型(VSM)在信息检索中存在脱离上下文语境的缺陷,提出一种新的随机分块文本检索算法。该算法利用潜在语义分析技术在低维空间中对检索文本与待检索文本的各个段落进行投影,使用SVD技术对其进行了降维处理,得到文本特征,然... 针对向量空间模型(VSM)在信息检索中存在脱离上下文语境的缺陷,提出一种新的随机分块文本检索算法。该算法利用潜在语义分析技术在低维空间中对检索文本与待检索文本的各个段落进行投影,使用SVD技术对其进行了降维处理,得到文本特征,然后依据该文本特征进行相似的匹配,获得检索结果。由于充分考虑了文本的上下文语义信息,算法能够有效提高检索效率。实验结果表明,该算法在检索时间、查准率、召回率及综合性能等方面均得到较好的效果。 展开更多
关键词 随机分块检索算法 向量空间模型 SVD技术 文本相似度
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部