期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
Case Study: Data Mining of Associate Degree Accepted Candidates by Modular Method
1
作者 Behrouz Minaei Bidgoli Maryam Nazaridoust 《Communications and Network》 2012年第3期261-268,共8页
Since about 10 years ago, University of Applied Science and Technology (UAST) in Iran has admitted students in discontinuous associate degree by modular method, so that almost 100,000 students are accepted every year.... Since about 10 years ago, University of Applied Science and Technology (UAST) in Iran has admitted students in discontinuous associate degree by modular method, so that almost 100,000 students are accepted every year. Although the first aim of holding such courses was to improve scientific and skill level of employees, over time a considerable group of unemployed people have been interested to participate in these courses. According to this fact, in this paper, we mine and analyze a sample data of accepted candidates in modular 2008 and 2009 courses by using unsupervised and supervised learning paradigms. In the first step, by using unsupervised paradigm, we grouped (clustered) set of modular accepted candidates based on their student status and labeled data sets by three classes so that each class somehow shows educational and student status of modular accepted candidates. In the second step, by using supervised and unsupervised algorithms, we generated predicting models in 2008 data sets. Then, by making a comparison between performances of generated models, we selected predicting model of association rules through which some rules were extracted. Finally, this model is executed for Test set which includes accepted candidates of next course then by evaluation of results, the percentage of correctness and confidentiality of obtained results can be viewed. 展开更多
关键词 supervised learning unsupervised learning CLUSTERING CLUSTERING Similarity LABELING Association RULE Decision Tree PREDICT model Predicting Majors
下载PDF
面向数据中心的服务器能耗模型综述
2
作者 王东清 李道童 +2 位作者 彭继阳 叶丰华 张炳会 《计算机测量与控制》 2023年第11期7-15,共9页
伴随着云计算技术的快速发展,数据中心的服务器能耗日益激增,带来了严重的经济和环境问题,降低数据中心能耗,对缩减数据中心运营成本、实现全球“双碳”战略目标具有重要意义;因此,不同层面的服务器能耗模型构建和预估成为了近年来研究... 伴随着云计算技术的快速发展,数据中心的服务器能耗日益激增,带来了严重的经济和环境问题,降低数据中心能耗,对缩减数据中心运营成本、实现全球“双碳”战略目标具有重要意义;因此,不同层面的服务器能耗模型构建和预估成为了近年来研究的热点;据此,从硬件、软件层面系统地总结了服务器能耗模型的相关工作;在硬件层面,对服务器的整体能耗按加法模型、基于系统利用率模型和其他模型分类;同时,还总结了服务器部件粒度的能耗模型,涵盖CPU、内存、磁盘和网络接口;在软件层面,按机器学习的类别将服务器能耗模型归纳为监督学习、非监督学习、强化学习;此外,还比较了不同能耗模型的优缺点、适用场景,展望了能耗模型的未来研究方向。 展开更多
关键词 云计算 数据中心 能耗模型 监督学习 非监督学习 强化学习
下载PDF
基于无监督学习的电力系统网络潜在多步攻击实时检测方法
3
作者 苏江文 宋立华 《电气自动化》 2023年第2期15-17,共3页
针对网络潜在攻击行为检测率和准确率较低、误报率较高的问题,提出基于无监督学习的电力系统网络潜在多步攻击实时检测方法。通过提取攻击流量特征、输入训练好的无监督学习模型,判断攻击流量是否产生攻击行为,同时检测潜在多步攻击类... 针对网络潜在攻击行为检测率和准确率较低、误报率较高的问题,提出基于无监督学习的电力系统网络潜在多步攻击实时检测方法。通过提取攻击流量特征、输入训练好的无监督学习模型,判断攻击流量是否产生攻击行为,同时检测潜在多步攻击类别。使用网络模拟器,模拟电力系统网络环境,采用攻击工具进行网络流量攻击。试验结果表明,设计方法检测网络攻击流时,检测率和准确率较高,误报率较低。方法可以有效抵挡网络多步攻击行为,保证电力系统安全。 展开更多
关键词 无监督学习模型 电力系统网络 潜在多步攻击 攻击流量 流量特征 攻击类别
下载PDF
基于非参数贝叶斯模型和深度学习的古文分词研究 被引量:14
4
作者 俞敬松 魏一 +1 位作者 张永伟 杨浩 《中文信息学报》 CSCD 北大核心 2020年第6期1-8,共8页
古汉语文本中,汉字通常连续书写,词与词之间没有明显的分割标记,为现代人理解古文乃至文化传承带来许多障碍。自动分词是自然语言处理技术的基础任务之一。主流的自动分词方法需要大量人工分词语料训练,费时费力,古文分词语料获取尤其困... 古汉语文本中,汉字通常连续书写,词与词之间没有明显的分割标记,为现代人理解古文乃至文化传承带来许多障碍。自动分词是自然语言处理技术的基础任务之一。主流的自动分词方法需要大量人工分词语料训练,费时费力,古文分词语料获取尤其困难,限制了主流自动分词方法的应用。该文将非参数贝叶斯模型与BERT(Bidirectional Encoder Representations from Transformers)深度学习语言建模方法相结合,进行古文分词研究。在《左传》数据集上,该文提出的无监督多阶段迭代训练分词方法获得的F1值为93.28%;仅使用500句分词语料进行弱监督训练时,F1值可达95.55%,高于前人使用6/7语料(约36 000句)进行有监督训练的结果;使用相同规模训练语料时,该文方法获得的F1值为97.40%,为当前最优结果。此外,该文方法还具有较好的泛化能力,模型代码已开源发布。 展开更多
关键词 古文分词 非参数贝叶斯模型 深度学习 无指导学习 弱指导学习
下载PDF
蒙汉神经机器翻译研究综述 被引量:3
5
作者 侯宏旭 孙硕 乌尼尔 《计算机科学》 CSCD 北大核心 2022年第1期31-40,共10页
机器翻译是利用计算机将一种语言转换成另一种语言的过程,凭借着对语义的深度理解能力,神经机器翻译已经成为目前主流的机器翻译方法,在众多拥有大规模对齐语料的翻译任务上取得了令人瞩目的成就,然而对于一些低资源语言的翻译任务效果... 机器翻译是利用计算机将一种语言转换成另一种语言的过程,凭借着对语义的深度理解能力,神经机器翻译已经成为目前主流的机器翻译方法,在众多拥有大规模对齐语料的翻译任务上取得了令人瞩目的成就,然而对于一些低资源语言的翻译任务效果仍不理想。蒙汉机器翻译是目前国内主要的低资源机器翻译研究之一,蒙汉两种语言的翻译并不简单地是两种语言的相互转换,更是两个民族之间的交流,因此受到国内外的广泛关注。文中主要对蒙汉神经机器翻译的发展历程和研究现状进行阐述,随后选取了近年来蒙汉神经机器翻译研究的前沿方法,包括基于无监督学习和半监督学习的数据增强方法、强化学习方法、对抗学习方法、迁移学习方法和预训练模型辅助的神经机器翻译方法等,并对这些方法进行了简要介绍。 展开更多
关键词 蒙汉机器翻译 监督方法 半监督/无监督学习 强化学习 对抗学习 迁移学习 预训练模型
下载PDF
类别学习的SUSTA IN模型
6
作者 姜子云 肖慧 邓铸 《应用心理学》 CSSCI 2006年第1期77-83,共7页
SUSTAIN模型是关于类别学习的类群或群集规则的选择模型,它强调多层次的类别子结构和模型的结构搜索功能。模型的运行以类别相似性为基础,从最简单的规则开始,有灵活的参数及其运算过程,与其他主要的类别学习模型相比有更多的优势。因此... SUSTAIN模型是关于类别学习的类群或群集规则的选择模型,它强调多层次的类别子结构和模型的结构搜索功能。模型的运行以类别相似性为基础,从最简单的规则开始,有灵活的参数及其运算过程,与其他主要的类别学习模型相比有更多的优势。因此,SUSTAIN模型是迄今解释人类类别学习的最优模型。 展开更多
关键词 sustain模型 类别学习 群集规则 有/无指导学习
下载PDF
旅游自动应答语义模型分析与实践 被引量:2
7
作者 王彦 左春 曾炼 《计算机系统应用》 2017年第2期18-24,共7页
针对常见问答系统采用的以词法分析为基础的浅层语义模型难以有效挖掘用户问句深层语义的问题,本文立足于旅游问答应用领域,采用组合范畴语法对旅游问句进行句法分析,使用Lambda演算式表示问句语义,以此构建旅游领域问句的语义模型,以... 针对常见问答系统采用的以词法分析为基础的浅层语义模型难以有效挖掘用户问句深层语义的问题,本文立足于旅游问答应用领域,采用组合范畴语法对旅游问句进行句法分析,使用Lambda演算式表示问句语义,以此构建旅游领域问句的语义模型,以便于通过精确的问句语义快速查找应答结果.研究首先进行旅游领域数据采集与语料标注的准备性工作,并针对语料对旅游问句的句式句法进行分析;然后采用基于概率的组合范畴语法的监督学习过程,通过训练获得较为可靠的旅游问句语义词典;最后根据语义词典及其他相关知识,学习用户问句语义,构建旅游自动应答语义分析系统,着重于问句解析和相应的语义模型的构建.通过在评测集上的验证,这种语义解析方法在解析效果上有比较明确的提升. 展开更多
关键词 旅游问答系统 组合范畴语法 lambda演算 语义模型 监督学习
下载PDF
跨语言多任务学习深层神经网络在蒙汉机器翻译的应用 被引量:1
8
作者 张振 苏依拉 +2 位作者 仁庆道尔吉 高芬 王宇飞 《计算机应用与软件》 北大核心 2021年第1期157-160,178,共5页
针对蒙汉平行语料资源比较稀缺和现有平行语料数据覆盖面少等导致的蒙汉翻译质量不佳的问题,采用跨语言多任务学习的方式对机器翻译建模。在数据预处理阶段,引入两种新的无监督预训练和一种监督预训练的方法,用于跨语言建模来学习跨语... 针对蒙汉平行语料资源比较稀缺和现有平行语料数据覆盖面少等导致的蒙汉翻译质量不佳的问题,采用跨语言多任务学习的方式对机器翻译建模。在数据预处理阶段,引入两种新的无监督预训练和一种监督预训练的方法,用于跨语言建模来学习跨语言表示,并研究三种语言预训练方法在蒙汉翻译中的效果。实验结果表明,三种跨语言预训练的模型可以显著降低低资源语言的困惑度,提高蒙汉翻译质量。 展开更多
关键词 蒙汉机器翻译 无监督预训练 监督预训练 跨语言建模 多任务学习
下载PDF
自监督聚类重训练的语音表示学习 被引量:1
9
作者 张文林 刘雪鹏 +2 位作者 牛铜 杨绪魁 屈丹 《模式识别与人工智能》 EI CSCD 北大核心 2022年第5期461-471,共11页
现有的基于重建的自监督预训练方法往往通过对语音帧的还原重建进行训练,未充分利用语音帧包含的音素信息.因此,文中结合自监督学习方法与噪声学生训练,提出基于自监督聚类重训练的语音表示学习方法.基于一个初始的语音表示模型(教师模... 现有的基于重建的自监督预训练方法往往通过对语音帧的还原重建进行训练,未充分利用语音帧包含的音素信息.因此,文中结合自监督学习方法与噪声学生训练,提出基于自监督聚类重训练的语音表示学习方法.基于一个初始的语音表示模型(教师模型),利用无监督聚类得到音素类别伪标签.结合伪标签预测任务与重构任务,重新训练表示模型(学生模型).将学生模型作为新的教师模型,借助聚类与重训练,不断优化伪标签与语音表示模型.对比实验表明,经过聚类重训练后,语音表示模型在音素识别和说话人识别两项下游任务上均优于聚类重训练前的模型,性能较优. 展开更多
关键词 无监督学习 自监督学习 语音表示 预训练模型 掩蔽重建 噪声学生训练
下载PDF
一种应用稀疏高斯过程回归模型的半监督分类算法
10
作者 董晓慧 柴桂荣 孟宪春 《电脑知识与技术》 2010年第10期7881-7883,共3页
高斯过程(GPS)是一种良好的贝叶斯分类方法和回归过程,也可应用于半监督聚类方面,就此提出了一个新的算法:使用稀疏高斯过程回归模型来解决半监督二元分类问题,它是基于支持向量回归(SVR)和最大空间聚类(MMC)的半监督分类方... 高斯过程(GPS)是一种良好的贝叶斯分类方法和回归过程,也可应用于半监督聚类方面,就此提出了一个新的算法:使用稀疏高斯过程回归模型来解决半监督二元分类问题,它是基于支持向量回归(SVR)和最大空间聚类(MMC)的半监督分类方法,此算法简单且易于实现,不同于SVR算法的稀疏解决方案。另外,超参数的估计也不再使用复杂的交叉验证技术,利用稀疏高斯回归模型有助于提高算法的可扩展性:使用合成的和真实世界的数据集初步验证了该算法的有效性。 展开更多
关键词 高斯过程 半监督学习 空类噪声模型 半监督分类器 超参数
下载PDF
面向图像识别的多层脉冲神经网络学习算法综述 被引量:2
11
作者 李雅馨 申江荣 徐齐 《中国图象图形学报》 CSCD 北大核心 2023年第2期385-400,共16页
相较于第1代和第2代神经网络,第3代神经网络的脉冲神经网络是一种更加接近于生物神经网络的模型,因此更具有生物可解释性和低功耗性。基于脉冲神经元模型,脉冲神经网络可以通过脉冲信号的形式模拟生物信号在神经网络中的传播,通过脉冲... 相较于第1代和第2代神经网络,第3代神经网络的脉冲神经网络是一种更加接近于生物神经网络的模型,因此更具有生物可解释性和低功耗性。基于脉冲神经元模型,脉冲神经网络可以通过脉冲信号的形式模拟生物信号在神经网络中的传播,通过脉冲神经元的膜电位变化来发放脉冲序列,脉冲序列通过时空联合表达不仅传递了空间信息还传递了时间信息。当前面向模式识别任务的脉冲神经网络模型性能还不及深度学习,其中一个重要原因在于脉冲神经网络的学习方法不成熟,深度学习中神经网络的人工神经元是基于实数形式的输出,这使得其可以使用全局性的反向传播算法对深度神经网络的参数进行训练,脉冲序列是二值性的离散输出,这直接导致对脉冲神经网络的训练存在一定困难,如何对脉冲神经网络进行高效训练是一个具有挑战的研究问题。本文首先总结了脉冲神经网络研究领域中的相关学习算法,然后对其中主要的方法:直接监督学习、无监督学习的算法以及ANN2SNN的转换算法进行分析介绍,并对其中代表性的工作进行对比分析,最后基于对当前主流方法的总结,对未来更高效、更仿生的脉冲神经网络参数学习方法进行展望。 展开更多
关键词 脉冲神经网络(SNN) 学习算法 无监督学习 监督学习 脉冲神经元模型 图像识别
原文传递
基于语料库的语言建模 被引量:7
12
作者 许伟 苑春法 黄昌宁 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 1997年第3期71-76,共6页
语料库语言学的发展的核心问题是语言模型的建立问题。常用的语言模型可以概括为三类:(1)n元模型(及隐马尔可夫模型);(2)基于分布理论的模型;(3)基于规则的模型。基于语料库的建模过程就是对语言模型的参数进行求解的过... 语料库语言学的发展的核心问题是语言模型的建立问题。常用的语言模型可以概括为三类:(1)n元模型(及隐马尔可夫模型);(2)基于分布理论的模型;(3)基于规则的模型。基于语料库的建模过程就是对语言模型的参数进行求解的过程,也可以认为是一个机器学习的过程。它可分为两大类别:(1)有指导学习;(2)无指导学习。本文着重论述了近年发展的热点——无指导学习的各种技术和影响参数可信度的数据稀疏问题及其解决办法。 展开更多
关键词 语言模型 语料库语言学 隐马氏模型 计算语言学
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部