期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
27
篇文章
<
1
2
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于无指导学习策略的无词表条件下的汉语自动分词
被引量:
37
1
作者
孙茂松
肖明
邹嘉彦
《计算机学报》
EI
CSCD
北大核心
2004年第6期736-742,共7页
探讨了基于无指导学习策略和无词表条件下的汉语自动分词方法 ,以期对研制开放环境下健壮的分词系统有所裨益 .全部分词知识源自从生语料库中自动获得的汉字Bigram .在字间互信息和t 测试差的基础上 ,提出了一种将两者线性叠加的新的统...
探讨了基于无指导学习策略和无词表条件下的汉语自动分词方法 ,以期对研制开放环境下健壮的分词系统有所裨益 .全部分词知识源自从生语料库中自动获得的汉字Bigram .在字间互信息和t 测试差的基础上 ,提出了一种将两者线性叠加的新的统计量md ,并引入了峰和谷的概念 ,进而设计了相应的分词算法 .大规模开放测试结果显示 ,该算法关于字间位置的分词正确率为 85 .88% ,较单独使用互信息或t 测试差分别提高了 2 4 7%和 5 6 6 % .
展开更多
关键词
无指导学习
汉语自动分词
汉字Bigram
互信息
t-测试差
线性叠加
统计量
中文信息处理应用系统
下载PDF
职称材料
无指导学习语义优选
被引量:
1
2
作者
李东明
张丽娟
+1 位作者
赵伟
石晶
《计算机应用与软件》
CSCD
北大核心
2012年第1期155-158,216,共5页
给出基于LSC模型的EM方法进行汉语语义优选的学习。具体步骤是首先随机为参数模型赋予初值;然后迭代运行EM算法,直到收敛;最后计算动词和名词的语义关联度,以此衡量其搭配的可能性。大量实验结果表明LSC模型能够较好地体现动、名词的搭...
给出基于LSC模型的EM方法进行汉语语义优选的学习。具体步骤是首先随机为参数模型赋予初值;然后迭代运行EM算法,直到收敛;最后计算动词和名词的语义关联度,以此衡量其搭配的可能性。大量实验结果表明LSC模型能够较好地体现动、名词的搭配模式,且算法迭代收敛速度快。该方法无需语法标注的语料库,适合应用于汉语。
展开更多
关键词
语义优选
潜在语义聚类
无指导学习
下载PDF
职称材料
基于无指导学习的微博评论分析方法
被引量:
3
3
作者
徐帅帅
戴新宇
+1 位作者
黄书剑
陈家骏
《中文信息学报》
CSCD
北大核心
2017年第2期179-186,共8页
该文以一种有效的方法寻找出有价值的微博评论,这对于读者更高效地阅读评论,为舆情分析、文本挖掘等任务提供支持,均具有重要的应用价值。针对微博及其评论文本短小、内容发散等特点,该文提出一种基于无指导学习的微博评论分析方法,该...
该文以一种有效的方法寻找出有价值的微博评论,这对于读者更高效地阅读评论,为舆情分析、文本挖掘等任务提供支持,均具有重要的应用价值。针对微博及其评论文本短小、内容发散等特点,该文提出一种基于无指导学习的微博评论分析方法,该方法通过互联网搜索引擎扩展微博文本,基于相关性计算自动构造正负训练用例,生成特定的某条微博评论分类模型,通过该模型对评论的价值性进行评估。实验结果表明,该方法能够比较好地识别出评论的价值。
展开更多
关键词
微博评论
价值性
无指导学习
评论过滤
下载PDF
职称材料
无指导学习环境下基于属性相关性分析和聚类算法的属性选择问题研究
被引量:
2
4
作者
朱佳贤
《管理学报》
2005年第S2期162-165,共4页
属性选择可以有效地降低特征维度,去除不相关属性,提高模型准确率以及增加模型的可解释程度。但是,无指导学习环境下的属性选择往往无法取得像有指导学习环境下那样令人满意的结果。先对无指导学习环境下的属性选择研究的现状进行阐述,...
属性选择可以有效地降低特征维度,去除不相关属性,提高模型准确率以及增加模型的可解释程度。但是,无指导学习环境下的属性选择往往无法取得像有指导学习环境下那样令人满意的结果。先对无指导学习环境下的属性选择研究的现状进行阐述,然后介绍一种新方法———无指导学习环境下基于属性相关性分析和聚类算法的属性选择方法,并且通过实验来验证其有效性和实用性。
展开更多
关键词
属性选择
无指导学习
属性相关性分析
聚类分析
下载PDF
职称材料
基于无指导机器学习的全文词义自动标注方法
被引量:
2
5
作者
卢志茂
刘挺
李生
《自动化学报》
EI
CSCD
北大核心
2006年第2期228-236,共9页
为实现汉语全文词义自动标注,本文采用了一种新的基于无指导机器学习策略的词义标注方法.实验中建立了四个词义排歧模型,并对其测试结果进行了比较.其中实验效果最优的词义排歧模型融合了两种无指导的机器学习策略,并借助依存文法分...
为实现汉语全文词义自动标注,本文采用了一种新的基于无指导机器学习策略的词义标注方法.实验中建立了四个词义排歧模型,并对其测试结果进行了比较.其中实验效果最优的词义排歧模型融合了两种无指导的机器学习策略,并借助依存文法分析手段对上下文特征词进行选择.最终确定的词义标注方法可以使用大规模语料对模型进行训练,较好的解决了数据稀疏问题,并且该方法具有标注正确率高、扩展性能好等优点,适合大规模文本的词义标注工作.
展开更多
关键词
词义标注
无指导学习
算法
单纯贝叶斯模型
依存文法
下载PDF
职称材料
基于卷积树核的无指导中文实体关系抽取研究
被引量:
12
6
作者
黄晨
钱龙华
+1 位作者
周国栋
朱巧明
《中文信息学报》
CSCD
北大核心
2010年第4期11-17,共7页
该文提出了一种基于卷积树核的无指导中文实体关系抽取方法。该方法以最短路径包含树作为关系实例的结构化表示形式,以卷积树核函数作为树相似度计算方法,并采用分层聚类方法进行无指导中文实体关系抽取。在ACE RDC 2005中文基准语料库...
该文提出了一种基于卷积树核的无指导中文实体关系抽取方法。该方法以最短路径包含树作为关系实例的结构化表示形式,以卷积树核函数作为树相似度计算方法,并采用分层聚类方法进行无指导中文实体关系抽取。在ACE RDC 2005中文基准语料库上的无指导关系抽取实验表明,采用该方法的F值最高可达到60.1,这说明基于卷积树核的无指导中文实体关系抽取是行之有效的。
展开更多
关键词
计算机应用
中文信息处理
实体关系抽取
卷积树核
无指导学习
层次聚类
下载PDF
职称材料
机器学习及其相关算法综述
被引量:
78
7
作者
陈凯
朱钰
《统计与信息论坛》
2007年第5期105-112,共8页
自从计算机被发明以来,人们就想知道它能不能学习。机器学习从本质上是一个多学科的领域。它吸取了人工智能、概率统计、计算复杂性理论、控制论、信息论、哲学、生理学、神经生物学等学科的成果。文章主要从统计学习基础的角度对机器...
自从计算机被发明以来,人们就想知道它能不能学习。机器学习从本质上是一个多学科的领域。它吸取了人工智能、概率统计、计算复杂性理论、控制论、信息论、哲学、生理学、神经生物学等学科的成果。文章主要从统计学习基础的角度对机器学习的发展历程以及一些相关的常用算法进行了简要的回顾和介绍。
展开更多
关键词
机器
学习
有
指导
学习
无指导学习
半
指导
学习
下载PDF
职称材料
一种改进的汉语全文无指导词义消歧方法
被引量:
6
8
作者
李旭
刘国华
张东明
《自动化学报》
EI
CSCD
北大核心
2010年第1期184-187,共4页
针对现存的基于EM(Expectation maximization)迭代的无指导词义消歧方法收敛缓慢、计算量大的问题,利用互信息和Z-测试结合的方法选取特征,并通过一种统计学习算法估算初始参数值.实验结果表明改进方法有效地提高了汉语词义消歧的准确率...
针对现存的基于EM(Expectation maximization)迭代的无指导词义消歧方法收敛缓慢、计算量大的问题,利用互信息和Z-测试结合的方法选取特征,并通过一种统计学习算法估算初始参数值.实验结果表明改进方法有效地提高了汉语词义消歧的准确率,具有良好的扩展性和实用性.
展开更多
关键词
词义消歧
无指导学习
特征提取
参数估计
下载PDF
职称材料
基于非参数贝叶斯模型和深度学习的古文分词研究
被引量:
14
9
作者
俞敬松
魏一
+1 位作者
张永伟
杨浩
《中文信息学报》
CSCD
北大核心
2020年第6期1-8,共8页
古汉语文本中,汉字通常连续书写,词与词之间没有明显的分割标记,为现代人理解古文乃至文化传承带来许多障碍。自动分词是自然语言处理技术的基础任务之一。主流的自动分词方法需要大量人工分词语料训练,费时费力,古文分词语料获取尤其困...
古汉语文本中,汉字通常连续书写,词与词之间没有明显的分割标记,为现代人理解古文乃至文化传承带来许多障碍。自动分词是自然语言处理技术的基础任务之一。主流的自动分词方法需要大量人工分词语料训练,费时费力,古文分词语料获取尤其困难,限制了主流自动分词方法的应用。该文将非参数贝叶斯模型与BERT(Bidirectional Encoder Representations from Transformers)深度学习语言建模方法相结合,进行古文分词研究。在《左传》数据集上,该文提出的无监督多阶段迭代训练分词方法获得的F1值为93.28%;仅使用500句分词语料进行弱监督训练时,F1值可达95.55%,高于前人使用6/7语料(约36 000句)进行有监督训练的结果;使用相同规模训练语料时,该文方法获得的F1值为97.40%,为当前最优结果。此外,该文方法还具有较好的泛化能力,模型代码已开源发布。
展开更多
关键词
古文分词
非参数贝叶斯模型
深度
学习
无指导学习
弱
指导
学习
下载PDF
职称材料
基于依存分析和贝叶斯网络的无指导汉语词义消歧
被引量:
3
10
作者
卢志茂
刘挺
+1 位作者
丁江伟
李生
《高技术通讯》
EI
CAS
CSCD
2004年第2期7-11,共5页
采用基于依存分析改进贝叶斯网络的无指导的机器学习方法对汉语大规模真实文本进行词义消歧实验。该学习算法充分利用依存文法分析确定能够对词语词义构成内在限制的上下文,有效地克服了简单贝叶斯分类器中无关上下文造成的噪声影响。...
采用基于依存分析改进贝叶斯网络的无指导的机器学习方法对汉语大规模真实文本进行词义消歧实验。该学习算法充分利用依存文法分析确定能够对词语词义构成内在限制的上下文,有效地克服了简单贝叶斯分类器中无关上下文造成的噪声影响。实验结果证明基于依存改进的贝叶斯模型在汉语词义消歧上表现良好,开放测试正确率可达86.27%。
展开更多
关键词
词义消歧
自然语言处理
无指导学习
算法
依存文法分析
简单贝叶斯网络
汉语
下载PDF
职称材料
基于ART网络的无指导中文共指消解方法
11
作者
李世奇
赵铁军
+1 位作者
陈晨
刘鹏远
《高技术通讯》
EI
CAS
CSCD
北大核心
2009年第9期926-932,共7页
提出了一种基于自适应谐振理论(ART)网络的无指导中文名词短语共指消解方法。该方法充分利用名词短语自身特征,通过改变网络参数动态调节聚类数量,有效地解决了目前聚类共指消解中输出类别数目难以确定的难题。另外采用了一种基于信息...
提出了一种基于自适应谐振理论(ART)网络的无指导中文名词短语共指消解方法。该方法充分利用名词短语自身特征,通过改变网络参数动态调节聚类数量,有效地解决了目前聚类共指消解中输出类别数目难以确定的难题。另外采用了一种基于信息增益率的特征选择方法,减少了区分度较弱特征给聚类所带来的干扰。该方法在保证了识别正确率的前提下,不依赖人工标注语料,可直接应用于跨领域的真实文本。最后在ACE中文语料上进行了相关实验,并取得了较好的结果。
展开更多
关键词
共指消解
无指导学习
自适应谐振理论(ART)
自然语言处理
下载PDF
职称材料
类别学习的SUSTA IN模型
12
作者
姜子云
肖慧
邓铸
《应用心理学》
CSSCI
2006年第1期77-83,共7页
SUSTAIN模型是关于类别学习的类群或群集规则的选择模型,它强调多层次的类别子结构和模型的结构搜索功能。模型的运行以类别相似性为基础,从最简单的规则开始,有灵活的参数及其运算过程,与其他主要的类别学习模型相比有更多的优势。因此...
SUSTAIN模型是关于类别学习的类群或群集规则的选择模型,它强调多层次的类别子结构和模型的结构搜索功能。模型的运行以类别相似性为基础,从最简单的规则开始,有灵活的参数及其运算过程,与其他主要的类别学习模型相比有更多的优势。因此,SUSTAIN模型是迄今解释人类类别学习的最优模型。
展开更多
关键词
SUSTAIN模型
类别
学习
群集规则
有/
无指导学习
下载PDF
职称材料
无指导的中医证候诊断数据的隐变量分析
被引量:
5
13
作者
王喆宇
贾振华
+1 位作者
吴以岭
耿直
《数理统计与管理》
CSSCI
北大核心
2008年第5期938-944,共7页
本文探讨中医临床诊断得到的"望"、"闻"、"问"、"切"的四诊数据的统计分析方法。在没有中医专家的证候诊断结果(即无指导)的情况下,利用含隐变量的结构方程模型(SEMs),进行中医证候诊断的方法...
本文探讨中医临床诊断得到的"望"、"闻"、"问"、"切"的四诊数据的统计分析方法。在没有中医专家的证候诊断结果(即无指导)的情况下,利用含隐变量的结构方程模型(SEMs),进行中医证候诊断的方法。本文提出证候诊断和病势诊断的两层隐结构模型和两步估计方法.本研究收集了433例脑动脉硬化症患者的临床诊断数据,利用本文提出的方法进行数据分析,得到了与传统中医诊断理论相当吻合的结果.在没有中医专家诊断指导的情况下,本文提出的无指导诊断方法为客观评价中医辨证理论提供了数据分析基础.
展开更多
关键词
结构方程模型
隐变量
中医
证候诊断
无指导学习
下载PDF
职称材料
一种基于无指导的词义排歧方法
14
作者
张宝剑
《河南职业技术师范学院学报》
2002年第1期53-54,57,共3页
介绍了一种利用《同义词词林》和训练语料生成义类代码同现频率矩阵 ,以此作为资源进行真实语料中多义词的词义排歧。由于该方法采用无指导的学习方法 ,可以免除人工标注的开支 。
关键词
词义排歧
义类代码
同义词词林
同现频率矩阵
无指导学习
方法
计算机自然语言处理
人工智能
下载PDF
职称材料
一个全文词义自动标注系统的实现
被引量:
3
15
作者
刘挺
卢志茂
李生
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2005年第12期1603-1605,1649,共4页
为研究在给定上下文中如何确定多义词的词义,介绍了一种无指导的词义消歧技术和一个汉语全文词义标注系统的设计实现过程.该系统基于贝叶斯模型,使用大规模语料进行训练,较好地解决了知识获取中数据稀疏的问题.该系统具有标注正确率高...
为研究在给定上下文中如何确定多义词的词义,介绍了一种无指导的词义消歧技术和一个汉语全文词义标注系统的设计实现过程.该系统基于贝叶斯模型,使用大规模语料进行训练,较好地解决了知识获取中数据稀疏的问题.该系统具有标注正确率高和运行速度快等特点,适合大规模文本的词义标注工作.
展开更多
关键词
词义
梢歧
自然语言处理
无指导学习
算法
贝叶斯模型
依存文法
下载PDF
职称材料
Web应用安全监测系统设计与应用
被引量:
6
16
作者
高国柱
吴海燕
《计算机工程与设计》
CSCD
北大核心
2010年第17期3760-3762,3811,共4页
针对Web应用的攻击种类繁多、变化多样,基于静态规则库的旧的防护体系已经很难适应当前Web应用安全的新状况,提出了将无指导学习方法与合法规则检测模型相结合的Web应用安全防护新思路,设计了基于Web应用结构分析和流程分析的安全监测算...
针对Web应用的攻击种类繁多、变化多样,基于静态规则库的旧的防护体系已经很难适应当前Web应用安全的新状况,提出了将无指导学习方法与合法规则检测模型相结合的Web应用安全防护新思路,设计了基于Web应用结构分析和流程分析的安全监测算法,并进行了系统实现。实现的Web应用安全监测系统现已应用于清华大学网络学堂,很好地实现了对Web应用访问请求信息的安全分析与监测。
展开更多
关键词
WEB应用安全
Web应用安全监测
Web日志安全分析
无指导学习
合法规则监测
下载PDF
职称材料
基于数据挖掘的网络入侵检测系统研究
被引量:
8
17
作者
刘晓亮
李家滨
《计算机应用与软件》
CSCD
2009年第4期253-256,共4页
针对传统入侵检测系统建模与更新需要大量人工参与,提出一种基于数据挖掘的无指导自适应入侵检测系统。系统通过有效结合聚类、关联规则数据挖掘方法,自动进行检测规则的提取。经实验表明,提出的方法具有较好的检测率、误报率。
关键词
异常检测
无指导学习
规则提取
数据挖掘
下载PDF
职称材料
共指消解研究方法综述
被引量:
9
18
作者
宋洋
王厚峰
《中文信息学报》
CSCD
北大核心
2015年第1期1-12,共12页
共指消解作为自然语言处理中的一个重要问题一直受到学术界的重视。二十多年来,基于规则的和基于统计的不同方法被提出,在一定程度上推进了该问题研究的发展,并取得了大量研究成果。该文首先介绍了共指消解问题的基本概念,并采用形式化...
共指消解作为自然语言处理中的一个重要问题一直受到学术界的重视。二十多年来,基于规则的和基于统计的不同方法被提出,在一定程度上推进了该问题研究的发展,并取得了大量研究成果。该文首先介绍了共指消解问题的基本概念,并采用形式化的方法对该问题做了描述;然后,针对国内外近年来在共指消解研究中的方法进行了总结;之后,对共指消解中重要的特征问题进行了分析与讨论;最后,历数了共指消解的各种国际评测,并对未来可能的研究方向进行了展望。
展开更多
关键词
共指消解
指代消解
有
指导
学习
无指导学习
下载PDF
职称材料
入侵检测建模过程中特征提取最优化评估
被引量:
2
19
作者
胡威
李建华
陈波
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第12期150-151,168,共3页
在入侵检测建模过程中,特征提取是一个重要的步骤。特征提取有利于提高入侵检测的效率和准确性,好的特征可以在特征空间提供完美的分类独立性。但在以往的入侵检测模型评估中,对原始数据的特征提取并没有涉及提取的标准和原则。文章利用...
在入侵检测建模过程中,特征提取是一个重要的步骤。特征提取有利于提高入侵检测的效率和准确性,好的特征可以在特征空间提供完美的分类独立性。但在以往的入侵检测模型评估中,对原始数据的特征提取并没有涉及提取的标准和原则。文章利用KDD数据集,针对不同种类的网络入侵攻击,使用经典聚类算法对特征提取的特征类别进行比较,以获取该领域的知识。
展开更多
关键词
特征提取
聚类算法
异常检测
无指导学习
下载PDF
职称材料
基于新型的竞争型神经网络的Web日志挖掘
被引量:
4
20
作者
董一鸿
庄越挺
《计算机研究与发展》
EI
CSCD
北大核心
2003年第5期661-667,共7页
提出了一种基于竞争的自激励神经网络学习算法SIN ,该算法综合了自适应谐振理论和竞争型神经网络的特点 ,并在隐含层采用了Hebb学习规则 ,既能保证原有记忆不受影响 ,又能对新的信息加以记忆 ,同时又克服了ART网络对噪音敏感的缺点 ,学...
提出了一种基于竞争的自激励神经网络学习算法SIN ,该算法综合了自适应谐振理论和竞争型神经网络的特点 ,并在隐含层采用了Hebb学习规则 ,既能保证原有记忆不受影响 ,又能对新的信息加以记忆 ,同时又克服了ART网络对噪音敏感的缺点 ,学习速度快 ,分类性能好 ,具有在线学习的功能 将该算法应用于Web日志挖掘能够有效地剔除噪音 ,得到很好的用户聚类和页面聚类的结果 。
展开更多
关键词
神经网络
聚类
WEB挖掘
无指导学习
下载PDF
职称材料
题名
基于无指导学习策略的无词表条件下的汉语自动分词
被引量:
37
1
作者
孙茂松
肖明
邹嘉彦
机构
清华大学智能技术与系统国家重点实验室
香港城市大学语言资讯科学研究中心
出处
《计算机学报》
EI
CSCD
北大核心
2004年第6期736-742,共7页
基金
国家自然科学基金 ( 60 0 83 0 0 5 )资助
文摘
探讨了基于无指导学习策略和无词表条件下的汉语自动分词方法 ,以期对研制开放环境下健壮的分词系统有所裨益 .全部分词知识源自从生语料库中自动获得的汉字Bigram .在字间互信息和t 测试差的基础上 ,提出了一种将两者线性叠加的新的统计量md ,并引入了峰和谷的概念 ,进而设计了相应的分词算法 .大规模开放测试结果显示 ,该算法关于字间位置的分词正确率为 85 .88% ,较单独使用互信息或t 测试差分别提高了 2 4 7%和 5 6 6 % .
关键词
无指导学习
汉语自动分词
汉字Bigram
互信息
t-测试差
线性叠加
统计量
中文信息处理应用系统
Keywords
Algorithms
Computer applications
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
无指导学习语义优选
被引量:
1
2
作者
李东明
张丽娟
赵伟
石晶
机构
吉林农业大学信息技术学院
长春工业大学计算机科学与工程学院
出处
《计算机应用与软件》
CSCD
北大核心
2012年第1期155-158,216,共5页
基金
吉林省科技发展计划项目青年基金(20100155)
吉林省科研发展计划科技支撑重点项目(20100214)
文摘
给出基于LSC模型的EM方法进行汉语语义优选的学习。具体步骤是首先随机为参数模型赋予初值;然后迭代运行EM算法,直到收敛;最后计算动词和名词的语义关联度,以此衡量其搭配的可能性。大量实验结果表明LSC模型能够较好地体现动、名词的搭配模式,且算法迭代收敛速度快。该方法无需语法标注的语料库,适合应用于汉语。
关键词
语义优选
潜在语义聚类
无指导学习
Keywords
Semantic selectional preferences Latent semantic clustering Unsupervised learning
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于无指导学习的微博评论分析方法
被引量:
3
3
作者
徐帅帅
戴新宇
黄书剑
陈家骏
机构
南京大学计算机软件新技术国家重点实验室
出处
《中文信息学报》
CSCD
北大核心
2017年第2期179-186,共8页
基金
国家自然科学基金(61170181)
江苏省自然科学基金(BK2011192)
国家社会科学基金(11AZD121)
文摘
该文以一种有效的方法寻找出有价值的微博评论,这对于读者更高效地阅读评论,为舆情分析、文本挖掘等任务提供支持,均具有重要的应用价值。针对微博及其评论文本短小、内容发散等特点,该文提出一种基于无指导学习的微博评论分析方法,该方法通过互联网搜索引擎扩展微博文本,基于相关性计算自动构造正负训练用例,生成特定的某条微博评论分类模型,通过该模型对评论的价值性进行评估。实验结果表明,该方法能够比较好地识别出评论的价值。
关键词
微博评论
价值性
无指导学习
评论过滤
Keywords
microblog comment
value
unsupervised
comment filter
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
无指导学习环境下基于属性相关性分析和聚类算法的属性选择问题研究
被引量:
2
4
作者
朱佳贤
机构
上海财经大学信息管理与工程学院
出处
《管理学报》
2005年第S2期162-165,共4页
文摘
属性选择可以有效地降低特征维度,去除不相关属性,提高模型准确率以及增加模型的可解释程度。但是,无指导学习环境下的属性选择往往无法取得像有指导学习环境下那样令人满意的结果。先对无指导学习环境下的属性选择研究的现状进行阐述,然后介绍一种新方法———无指导学习环境下基于属性相关性分析和聚类算法的属性选择方法,并且通过实验来验证其有效性和实用性。
关键词
属性选择
无指导学习
属性相关性分析
聚类分析
Keywords
feature selection
unsupervised learning
attribute correlation analysis
clustering
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于无指导机器学习的全文词义自动标注方法
被引量:
2
5
作者
卢志茂
刘挺
李生
机构
哈尔滨工程大学计算机科学与技术学院
哈尔滨工业大学计算机学院信息检索研究室
出处
《自动化学报》
EI
CSCD
北大核心
2006年第2期228-236,共9页
基金
国家自然科学基金重点项目(60435020)国家自然科学基金项目(60575042
60573072)资助~~
文摘
为实现汉语全文词义自动标注,本文采用了一种新的基于无指导机器学习策略的词义标注方法.实验中建立了四个词义排歧模型,并对其测试结果进行了比较.其中实验效果最优的词义排歧模型融合了两种无指导的机器学习策略,并借助依存文法分析手段对上下文特征词进行选择.最终确定的词义标注方法可以使用大规模语料对模型进行训练,较好的解决了数据稀疏问题,并且该方法具有标注正确率高、扩展性能好等优点,适合大规模文本的词义标注工作.
关键词
词义标注
无指导学习
算法
单纯贝叶斯模型
依存文法
Keywords
Sense tagging, unsupervised learning algorithm, naive Bayesian model, dependency grammar
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于卷积树核的无指导中文实体关系抽取研究
被引量:
12
6
作者
黄晨
钱龙华
周国栋
朱巧明
机构
苏州大学计算机科学与技术学院
张家港广播电视大学
出处
《中文信息学报》
CSCD
北大核心
2010年第4期11-17,共7页
基金
国家自然科学基金资助项目(60873150
60970056
+1 种基金
90920004)
江苏省自然科学基金资助项目(BK2008160)
文摘
该文提出了一种基于卷积树核的无指导中文实体关系抽取方法。该方法以最短路径包含树作为关系实例的结构化表示形式,以卷积树核函数作为树相似度计算方法,并采用分层聚类方法进行无指导中文实体关系抽取。在ACE RDC 2005中文基准语料库上的无指导关系抽取实验表明,采用该方法的F值最高可达到60.1,这说明基于卷积树核的无指导中文实体关系抽取是行之有效的。
关键词
计算机应用
中文信息处理
实体关系抽取
卷积树核
无指导学习
层次聚类
Keywords
computer application
Chinese information processing
entity relation extraction
unsupervised learning
convolution tree kernel
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
机器学习及其相关算法综述
被引量:
78
7
作者
陈凯
朱钰
机构
中国人民大学统计学院
出处
《统计与信息论坛》
2007年第5期105-112,共8页
基金
国家自然科学基金重点项目(10431010)
教育部重点基地重大项目(05JJD910001)
中国人民大学应用统计中心项目
文摘
自从计算机被发明以来,人们就想知道它能不能学习。机器学习从本质上是一个多学科的领域。它吸取了人工智能、概率统计、计算复杂性理论、控制论、信息论、哲学、生理学、神经生物学等学科的成果。文章主要从统计学习基础的角度对机器学习的发展历程以及一些相关的常用算法进行了简要的回顾和介绍。
关键词
机器
学习
有
指导
学习
无指导学习
半
指导
学习
Keywords
machine learning
supervised learning
unsupervised learning
semi - supervised learning
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
一种改进的汉语全文无指导词义消歧方法
被引量:
6
8
作者
李旭
刘国华
张东明
机构
燕山大学信息科学与工程学院
秦皇岛职业技术学院
出处
《自动化学报》
EI
CSCD
北大核心
2010年第1期184-187,共4页
基金
国家自然科学基金(60773100)资助~~
文摘
针对现存的基于EM(Expectation maximization)迭代的无指导词义消歧方法收敛缓慢、计算量大的问题,利用互信息和Z-测试结合的方法选取特征,并通过一种统计学习算法估算初始参数值.实验结果表明改进方法有效地提高了汉语词义消歧的准确率,具有良好的扩展性和实用性.
关键词
词义消歧
无指导学习
特征提取
参数估计
Keywords
Word sense disambiguation, unsupervised learning, feature extraction, parameter estimation
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于非参数贝叶斯模型和深度学习的古文分词研究
被引量:
14
9
作者
俞敬松
魏一
张永伟
杨浩
机构
北京大学软件与微电子学院
中国社会科学院语言研究所
北京大学儒藏编纂与研究中心
出处
《中文信息学报》
CSCD
北大核心
2020年第6期1-8,共8页
基金
国家自然科学基金(61876004)
文摘
古汉语文本中,汉字通常连续书写,词与词之间没有明显的分割标记,为现代人理解古文乃至文化传承带来许多障碍。自动分词是自然语言处理技术的基础任务之一。主流的自动分词方法需要大量人工分词语料训练,费时费力,古文分词语料获取尤其困难,限制了主流自动分词方法的应用。该文将非参数贝叶斯模型与BERT(Bidirectional Encoder Representations from Transformers)深度学习语言建模方法相结合,进行古文分词研究。在《左传》数据集上,该文提出的无监督多阶段迭代训练分词方法获得的F1值为93.28%;仅使用500句分词语料进行弱监督训练时,F1值可达95.55%,高于前人使用6/7语料(约36 000句)进行有监督训练的结果;使用相同规模训练语料时,该文方法获得的F1值为97.40%,为当前最优结果。此外,该文方法还具有较好的泛化能力,模型代码已开源发布。
关键词
古文分词
非参数贝叶斯模型
深度
学习
无指导学习
弱
指导
学习
Keywords
word segmentation for ancient Chinese texts
nonparametric Bayesian models
deep learning
unsupervised learning
weakly supervised learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于依存分析和贝叶斯网络的无指导汉语词义消歧
被引量:
3
10
作者
卢志茂
刘挺
丁江伟
李生
机构
哈尔滨工业大学信息检索研究室
出处
《高技术通讯》
EI
CAS
CSCD
2004年第2期7-11,共5页
文摘
采用基于依存分析改进贝叶斯网络的无指导的机器学习方法对汉语大规模真实文本进行词义消歧实验。该学习算法充分利用依存文法分析确定能够对词语词义构成内在限制的上下文,有效地克服了简单贝叶斯分类器中无关上下文造成的噪声影响。实验结果证明基于依存改进的贝叶斯模型在汉语词义消歧上表现良好,开放测试正确率可达86.27%。
关键词
词义消歧
自然语言处理
无指导学习
算法
依存文法分析
简单贝叶斯网络
汉语
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于ART网络的无指导中文共指消解方法
11
作者
李世奇
赵铁军
陈晨
刘鹏远
机构
哈尔滨工业大学教育部-微软语言语音重点实验室
出处
《高技术通讯》
EI
CAS
CSCD
北大核心
2009年第9期926-932,共7页
基金
国家自然科学基金(60575041)
863计划(2006AA01Z150)资助项目。
文摘
提出了一种基于自适应谐振理论(ART)网络的无指导中文名词短语共指消解方法。该方法充分利用名词短语自身特征,通过改变网络参数动态调节聚类数量,有效地解决了目前聚类共指消解中输出类别数目难以确定的难题。另外采用了一种基于信息增益率的特征选择方法,减少了区分度较弱特征给聚类所带来的干扰。该方法在保证了识别正确率的前提下,不依赖人工标注语料,可直接应用于跨领域的真实文本。最后在ACE中文语料上进行了相关实验,并取得了较好的结果。
关键词
共指消解
无指导学习
自适应谐振理论(ART)
自然语言处理
Keywords
coreference resolution, unsupervised learning, adaptive resonance theory (ART), natural language processing
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
类别学习的SUSTA IN模型
12
作者
姜子云
肖慧
邓铸
机构
南京师范大学教科院
出处
《应用心理学》
CSSCI
2006年第1期77-83,共7页
基金
全国教育科学"十五"规划项目(EBAO030404)成果
江苏省哲社研究基金(04JYB010)资助
文摘
SUSTAIN模型是关于类别学习的类群或群集规则的选择模型,它强调多层次的类别子结构和模型的结构搜索功能。模型的运行以类别相似性为基础,从最简单的规则开始,有灵活的参数及其运算过程,与其他主要的类别学习模型相比有更多的优势。因此,SUSTAIN模型是迄今解释人类类别学习的最优模型。
关键词
SUSTAIN模型
类别
学习
群集规则
有/
无指导学习
Keywords
SUSTAIN model, category learning, supervised and unsupervised learning
分类号
B842.1 [哲学宗教—基础心理学]
下载PDF
职称材料
题名
无指导的中医证候诊断数据的隐变量分析
被引量:
5
13
作者
王喆宇
贾振华
吴以岭
耿直
机构
北京大学数学科学学院
河北以岭医药研究院
出处
《数理统计与管理》
CSSCI
北大核心
2008年第5期938-944,共7页
基金
项目NBRP 2005CB523301的支持
文摘
本文探讨中医临床诊断得到的"望"、"闻"、"问"、"切"的四诊数据的统计分析方法。在没有中医专家的证候诊断结果(即无指导)的情况下,利用含隐变量的结构方程模型(SEMs),进行中医证候诊断的方法。本文提出证候诊断和病势诊断的两层隐结构模型和两步估计方法.本研究收集了433例脑动脉硬化症患者的临床诊断数据,利用本文提出的方法进行数据分析,得到了与传统中医诊断理论相当吻合的结果.在没有中医专家诊断指导的情况下,本文提出的无指导诊断方法为客观评价中医辨证理论提供了数据分析基础.
关键词
结构方程模型
隐变量
中医
证候诊断
无指导学习
Keywords
structural equation models, latent variable, traditional Chinese medicine, medical diagnosis, unsupervised learning
分类号
O212 [理学—概率论与数理统计]
下载PDF
职称材料
题名
一种基于无指导的词义排歧方法
14
作者
张宝剑
机构
河南职技师院计算机科学系
出处
《河南职业技术师范学院学报》
2002年第1期53-54,57,共3页
文摘
介绍了一种利用《同义词词林》和训练语料生成义类代码同现频率矩阵 ,以此作为资源进行真实语料中多义词的词义排歧。由于该方法采用无指导的学习方法 ,可以免除人工标注的开支 。
关键词
词义排歧
义类代码
同义词词林
同现频率矩阵
无指导学习
方法
计算机自然语言处理
人工智能
Keywords
word sense, disambignation, word sense code, co-ocearrence natrix
分类号
TP301.2 [自动化与计算机技术—计算机系统结构]
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
一个全文词义自动标注系统的实现
被引量:
3
15
作者
刘挺
卢志茂
李生
机构
哈尔滨工业大学计算机科学与技术学院
出处
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2005年第12期1603-1605,1649,共4页
基金
国家自然科学基金资助重点项目(60435020)
文摘
为研究在给定上下文中如何确定多义词的词义,介绍了一种无指导的词义消歧技术和一个汉语全文词义标注系统的设计实现过程.该系统基于贝叶斯模型,使用大规模语料进行训练,较好地解决了知识获取中数据稀疏的问题.该系统具有标注正确率高和运行速度快等特点,适合大规模文本的词义标注工作.
关键词
词义
梢歧
自然语言处理
无指导学习
算法
贝叶斯模型
依存文法
Keywords
word sense disambiguation
natural language processing
unsupervised learning algorithm
Nave-Bayesian Model
dependency grammar
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Web应用安全监测系统设计与应用
被引量:
6
16
作者
高国柱
吴海燕
机构
清华大学计算机与信息管理中心
出处
《计算机工程与设计》
CSCD
北大核心
2010年第17期3760-3762,3811,共4页
基金
国家科技支撑计划重点基金项目(2006BAK11B00)
文摘
针对Web应用的攻击种类繁多、变化多样,基于静态规则库的旧的防护体系已经很难适应当前Web应用安全的新状况,提出了将无指导学习方法与合法规则检测模型相结合的Web应用安全防护新思路,设计了基于Web应用结构分析和流程分析的安全监测算法,并进行了系统实现。实现的Web应用安全监测系统现已应用于清华大学网络学堂,很好地实现了对Web应用访问请求信息的安全分析与监测。
关键词
WEB应用安全
Web应用安全监测
Web日志安全分析
无指导学习
合法规则监测
Keywords
web application
web application security
web application security detecting
web log security analysis
unsupervised learning
legal rule detecting
分类号
TP393.09 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于数据挖掘的网络入侵检测系统研究
被引量:
8
17
作者
刘晓亮
李家滨
机构
上海交通大学计算机科学与工程系
广州军区综合训练基地
上海交通大学网络信息中心
出处
《计算机应用与软件》
CSCD
2009年第4期253-256,共4页
文摘
针对传统入侵检测系统建模与更新需要大量人工参与,提出一种基于数据挖掘的无指导自适应入侵检测系统。系统通过有效结合聚类、关联规则数据挖掘方法,自动进行检测规则的提取。经实验表明,提出的方法具有较好的检测率、误报率。
关键词
异常检测
无指导学习
规则提取
数据挖掘
Keywords
Anomaly detection Unsupervised learning Rule extraction Data mining
分类号
TP393.08 [自动化与计算机技术—计算机应用技术]
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
共指消解研究方法综述
被引量:
9
18
作者
宋洋
王厚峰
机构
北京大学计算语言学教育部重点实验室
出处
《中文信息学报》
CSCD
北大核心
2015年第1期1-12,共12页
基金
国家自然科学基金(61370117
61333018)
国家社科重大项目(12&ZD227)
文摘
共指消解作为自然语言处理中的一个重要问题一直受到学术界的重视。二十多年来,基于规则的和基于统计的不同方法被提出,在一定程度上推进了该问题研究的发展,并取得了大量研究成果。该文首先介绍了共指消解问题的基本概念,并采用形式化的方法对该问题做了描述;然后,针对国内外近年来在共指消解研究中的方法进行了总结;之后,对共指消解中重要的特征问题进行了分析与讨论;最后,历数了共指消解的各种国际评测,并对未来可能的研究方向进行了展望。
关键词
共指消解
指代消解
有
指导
学习
无指导学习
Keywords
coreference resolution
anaphora resolution
supervised learning
unsupervised learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
入侵检测建模过程中特征提取最优化评估
被引量:
2
19
作者
胡威
李建华
陈波
机构
上海交通大学电子工程系
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第12期150-151,168,共3页
文摘
在入侵检测建模过程中,特征提取是一个重要的步骤。特征提取有利于提高入侵检测的效率和准确性,好的特征可以在特征空间提供完美的分类独立性。但在以往的入侵检测模型评估中,对原始数据的特征提取并没有涉及提取的标准和原则。文章利用KDD数据集,针对不同种类的网络入侵攻击,使用经典聚类算法对特征提取的特征类别进行比较,以获取该领域的知识。
关键词
特征提取
聚类算法
异常检测
无指导学习
Keywords
Feature selection
Clustering algorithm
Anomaly detection
Unsupervised learning
分类号
TP393.08 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于新型的竞争型神经网络的Web日志挖掘
被引量:
4
20
作者
董一鸿
庄越挺
机构
浙江大学人工智能研究所
出处
《计算机研究与发展》
EI
CSCD
北大核心
2003年第5期661-667,共7页
基金
教育部博士点科研基金项目 (2 0 0 10 3 3 5 0 49)
文摘
提出了一种基于竞争的自激励神经网络学习算法SIN ,该算法综合了自适应谐振理论和竞争型神经网络的特点 ,并在隐含层采用了Hebb学习规则 ,既能保证原有记忆不受影响 ,又能对新的信息加以记忆 ,同时又克服了ART网络对噪音敏感的缺点 ,学习速度快 ,分类性能好 ,具有在线学习的功能 将该算法应用于Web日志挖掘能够有效地剔除噪音 ,得到很好的用户聚类和页面聚类的结果 。
关键词
神经网络
聚类
WEB挖掘
无指导学习
Keywords
neural networks
clustering
web mining
non supervised learning
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于无指导学习策略的无词表条件下的汉语自动分词
孙茂松
肖明
邹嘉彦
《计算机学报》
EI
CSCD
北大核心
2004
37
下载PDF
职称材料
2
无指导学习语义优选
李东明
张丽娟
赵伟
石晶
《计算机应用与软件》
CSCD
北大核心
2012
1
下载PDF
职称材料
3
基于无指导学习的微博评论分析方法
徐帅帅
戴新宇
黄书剑
陈家骏
《中文信息学报》
CSCD
北大核心
2017
3
下载PDF
职称材料
4
无指导学习环境下基于属性相关性分析和聚类算法的属性选择问题研究
朱佳贤
《管理学报》
2005
2
下载PDF
职称材料
5
基于无指导机器学习的全文词义自动标注方法
卢志茂
刘挺
李生
《自动化学报》
EI
CSCD
北大核心
2006
2
下载PDF
职称材料
6
基于卷积树核的无指导中文实体关系抽取研究
黄晨
钱龙华
周国栋
朱巧明
《中文信息学报》
CSCD
北大核心
2010
12
下载PDF
职称材料
7
机器学习及其相关算法综述
陈凯
朱钰
《统计与信息论坛》
2007
78
下载PDF
职称材料
8
一种改进的汉语全文无指导词义消歧方法
李旭
刘国华
张东明
《自动化学报》
EI
CSCD
北大核心
2010
6
下载PDF
职称材料
9
基于非参数贝叶斯模型和深度学习的古文分词研究
俞敬松
魏一
张永伟
杨浩
《中文信息学报》
CSCD
北大核心
2020
14
下载PDF
职称材料
10
基于依存分析和贝叶斯网络的无指导汉语词义消歧
卢志茂
刘挺
丁江伟
李生
《高技术通讯》
EI
CAS
CSCD
2004
3
下载PDF
职称材料
11
基于ART网络的无指导中文共指消解方法
李世奇
赵铁军
陈晨
刘鹏远
《高技术通讯》
EI
CAS
CSCD
北大核心
2009
0
下载PDF
职称材料
12
类别学习的SUSTA IN模型
姜子云
肖慧
邓铸
《应用心理学》
CSSCI
2006
0
下载PDF
职称材料
13
无指导的中医证候诊断数据的隐变量分析
王喆宇
贾振华
吴以岭
耿直
《数理统计与管理》
CSSCI
北大核心
2008
5
下载PDF
职称材料
14
一种基于无指导的词义排歧方法
张宝剑
《河南职业技术师范学院学报》
2002
0
下载PDF
职称材料
15
一个全文词义自动标注系统的实现
刘挺
卢志茂
李生
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2005
3
下载PDF
职称材料
16
Web应用安全监测系统设计与应用
高国柱
吴海燕
《计算机工程与设计》
CSCD
北大核心
2010
6
下载PDF
职称材料
17
基于数据挖掘的网络入侵检测系统研究
刘晓亮
李家滨
《计算机应用与软件》
CSCD
2009
8
下载PDF
职称材料
18
共指消解研究方法综述
宋洋
王厚峰
《中文信息学报》
CSCD
北大核心
2015
9
下载PDF
职称材料
19
入侵检测建模过程中特征提取最优化评估
胡威
李建华
陈波
《计算机工程》
EI
CAS
CSCD
北大核心
2006
2
下载PDF
职称材料
20
基于新型的竞争型神经网络的Web日志挖掘
董一鸿
庄越挺
《计算机研究与发展》
EI
CSCD
北大核心
2003
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部