期刊文献+
共找到41篇文章
< 1 2 3 >
每页显示 20 50 100
无指导的中文开放式实体关系抽取 被引量:48
1
作者 秦兵 刘安安 刘挺 《计算机研究与发展》 EI CSCD 北大核心 2015年第5期1029-1035,共7页
传统的实体关系抽取需要预先定义关系类型体系,然而定义一个全面的实体关系类型体系是很困难的.开放式实体关系抽取技术解决了预先定义关系类型体系的问题,但是在中文上的研究还比较少.提出面向大规模网络文本的无指导开放式中文实体关... 传统的实体关系抽取需要预先定义关系类型体系,然而定义一个全面的实体关系类型体系是很困难的.开放式实体关系抽取技术解决了预先定义关系类型体系的问题,但是在中文上的研究还比较少.提出面向大规模网络文本的无指导开放式中文实体关系抽取方法,首先使用实体之间的距离限制和关系指示词的位置限制获取候选关系三元组;然后采用全局排序和类型排序的方法来挖掘关系指示词;最后使用关系指示词和句式规则对关系三元组进行过滤.在获取大量关系三元组的同时,还保证了80%以上的微观平均准确率. 展开更多
关键词 开放式实体关系抽取 无指导 关系三元组 关系指示词 信息抽取
下载PDF
基于无指导学习策略的无词表条件下的汉语自动分词 被引量:37
2
作者 孙茂松 肖明 邹嘉彦 《计算机学报》 EI CSCD 北大核心 2004年第6期736-742,共7页
探讨了基于无指导学习策略和无词表条件下的汉语自动分词方法 ,以期对研制开放环境下健壮的分词系统有所裨益 .全部分词知识源自从生语料库中自动获得的汉字Bigram .在字间互信息和t 测试差的基础上 ,提出了一种将两者线性叠加的新的统... 探讨了基于无指导学习策略和无词表条件下的汉语自动分词方法 ,以期对研制开放环境下健壮的分词系统有所裨益 .全部分词知识源自从生语料库中自动获得的汉字Bigram .在字间互信息和t 测试差的基础上 ,提出了一种将两者线性叠加的新的统计量md ,并引入了峰和谷的概念 ,进而设计了相应的分词算法 .大规模开放测试结果显示 ,该算法关于字间位置的分词正确率为 85 .88% ,较单独使用互信息或t 测试差分别提高了 2 4 7%和 5 6 6 % . 展开更多
关键词 无指导学习 汉语自动分词 汉字Bigram 互信息 t-测试差 线性叠加 统计量 中文信息处理应用系统
下载PDF
基于卷积树核的无指导中文实体关系抽取研究 被引量:12
3
作者 黄晨 钱龙华 +1 位作者 周国栋 朱巧明 《中文信息学报》 CSCD 北大核心 2010年第4期11-17,共7页
该文提出了一种基于卷积树核的无指导中文实体关系抽取方法。该方法以最短路径包含树作为关系实例的结构化表示形式,以卷积树核函数作为树相似度计算方法,并采用分层聚类方法进行无指导中文实体关系抽取。在ACE RDC 2005中文基准语料库... 该文提出了一种基于卷积树核的无指导中文实体关系抽取方法。该方法以最短路径包含树作为关系实例的结构化表示形式,以卷积树核函数作为树相似度计算方法,并采用分层聚类方法进行无指导中文实体关系抽取。在ACE RDC 2005中文基准语料库上的无指导关系抽取实验表明,采用该方法的F值最高可达到60.1,这说明基于卷积树核的无指导中文实体关系抽取是行之有效的。 展开更多
关键词 计算机应用 中文信息处理 实体关系抽取 卷积树核 无指导学习 层次聚类
下载PDF
一种无指导的隐式篇章关系推理方法研究 被引量:6
4
作者 周小佩 洪宇 +2 位作者 车婷婷 姚建民 朱巧明 《中文信息学报》 CSCD 北大核心 2013年第2期17-25,46,共10页
该文提出一种基于信息检索的无指导方法,用于推理隐式篇章片段之间的语义连接关系,如因果关系、转折关系等。该文基于Google搜索引擎,抽取在句子结构以及语义层面上均与原隐式片段相似的显式片段,通过分析和识别相关显式关系来间接推理... 该文提出一种基于信息检索的无指导方法,用于推理隐式篇章片段之间的语义连接关系,如因果关系、转折关系等。该文基于Google搜索引擎,抽取在句子结构以及语义层面上均与原隐式片段相似的显式片段,通过分析和识别相关显式关系来间接推理隐式关系。主要包括以下三个模块:构建高质量查询关键词并抽取候选显式关系;结合三种隐式关系推理模型(相似度、置信度、关联度),综合考察查询关键词以及候选关系的质量;基于排序学习的方法,统计高质量候选关系中的类别分布以实现最终隐式关系的推理。该文采用Penn Discourse TreeBank 2.0篇章语料库,最终方法精确率达到54.3%,与有指导的方法相比,提高了约14.3%。 展开更多
关键词 隐式篇章关系 无指导 信息检索 PDTB 2 0
下载PDF
一种改进的汉语全文无指导词义消歧方法 被引量:6
5
作者 李旭 刘国华 张东明 《自动化学报》 EI CSCD 北大核心 2010年第1期184-187,共4页
针对现存的基于EM(Expectation maximization)迭代的无指导词义消歧方法收敛缓慢、计算量大的问题,利用互信息和Z-测试结合的方法选取特征,并通过一种统计学习算法估算初始参数值.实验结果表明改进方法有效地提高了汉语词义消歧的准确率... 针对现存的基于EM(Expectation maximization)迭代的无指导词义消歧方法收敛缓慢、计算量大的问题,利用互信息和Z-测试结合的方法选取特征,并通过一种统计学习算法估算初始参数值.实验结果表明改进方法有效地提高了汉语词义消歧的准确率,具有良好的扩展性和实用性. 展开更多
关键词 词义消歧 无指导学习 特征提取 参数估计
下载PDF
基于等价伪译词模型的无指导译文消歧研究 被引量:3
6
作者 刘鹏远 赵铁军 +1 位作者 杨沐昀 李壮 《电子与信息学报》 EI CSCD 北大核心 2008年第7期1690-1694,共5页
该文提出了一种基于等价伪译词进行无指导译文消歧的方法。该方法利用源语言岐义词不同语义下目标语译文的单义同义词集合,定义并构造等价伪译词。利用等价伪译词从目标语语料中自动获取大量已标注语义的目标语实例。由这些实例得到的... 该文提出了一种基于等价伪译词进行无指导译文消歧的方法。该方法利用源语言岐义词不同语义下目标语译文的单义同义词集合,定义并构造等价伪译词。利用等价伪译词从目标语语料中自动获取大量已标注语义的目标语实例。由这些实例得到的目标语语义知识,可直接形成该等价伪译词的语义分类器。利用Hownet可将含目标歧义词的英语实例映射成汉语词集合,然后利用这个语义分类器进行译文消歧。在国际标准语义评测集上进行的测试表明,该方法优于其余两种自动获取已标注语料的系统,且与Senseval-2 ELS上可比较的最好无指导系统的性能相当。 展开更多
关键词 词义消歧 无指导 译文消歧 等价伪译词 目标语
下载PDF
利用语义词典Web挖掘语言模型的无指导译文消歧 被引量:7
7
作者 刘鹏远 赵铁军 《软件学报》 EI CSCD 北大核心 2009年第5期1292-1300,共9页
为了解决困扰词义及译文消歧的数据稀疏及知识获取问题,提出一种基于Web利用n-gram统计语言模型进行消歧的方法.在提出词汇语义与其n-gram语言模型存在对应关系假设的基础上,首先利用Hownet建立中文歧义词的英文译文与知网DEF的对应关... 为了解决困扰词义及译文消歧的数据稀疏及知识获取问题,提出一种基于Web利用n-gram统计语言模型进行消歧的方法.在提出词汇语义与其n-gram语言模型存在对应关系假设的基础上,首先利用Hownet建立中文歧义词的英文译文与知网DEF的对应关系并得到该DEF下的词汇集合,然后通过搜索引擎在Web上搜索,并以此计算不同DEF中词汇n-gram出现的概率,然后进行消歧决策.在国际语义评测SemEval-2007中的Multilingual Chinese English Lexical Sample Task测试集上的测试表明,该方法的Pmar值为55.9%,比其上该任务参评最好的无指导系统性能高出12.8%. 展开更多
关键词 词义消歧 无指导译文消歧 语言模型 WEB挖掘 知识获取
下载PDF
基于依存分析和贝叶斯网络的无指导汉语词义消歧 被引量:3
8
作者 卢志茂 刘挺 +1 位作者 丁江伟 李生 《高技术通讯》 EI CAS CSCD 2004年第2期7-11,共5页
采用基于依存分析改进贝叶斯网络的无指导的机器学习方法对汉语大规模真实文本进行词义消歧实验。该学习算法充分利用依存文法分析确定能够对词语词义构成内在限制的上下文,有效地克服了简单贝叶斯分类器中无关上下文造成的噪声影响。... 采用基于依存分析改进贝叶斯网络的无指导的机器学习方法对汉语大规模真实文本进行词义消歧实验。该学习算法充分利用依存文法分析确定能够对词语词义构成内在限制的上下文,有效地克服了简单贝叶斯分类器中无关上下文造成的噪声影响。实验结果证明基于依存改进的贝叶斯模型在汉语词义消歧上表现良好,开放测试正确率可达86.27%。 展开更多
关键词 词义消歧 自然语言处理 无指导学习算法 依存文法分析 简单贝叶斯网络 汉语
下载PDF
基于无指导离群点检测的网络入侵检测技术 被引量:4
9
作者 黄俊 韩玲莉 陈光平 《小型微型计算机系统》 CSCD 北大核心 2007年第11期2007-2009,共3页
讨论了基于无指导离群点检测的网络入侵检测技术及实现框架.技术方法首先在网络数据包上通过改进的随机森林算法建立了网络服务模型,然后通过确定网络服务模型上的离群点实现网络入侵检测.还通过在KDD'99数据集上对所提出的技术实... 讨论了基于无指导离群点检测的网络入侵检测技术及实现框架.技术方法首先在网络数据包上通过改进的随机森林算法建立了网络服务模型,然后通过确定网络服务模型上的离群点实现网络入侵检测.还通过在KDD'99数据集上对所提出的技术实现入侵检测的实验及结果进行了讨论并与其他无指导异常检测方法进行了比较. 展开更多
关键词 网络入侵检测 随机森林算法 无指导离群点检测 网络服务模型
下载PDF
基于双语词汇Web间接关联的无指导译文消歧 被引量:6
10
作者 刘鹏远 赵铁军 《软件学报》 EI CSCD 北大核心 2010年第4期575-585,共11页
为解决困扰词义消歧及译文消歧任务中存在的数据稀疏及知识获取问题,提出一种利用双语词汇Web间接关联的完全无指导消歧方法.首先做出词汇歧义可由双语词汇的间接关联度决定的假设,为译文消歧提供了一种新的知识.在此基础上,对4种常用... 为解决困扰词义消歧及译文消歧任务中存在的数据稀疏及知识获取问题,提出一种利用双语词汇Web间接关联的完全无指导消歧方法.首先做出词汇歧义可由双语词汇的间接关联度决定的假设,为译文消歧提供了一种新的知识.在此基础上,对4种常用计算间接关联的方法进了改造并定义了双语词汇Web间接关联.随后进行基于Web的词汇消歧知识获取并设计了3种消歧决策方法.最后,在国际语义评测SemEval-2007中的Multilingual Chinese English Lexical Sample Task测试集进行了测试.该方法的Pmar值为44.4%,超过了该评测上最好的无指导系统的结果. 展开更多
关键词 词义消歧 无指导译文消歧 Web间接关联 知识获取
下载PDF
基于无指导机器学习的全文词义自动标注方法 被引量:2
11
作者 卢志茂 刘挺 李生 《自动化学报》 EI CSCD 北大核心 2006年第2期228-236,共9页
为实现汉语全文词义自动标注,本文采用了一种新的基于无指导机器学习策略的词义标注方法.实验中建立了四个词义排歧模型,并对其测试结果进行了比较.其中实验效果最优的词义排歧模型融合了两种无指导的机器学习策略,并借助依存文法分... 为实现汉语全文词义自动标注,本文采用了一种新的基于无指导机器学习策略的词义标注方法.实验中建立了四个词义排歧模型,并对其测试结果进行了比较.其中实验效果最优的词义排歧模型融合了两种无指导的机器学习策略,并借助依存文法分析手段对上下文特征词进行选择.最终确定的词义标注方法可以使用大规模语料对模型进行训练,较好的解决了数据稀疏问题,并且该方法具有标注正确率高、扩展性能好等优点,适合大规模文本的词义标注工作. 展开更多
关键词 词义标注 无指导学习算法 单纯贝叶斯模型 依存文法
下载PDF
基于Web的无指导译文消歧词模型与N-gram模型及对比研究 被引量:3
12
作者 刘鹏远 赵铁军 《电子与信息学报》 EI CSCD 北大核心 2009年第12期2969-2974,共6页
该文提出了基于Web的无指导译文消歧的词模型及N-gram模型方法,并在尽可能相同的条件下进行了比较。两种方法均利用搜索引擎统计不同搜索片段在Web上的Page Count作为主要消歧信息。词模型定义了汉语词汇与英语词汇之间的双语词汇Web相... 该文提出了基于Web的无指导译文消歧的词模型及N-gram模型方法,并在尽可能相同的条件下进行了比较。两种方法均利用搜索引擎统计不同搜索片段在Web上的Page Count作为主要消歧信息。词模型定义了汉语词汇与英语词汇之间的双语词汇Web相关度,根据汉语上下文词汇与英语译文之间的相关度进行消歧;N-gram模型首先假设不同语义下的多义词N-gram序列行为模式不同,从而可对多义词不同语义类下词汇在实例中的N-gram序列进行统计与分析以进行消歧。两个模型的性能均超过了在国际语义评测SemEval2007的task#5上可比较的最好无指导系统。对这两个模型进行试验对比可发现N-gram模型性能优于词模型,也表明组合两类模型的结果有进一步提升消歧性能的潜力。 展开更多
关键词 计算语言学 无指导译文消歧 词模型 N-GRAM模型 PAGE COUNT 双语词汇Web相关度
下载PDF
无指导学习语义优选 被引量:1
13
作者 李东明 张丽娟 +1 位作者 赵伟 石晶 《计算机应用与软件》 CSCD 北大核心 2012年第1期155-158,216,共5页
给出基于LSC模型的EM方法进行汉语语义优选的学习。具体步骤是首先随机为参数模型赋予初值;然后迭代运行EM算法,直到收敛;最后计算动词和名词的语义关联度,以此衡量其搭配的可能性。大量实验结果表明LSC模型能够较好地体现动、名词的搭... 给出基于LSC模型的EM方法进行汉语语义优选的学习。具体步骤是首先随机为参数模型赋予初值;然后迭代运行EM算法,直到收敛;最后计算动词和名词的语义关联度,以此衡量其搭配的可能性。大量实验结果表明LSC模型能够较好地体现动、名词的搭配模式,且算法迭代收敛速度快。该方法无需语法标注的语料库,适合应用于汉语。 展开更多
关键词 语义优选 潜在语义聚类 无指导学习
下载PDF
基于ART网络的无指导中文共指消解方法
14
作者 李世奇 赵铁军 +1 位作者 陈晨 刘鹏远 《高技术通讯》 EI CAS CSCD 北大核心 2009年第9期926-932,共7页
提出了一种基于自适应谐振理论(ART)网络的无指导中文名词短语共指消解方法。该方法充分利用名词短语自身特征,通过改变网络参数动态调节聚类数量,有效地解决了目前聚类共指消解中输出类别数目难以确定的难题。另外采用了一种基于信息... 提出了一种基于自适应谐振理论(ART)网络的无指导中文名词短语共指消解方法。该方法充分利用名词短语自身特征,通过改变网络参数动态调节聚类数量,有效地解决了目前聚类共指消解中输出类别数目难以确定的难题。另外采用了一种基于信息增益率的特征选择方法,减少了区分度较弱特征给聚类所带来的干扰。该方法在保证了识别正确率的前提下,不依赖人工标注语料,可直接应用于跨领域的真实文本。最后在ACE中文语料上进行了相关实验,并取得了较好的结果。 展开更多
关键词 共指消解 无指导学习 自适应谐振理论(ART) 自然语言处理
下载PDF
基于挖掘Web双语词汇关联度的无指导译文消歧
15
作者 刘鹏远 赵铁军 《高技术通讯》 EI CAS CSCD 北大核心 2010年第4期349-354,共6页
为缓解译文消歧任务中消歧知识获取困难及数据稀疏问题,提出了一种基于Web的挖掘双语词汇相关关系的无指导译文消歧方法。该方法将双语词汇在语料库中的间接相关拓展到Web,提出了基于Web的双语词汇间接相关模型,在此基础上又提出了一种... 为缓解译文消歧任务中消歧知识获取困难及数据稀疏问题,提出了一种基于Web的挖掘双语词汇相关关系的无指导译文消歧方法。该方法将双语词汇在语料库中的间接相关拓展到Web,提出了基于Web的双语词汇间接相关模型,在此基础上又提出了一种基于Web的双语词汇相关度的消歧方法,通过构造不同queries并利用搜索引擎抽取返回页面的page counts,最后利用点式互信息来计算词汇间的相关度并用于消歧决策。该方法最好性能(P_(mar)=0.464)超过了国际语义评测Semeval-2007的Task #5上可比较的最好无指导系统TorMd。 展开更多
关键词 无指导译文消歧 双语词汇相关 页面计数 间接相关 基于WEB
下载PDF
基于无指导学习的微博评论分析方法 被引量:3
16
作者 徐帅帅 戴新宇 +1 位作者 黄书剑 陈家骏 《中文信息学报》 CSCD 北大核心 2017年第2期179-186,共8页
该文以一种有效的方法寻找出有价值的微博评论,这对于读者更高效地阅读评论,为舆情分析、文本挖掘等任务提供支持,均具有重要的应用价值。针对微博及其评论文本短小、内容发散等特点,该文提出一种基于无指导学习的微博评论分析方法,该... 该文以一种有效的方法寻找出有价值的微博评论,这对于读者更高效地阅读评论,为舆情分析、文本挖掘等任务提供支持,均具有重要的应用价值。针对微博及其评论文本短小、内容发散等特点,该文提出一种基于无指导学习的微博评论分析方法,该方法通过互联网搜索引擎扩展微博文本,基于相关性计算自动构造正负训练用例,生成特定的某条微博评论分类模型,通过该模型对评论的价值性进行评估。实验结果表明,该方法能够比较好地识别出评论的价值。 展开更多
关键词 微博评论 价值性 无指导学习 评论过滤
下载PDF
无指导的中医证候诊断数据的隐变量分析 被引量:5
17
作者 王喆宇 贾振华 +1 位作者 吴以岭 耿直 《数理统计与管理》 CSSCI 北大核心 2008年第5期938-944,共7页
本文探讨中医临床诊断得到的"望"、"闻"、"问"、"切"的四诊数据的统计分析方法。在没有中医专家的证候诊断结果(即无指导)的情况下,利用含隐变量的结构方程模型(SEMs),进行中医证候诊断的方法... 本文探讨中医临床诊断得到的"望"、"闻"、"问"、"切"的四诊数据的统计分析方法。在没有中医专家的证候诊断结果(即无指导)的情况下,利用含隐变量的结构方程模型(SEMs),进行中医证候诊断的方法。本文提出证候诊断和病势诊断的两层隐结构模型和两步估计方法.本研究收集了433例脑动脉硬化症患者的临床诊断数据,利用本文提出的方法进行数据分析,得到了与传统中医诊断理论相当吻合的结果.在没有中医专家诊断指导的情况下,本文提出的无指导诊断方法为客观评价中医辨证理论提供了数据分析基础. 展开更多
关键词 结构方程模型 隐变量 中医 证候诊断 无指导学习
下载PDF
HDP与互信息相结合的中文无指导分词 被引量:2
18
作者 曹自强 李素建 《中文信息学报》 CSCD 北大核心 2013年第6期1-5,44,共6页
该文探讨了无指导条件下的中文分词,这对构建语言无关的健壮分词系统大有裨益。互信息与HDP(Hierarchical Dirichlet Process)是无指导情况下常用的分词模型,该文将两者结合,并改进了采样算法。不考虑标点符号,在两份大小不同的测试语... 该文探讨了无指导条件下的中文分词,这对构建语言无关的健壮分词系统大有裨益。互信息与HDP(Hierarchical Dirichlet Process)是无指导情况下常用的分词模型,该文将两者结合,并改进了采样算法。不考虑标点符号,在两份大小不同的测试语料上获得的F值为0.693与0.741,相比baseline的HDP分别提升了5.8%和3.9%。该文还用该模型进行了半指导分词,实验结果比常用的CRF有指导分词提升了2.6%。 展开更多
关键词 HDP 互信息 无指导分词
下载PDF
无指导学习环境下基于属性相关性分析和聚类算法的属性选择问题研究 被引量:2
19
作者 朱佳贤 《管理学报》 2005年第S2期162-165,共4页
属性选择可以有效地降低特征维度,去除不相关属性,提高模型准确率以及增加模型的可解释程度。但是,无指导学习环境下的属性选择往往无法取得像有指导学习环境下那样令人满意的结果。先对无指导学习环境下的属性选择研究的现状进行阐述,... 属性选择可以有效地降低特征维度,去除不相关属性,提高模型准确率以及增加模型的可解释程度。但是,无指导学习环境下的属性选择往往无法取得像有指导学习环境下那样令人满意的结果。先对无指导学习环境下的属性选择研究的现状进行阐述,然后介绍一种新方法———无指导学习环境下基于属性相关性分析和聚类算法的属性选择方法,并且通过实验来验证其有效性和实用性。 展开更多
关键词 属性选择 无指导学习 属性相关性分析 聚类分析
下载PDF
无指导聚类在信用卡促销中的应用 被引量:1
20
作者 汤秋菊 李义杰 《计算机与现代化》 2007年第9期100-102,共3页
当前,数据挖掘技术已经应用到社会的各个领域,包括电信业、金融业、医疗卫生、自然科学等。本文介绍了数据挖掘的两种主要策略:有指导的学习和无指导的聚类。并通过信用卡促销数据集来解释无指导聚类的过程,挖掘结果对于信用卡促销... 当前,数据挖掘技术已经应用到社会的各个领域,包括电信业、金融业、医疗卫生、自然科学等。本文介绍了数据挖掘的两种主要策略:有指导的学习和无指导的聚类。并通过信用卡促销数据集来解释无指导聚类的过程,挖掘结果对于信用卡促销活动具有很大的指导意义。 展开更多
关键词 数据挖掘 无指导聚类 信用卡促销
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部