期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
Model Change Active Learning in Graph-Based Semi-supervised Learning
1
作者 Kevin S.Miller Andrea L.Bertozzi 《Communications on Applied Mathematics and Computation》 EI 2024年第2期1270-1298,共29页
Active learning in semi-supervised classification involves introducing additional labels for unlabelled data to improve the accuracy of the underlying classifier.A challenge is to identify which points to label to bes... Active learning in semi-supervised classification involves introducing additional labels for unlabelled data to improve the accuracy of the underlying classifier.A challenge is to identify which points to label to best improve performance while limiting the number of new labels."Model Change"active learning quantifies the resulting change incurred in the classifier by introducing the additional label(s).We pair this idea with graph-based semi-supervised learning(SSL)methods,that use the spectrum of the graph Laplacian matrix,which can be truncated to avoid prohibitively large computational and storage costs.We consider a family of convex loss functions for which the acquisition function can be efficiently approximated using the Laplace approximation of the posterior distribution.We show a variety of multiclass examples that illustrate improved performance over prior state-of-art. 展开更多
关键词 Active learning Graph-based methods semi-supervised learning(SSL) Graph Laplacian
下载PDF
Semi-supervised kernel FCM algorithm for remote sensing image classification
2
作者 刘小芳 HeBinbin LiXiaowen 《High Technology Letters》 EI CAS 2011年第4期427-432,共6页
These problems of nonlinearity, fuzziness and few labeled data were rarely considered in traditional remote sensing image classification. A semi-supervised kernel fuzzy C-means (SSKFCM) algorithm is proposed to over... These problems of nonlinearity, fuzziness and few labeled data were rarely considered in traditional remote sensing image classification. A semi-supervised kernel fuzzy C-means (SSKFCM) algorithm is proposed to overcome these disadvantages of remote sensing image classification in this paper. The SSKFCM algorithm is achieved by introducing a kernel method and semi-supervised learning technique into the standard fuzzy C-means (FCM) algorithm. A set of Beijing-1 micro-satellite's multispectral images are adopted to be classified by several algorithms, such as FCM, kernel FCM (KFCM), semi-supervised FCM (SSFCM) and SSKFCM. The classification results are estimated by corresponding indexes. The results indicate that the SSKFCM algorithm significantly improves the classification accuracy of remote sensing images compared with the others. 展开更多
关键词 remote sensing image classification semi-supervised kernel fuzzy C-means (SSKFCM)algorithm Beijing-1 micro-satellite semi-supcrvisod learning tochnique kernel method
下载PDF
数字图像混沌序列抽样加权强置乱算法仿真
3
作者 贺国平 张国荣 《计算机仿真》 2024年第10期192-195,350,共5页
数字图像置乱关系到个人隐私和信息安全问题,为了保护图像中的敏感信息,提出一种基于位交换和混沌优化的数字图像置乱算法。使用散列函数获得数字图像明文的密钥流,采用与明文相关的子密钥推导像素初始值,通过非线性交叉生成位交换算子... 数字图像置乱关系到个人隐私和信息安全问题,为了保护图像中的敏感信息,提出一种基于位交换和混沌优化的数字图像置乱算法。使用散列函数获得数字图像明文的密钥流,采用与明文相关的子密钥推导像素初始值,通过非线性交叉生成位交换算子,增强明文信息敏感性;运用Logistic方程得到混沌序列,引入抽样加权方法提高图像置乱强度,采用混合蛙跳方法按照族群划分实施信息传输,将混沌序列内的实数从小到大排列,初始混沌抽样后构成的混沌序列用于图像中,显著提升图像置乱强度,完成数字图像置乱。仿真结果表明,上述方法拥有极高的安全性和优秀的加密性能,可以为数字图像在各领域的安全使用提供可靠借鉴。 展开更多
关键词 位交换 混沌优化 数字图像 置乱算法 敏感性增强 混合蛙跳方法
下载PDF
汉语拼音输入中韵律边界等级对相邻字母输入时间间隔的影响
4
作者 柳韦任 连湘怡 +1 位作者 庄想灵 马国杰 《应用心理学》 2024年第4期357-364,共8页
由于同音字多,拼音输入不区分音调,导致拼音字母到汉字的转化并不唯一,从而降低了拼音输入法的输入效率。本研究基于汉语输入中的心理运动过程,探讨韵律边界对拼音字母输入时间间隔的影响。为此,我们分别采用自然篇章和歧义拼音字符串... 由于同音字多,拼音输入不区分音调,导致拼音字母到汉字的转化并不唯一,从而降低了拼音输入法的输入效率。本研究基于汉语输入中的心理运动过程,探讨韵律边界对拼音字母输入时间间隔的影响。为此,我们分别采用自然篇章和歧义拼音字符串进行了两个实验,让被试以全拼方式输入指定汉语文本对应的拼音,记录相邻拼音字母的输入时间间隔。结果表明,拼音的韵律边界等级影响了拼音字母的输入时间间隔,等级越大,则输入时间间隔越长。 展开更多
关键词 拼音输入 拼音解歧 韵律边界等级 歧义拼音字符串 言语产生
下载PDF
Learning to select pseudo labels: a semi-supervisedmethod for named entity recognition 被引量:2
5
作者 Zhen-zhen LI Da-wei FENG +1 位作者 Dong-sheng LI Xi-cheng LU 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2020年第6期903-916,共14页
Deep learning models have achieved state-of-the-art performance in named entity recognition(NER);the good performance,however,relies heavily on substantial amounts of labeled data.In some specific areas such as medica... Deep learning models have achieved state-of-the-art performance in named entity recognition(NER);the good performance,however,relies heavily on substantial amounts of labeled data.In some specific areas such as medical,financial,and military domains,labeled data is very scarce,while unlabeled data is readily available.Previous studies have used unlabeled data to enrich word representations,but a large amount of entity information in unlabeled data is neglected,which may be beneficial to the NER task.In this study,we propose a semi-supervised method for NER tasks,which learns to create high-quality labeled data by applying a pre-trained module to filter out erroneous pseudo labels.Pseudo labels are automatically generated for unlabeled data and used as if they were true labels.Our semi-supervised framework includes three steps:constructing an optimal single neural model for a specific NER task,learning a module that evaluates pseudo labels,and creating new labeled data and improving the NER model iteratively.Experimental results on two English NER tasks and one Chinese clinical NER task demonstrate that our method further improves the performance of the best single neural model.Even when we use only pre-trained static word embeddings and do not rely on any external knowledge,our method achieves comparable performance to those state-of-the-art models on the CoNLL-2003 and OntoNotes 5.0 English NER tasks. 展开更多
关键词 Named entity recognition Unlabeled data Deep learning semi-supervised method
原文传递
中文微博实体链接研究 被引量:12
6
作者 朱敏 贾真 +3 位作者 左玲 吴安峻 陈方正 柏玉 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期73-78,共6页
针对2013年CCF自然语言处理与中文计算会议(NLP&CC2013)中文微博实体链接的任务,使用CCF提供的新浪微博数据作为训练和测试数据,利用西南交通大学耶宝智慧中文分词平台作为自然语言预处理工具,提出一种实体链接的方法。该方法应用... 针对2013年CCF自然语言处理与中文计算会议(NLP&CC2013)中文微博实体链接的任务,使用CCF提供的新浪微博数据作为训练和测试数据,利用西南交通大学耶宝智慧中文分词平台作为自然语言预处理工具,提出一种实体链接的方法。该方法应用改进的拼音编辑距离算法和后缀词表匹配法,提出实体聚类消歧与基于百度百科词频的同类实体消歧相结合的消歧方法。在2013年CCF中文微博实体链接评测任务中正确结果的准确率为0.8838,在10个参赛队伍中名列第3位。表明该方法有效并可以适应文本中的噪声。 展开更多
关键词 微博实体链接 改进的拼音编辑距离 后缀词表匹配法 实体消歧
下载PDF
基于多分类器加权投票法的越南语组合歧义消歧 被引量:5
7
作者 李佳 郭剑毅 +3 位作者 刘艳超 余正涛 线岩团 阮氏青娥 《计算机科学》 CSCD 北大核心 2018年第1期167-172,共6页
组合歧义消解是分词中的关键问题之一,直接影响到分词的准确率。为了解决越南语组合歧义对分词的影响问题,结合越南语组合型词的特点,提出了一种基于集成学习的越南语组合歧义消解方法。该方法首先通过人工选取越南语组合歧义词,构建出... 组合歧义消解是分词中的关键问题之一,直接影响到分词的准确率。为了解决越南语组合歧义对分词的影响问题,结合越南语组合型词的特点,提出了一种基于集成学习的越南语组合歧义消解方法。该方法首先通过人工选取越南语组合歧义词,构建出越南语组合歧义字段库,对越南语语料与越南语组合词词典进行匹配,抽取出越南语组合歧义字段;其次,采用三类分类器引入越南语词频特征和上下文信息,构建三类分类器消解模型,得到三类分类器消解结果;最后,计算出各分类器权值,通过阈值对越南语组合歧义进行最终分类。实验表明,所提方法的正确率达到了83.32%,与消歧结果最好的单个分类器相比准确率提高了5.81%。 展开更多
关键词 组合词词典 组合歧义消解 越南语 集成学习 加权投票法
下载PDF
基于双向最大匹配和HMM的分词消歧模型 被引量:9
8
作者 麦范金 王挺 《现代图书情报技术》 CSSCI 北大核心 2008年第8期37-41,共5页
提出一种消减分词切分歧义的模型。利用正向和逆向最大匹配方法对中文文本信息进行分词,基于隐马尔科夫模型对两次最大匹配的分词结果进行对比消歧,得到较为精确的结果。整个过程分为歧义发现、歧义抽取、歧义消除3个过程。测试结果显示... 提出一种消减分词切分歧义的模型。利用正向和逆向最大匹配方法对中文文本信息进行分词,基于隐马尔科夫模型对两次最大匹配的分词结果进行对比消歧,得到较为精确的结果。整个过程分为歧义发现、歧义抽取、歧义消除3个过程。测试结果显示,该模型能有效地降低分词歧义引起的错误切分率。 展开更多
关键词 分词 最大匹配 隐马尔科夫模型 歧义消减
下载PDF
基于义类的无导词义消歧方法的研究 被引量:2
9
作者 全昌勤 何婷婷 +1 位作者 姬东鸿 刘辉 《计算机应用研究》 CSCD 北大核心 2005年第4期39-41,共3页
词义消歧在自然语言处理的许多应用领域都起着十分重要的作用。为了适用于大规模的词义消歧,提出了一种无导的学习方法。基于向量空间模型,结合机读词典和义类词典建立从义项到义类的映射关系,再利用义类知识在语料库中无导学习消歧特征... 词义消歧在自然语言处理的许多应用领域都起着十分重要的作用。为了适用于大规模的词义消歧,提出了一种无导的学习方法。基于向量空间模型,结合机读词典和义类词典建立从义项到义类的映射关系,再利用义类知识在语料库中无导学习消歧特征,最后利用这些特征实现词义消歧。 展开更多
关键词 自然语言处理 词义消歧 无导方法 义类
下载PDF
基于短语匹配的中文分词消歧方法 被引量:6
10
作者 姚继伟 赵东范 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2010年第3期427-432,共6页
在短语结构文法的基础上,提出一种基于局部单一短语匹配和语义规则相结合的消歧方法.通过增加短语间的右嵌套规则和采用有限自动机的实现方式,解决了短语规则中存在冗余项的问题,提高了短语匹配效率和歧义消除类型的针对性.实验结果表明... 在短语结构文法的基础上,提出一种基于局部单一短语匹配和语义规则相结合的消歧方法.通过增加短语间的右嵌套规则和采用有限自动机的实现方式,解决了短语规则中存在冗余项的问题,提高了短语匹配效率和歧义消除类型的针对性.实验结果表明,该消歧方法的平均消歧率约为98%,优于一般未考虑词语间语法和语义消歧模型的处理效果. 展开更多
关键词 中文分词 短语匹配 歧义字段 消歧方法
下载PDF
一种自组织的汉语组合型歧义消歧方法 被引量:3
11
作者 冯素琴 陈惠明 《计算机工程与设计》 CSCD 北大核心 2007年第3期737-739,742,共4页
组合型歧义切分字段一直是汉语自动分词的难点。用人工校验后的分词语料提供的搭配实例作为组合歧义字段的初始搭配知识,提出使用搭配统计表的多元最大对数似然比进行消歧;继而根据实验确定了歧义字段的上下文窗口、窗口位置区分、权值... 组合型歧义切分字段一直是汉语自动分词的难点。用人工校验后的分词语料提供的搭配实例作为组合歧义字段的初始搭配知识,提出使用搭配统计表的多元最大对数似然比进行消歧;继而根据实验确定了歧义字段的上下文窗口、窗口位置区分、权值估计等要素;在此基础上采用自组织方法自动扩充搭配集,使消歧信息趋于稳定;最后,对提出的方法进行了实验,实验表明,该算法能有效提高消歧准确率。 展开更多
关键词 自然语言处理 汉语自动分词 组合型切分歧义 自组织方法 消歧
下载PDF
混合式机器翻译中单词处理的一些技术探讨 被引量:6
12
作者 杨宪泽 肖明 《科技通报》 北大核心 2011年第1期101-104,135,共5页
机器翻译的涉及的技术很多,单词处理是其中的一个重要核心。本文主要介绍单词处理的一些技术,其工作有三部分:第一部分提出最大匹配分词的改进算法;第二部分探讨汉英机器翻译时名词的单复数处理算法;第三部分给出词性兼类处理的一些方法。
关键词 机器翻译 消歧方法 词性兼类 名词的单复数
下载PDF
基于BP神经网络的词义消歧模型 被引量:3
13
作者 谢芳 胡泉 《计算机工程与应用》 CSCD 北大核心 2006年第12期187-189,203,共4页
词义消歧在自然语言处理中一直是一个难点问题,同时,也是很多领域都需要解决的一个重要环节。文章首先介绍了目前一些常用词义消歧方法的特点和这些方法的研究进展,并在此基础上探讨了一种基于BP神经网络和统计方法相结合的有导词义消... 词义消歧在自然语言处理中一直是一个难点问题,同时,也是很多领域都需要解决的一个重要环节。文章首先介绍了目前一些常用词义消歧方法的特点和这些方法的研究进展,并在此基础上探讨了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,最后详细讲解了BP神经网络原理,并对使用这种混合人工智能的消歧模型的可能性和优越性进行了讨论。 展开更多
关键词 词义消歧 基于统计 BP神经网络 语料库
下载PDF
句子语境中歧义动词的歧义消解 被引量:1
14
作者 韩玉昌 于泽 李立洁 《辽宁师范大学学报(社会科学版)》 2009年第6期47-51,共5页
采用眼动记录的方法,考察在中性和偏向句子语境中,动词歧义消解的过程。结果发现,在中性句子语境中,动词歧义词的意义通达是按照相对频率进行的;解歧信息作用于动词歧义词意义通达的晚期,对已激活的意义进行选择和整合。在偏向句子语境... 采用眼动记录的方法,考察在中性和偏向句子语境中,动词歧义消解的过程。结果发现,在中性句子语境中,动词歧义词的意义通达是按照相对频率进行的;解歧信息作用于动词歧义词意义通达的晚期,对已激活的意义进行选择和整合。在偏向句子语境中,解歧信息作用于动词歧义词的意义整合过程,激活歧义词的适当意义,并对动词歧义词不适当的意义产生抑制作用;动词歧义消解的加工是延迟进行的。实验证明,在句子语境中,动词歧义消解的过程支持整合模型。 展开更多
关键词 句子语境 歧义消解 歧义动词 眼动记录技术
下载PDF
利用BP神经网络的中文词义消歧模型 被引量:1
15
作者 何婷婷 谢芳 《华中师范大学学报(自然科学版)》 CAS CSCD 2005年第4期470-474,共5页
词义消歧在自然语言处理中一直是一个难点问题,同时,也是很多领域都需要解决的一个重要环节.本文介绍了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,详细讲解了BP神经网络原理;对使用这种混合人工智能的消歧模型的可能性和... 词义消歧在自然语言处理中一直是一个难点问题,同时,也是很多领域都需要解决的一个重要环节.本文介绍了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,详细讲解了BP神经网络原理;对使用这种混合人工智能的消歧模型的可能性和优越性进行了讨论;通过试验发现实际和预测结果的误差并不随着试验迭代次数而递减,而是实际误差随着次数的增加在零的附近呈现波动状态,即使用很少的迭代次数也可以得到比较好的结果.由此得出,BP神经网络预测模型在词义消歧的中具有良好的应用前景. 展开更多
关键词 词义消歧 基于统计 BP神经网络 语料库
下载PDF
机器翻译的一些消歧方法研究 被引量:1
16
作者 杨宪泽 《西南民族大学学报(自然科学版)》 CAS 2008年第4期782-786,共5页
在机器翻译涉及的技术很多.其中,语言消歧就被列为机器翻译最为急迫解决的问题之一.本文的的工作首先对语言歧义的问题进行分析,然后论述一些具体消歧方法.
关键词 机器翻译 歧义 消歧方法
下载PDF
基于多知识源的汉语词义消歧方法 被引量:2
17
作者 张仰森 黄改娟 《汉语学报》 2008年第2期46-52,共7页
针对已有词义消歧研究方法的不足,分析了多种不同结构知识词典的可计算性及其计算复杂度,选择北大计算语言所的《现代汉语语法信息词典》、《现代汉语语义词典》和已经标注了词义的人民日报语料作为词义消歧知识源,研究异构知识源的知... 针对已有词义消歧研究方法的不足,分析了多种不同结构知识词典的可计算性及其计算复杂度,选择北大计算语言所的《现代汉语语法信息词典》、《现代汉语语义词典》和已经标注了词义的人民日报语料作为词义消歧知识源,研究异构知识源的知识获取与融合方法,并结合统计与规则方法构建词义消歧模型,取得了比较满意的词义消歧实验结果。 展开更多
关键词 多知识源 词义消歧方法 消歧模型
下载PDF
英语句法歧义成因及排歧方法之探讨 被引量:2
18
作者 陈丽娜 《湖南工程学院学报(社会科学版)》 2014年第1期44-47,共4页
歧义是一种普遍的语言现象,英语中就存在很多歧义句。造成歧义的原因很多,有语音、词汇、句法等因素,其中句法歧义是重要组成部分。研究英语句法歧义现象的主要原因,提出相应的排歧方法,对英语教学翻译,和跨文化交际等活动都具有重要作用。
关键词 句法歧义 成因 排歧
下载PDF
论典籍汉英翻译中的歧义消解策略 被引量:1
19
作者 杨晓斌 《中北大学学报(社会科学版)》 2012年第5期71-75,共5页
古代汉语中引发歧义现象的因素较多也较为复杂,主要包括:某些词语可能具有多种不同的含义,特定词语的古今含义存在较大的差别,同形词语的词类活用,不同词语的不定组合以及词序变动导致的误解等。这些歧义现象不仅可能给典籍阅读造成很... 古代汉语中引发歧义现象的因素较多也较为复杂,主要包括:某些词语可能具有多种不同的含义,特定词语的古今含义存在较大的差别,同形词语的词类活用,不同词语的不定组合以及词序变动导致的误解等。这些歧义现象不仅可能给典籍阅读造成很大的障碍,也极有可能给典籍汉英翻译带来相当的困难。在翻译实践中通过精选对应词汇、准确变换词形、灵活重组语序以及增补省略信息等策略可以有效消除歧义,从而确保目的文本表达的准确,并保持典籍原有的神韵。 展开更多
关键词 典籍 汉英翻译 歧义 消解
下载PDF
面向统计词义消歧的核选择研究进展 被引量:1
20
作者 钟莉云 汪廷华 陈峻婷 《赣南师范学院学报》 2015年第6期17-22,共6页
词义消歧解决自然语言中同形异义词语在不同上下文环境中的义项标注问题,是自然语言处理领域的基础性关键问题.核方法是机器学习中一类强有力的统计学习技术,被广泛应用于分类、回归、聚类等诸多领域.基于核方法的词义消歧的关键是如何... 词义消歧解决自然语言中同形异义词语在不同上下文环境中的义项标注问题,是自然语言处理领域的基础性关键问题.核方法是机器学习中一类强有力的统计学习技术,被广泛应用于分类、回归、聚类等诸多领域.基于核方法的词义消歧的关键是如何构造一个能够充分表达待消歧词上下文信息的核函数.在介绍基于核方法的词义消歧系统的一般框架之后,系统阐述了国内外面向统计词义消歧的核函数构造与选择的研究现状及进展,重点分析了研究中存在的问题及解决方法,最后探讨了未来研究的重点与可能的发展方向. 展开更多
关键词 词义消歧 核函数 核方法 自然语言处理 分类
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部