期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
基于信任网的推荐机制 被引量:7
1
作者 苏锦钿 郭荷清 高英 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第4期98-103,共6页
为深入分析信任和声誉模型中推荐机制对推荐链的依赖关系,解决推荐机制无法惩罚恶意推荐实体等问题,结合主观逻辑提出了基于信任网的推荐机制,给出了信任网的基本定义,对信任网中推荐链的依赖关系进行了形式化描述,给出了相应的解决策略... 为深入分析信任和声誉模型中推荐机制对推荐链的依赖关系,解决推荐机制无法惩罚恶意推荐实体等问题,结合主观逻辑提出了基于信任网的推荐机制,给出了信任网的基本定义,对信任网中推荐链的依赖关系进行了形式化描述,给出了相应的解决策略,并利用信任强度解决了主观逻辑中无法对恶意推荐实体进行惩罚的问题,提高了推荐信息的精确度.模拟实验结果表明,基于信任网的推荐机制能在一定程度上减少访问到恶意实体的次数,并惩罚提供恶意推荐的实体. 展开更多
关键词 信任模型 声誉模型 信任网 推荐机制 主观逻辑 恶意推荐
下载PDF
抽象数据类型的双代数结构及其计算 被引量:10
2
作者 苏锦钿 余珊珊 《计算机研究与发展》 EI CSCD 北大核心 2012年第8期1787-1803,共17页
程序语言中的许多抽象数据类型包含了可递归定义的语法构造和可共递归定义的动态行为特征,因此单纯利用代数或共代数难以给出完整的描述.双代数是同一载体集上的代数和共代数对,提供了一种从范畴论的角度探讨抽象数据类型上的语法构造... 程序语言中的许多抽象数据类型包含了可递归定义的语法构造和可共递归定义的动态行为特征,因此单纯利用代数或共代数难以给出完整的描述.双代数是同一载体集上的代数和共代数对,提供了一种从范畴论的角度探讨抽象数据类型上的语法构造和动态行为关系及性质的可行途径.给出抽象数据类型的双代数结构,并利用代数函子对共代数函子的分配律描述了语法构造与动态行为之间的自然转换关系;利用分配律对共代数和代数函子进行函子化提升,给出一种构造初始代数(或终结共代数)上的共代数(或代数)结构,并将其提升为初始(或终结)λ-双代数的方法.在此基础上,进一步将函子化提升应用于各种递归(包括迭代和原始递归)及共递归函数(包括共迭代和原始共递归)的定义及计算中,并给出相应的计算定律. 展开更多
关键词 抽象数据类型 代数 共代数 双代数 递归 共递归
下载PDF
程序语言中的共归纳数据类型及其应用 被引量:11
3
作者 苏锦钿 余珊珊 《计算机科学》 CSCD 北大核心 2011年第11期114-118,共5页
归纳数据类型利用代数方法从构造的角度归纳地描述数据类型的有限语法结构,但在描述动态行为方面存在一定的不足。作为归纳数据类型的范畴对偶概念,共归纳数据类型利用共代数方法从观察的角度共归纳地描述了数据类型的动态行为。首先,... 归纳数据类型利用代数方法从构造的角度归纳地描述数据类型的有限语法结构,但在描述动态行为方面存在一定的不足。作为归纳数据类型的范畴对偶概念,共归纳数据类型利用共代数方法从观察的角度共归纳地描述了数据类型的动态行为。首先,从范畴论和代数的角度给出程序语言中的归纳数据类型定义,并分析了相应的递归操作;接着,利用共代数给出共归纳数据类型的范畴论定义,并根据共归纳数据类型的终结性分析了相应的共递归操作;最后,指出如何利用λ-双代数及分配律将归纳与共归纳数据类型有机地融合起来,探讨数据类型的语法构造与动态行为关系。 展开更多
关键词 归纳数据类型 共归纳数据类型 范畴论 代数 共代数 双代数
下载PDF
基于主观逻辑的Web服务信任模型 被引量:4
4
作者 苏锦钿 郭荷清 高英 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第10期24-28,43,共6页
为解决当前Web服务网络中存在的一些与信任相关的安全问题、提高Web服务的安全性和可靠性,基于主观逻辑,文中提出了一个改进的自适应Web服务信任模型iWSTrust及相应的信任度和声誉评估算法.该模型利用主观逻辑对Web服务网络中的实体进... 为解决当前Web服务网络中存在的一些与信任相关的安全问题、提高Web服务的安全性和可靠性,基于主观逻辑,文中提出了一个改进的自适应Web服务信任模型iWSTrust及相应的信任度和声誉评估算法.该模型利用主观逻辑对Web服务网络中的实体进行信任建模和推理,并增加可信任的第三方机构来保存信任信息,通过综合考虑Web服务环境中的各个相关实体,分析一次典型交易过程中所涉及的信任关系,并对不同类型的服务请求者进行区分,使得实体的信任度和声誉能够随着交易经验的增加而自适应地改变。模拟实验结果表明,iWSTrust能在一定程度上减少访问到恶意实体的次数, 并惩罚进行欺骗的实体. 展开更多
关键词 WEB服务 信任模型 主观逻辑 服务代理者 服务提供者 服务请求者
下载PDF
共归纳数据类型上的共递归操作及其计算定律 被引量:7
5
作者 苏锦钿 余珊珊 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第10期90-95,共6页
范畴论框架下的共归纳数据类型可以看成是某个共代数函子下的终结共代数中的载体,针对该特点,结合范畴论给出程序语言中共归纳数据类型的共代数描述,并根据终结共代数的终结性给出相应的共递归操作的定义及其共代数计算定律;同时,利用... 范畴论框架下的共归纳数据类型可以看成是某个共代数函子下的终结共代数中的载体,针对该特点,结合范畴论给出程序语言中共归纳数据类型的共代数描述,并根据终结共代数的终结性给出相应的共递归操作的定义及其共代数计算定律;同时,利用双函子及类型函子对参数化共归纳数据类型进行抽象描述,并结合自然转换给出类型函子上的单元和融合等计算定律,证明这些计算定律可用于简化共递归数据类型上的计算,从而提高程序语言对数据类型的动态行为描述能力. 展开更多
关键词 范畴论 共归纳数据类型 共递归 终结共代数
下载PDF
Web服务中的信任和声誉评估模型 被引量:3
6
作者 苏锦钿 郭荷清 刘淼 《计算机工程与应用》 CSCD 北大核心 2006年第21期127-130,共4页
对主观逻辑存在的一些问题进行分析和改进,并进一步提出一个基于主观逻辑的自适应Web服务信任模型iWSTrust。通过利用iWSTrust对Web服务环境的交易过程所涉及的实体间的各种信任关系进行详细的建模和推理,并区分不同类型的服务请求者,iW... 对主观逻辑存在的一些问题进行分析和改进,并进一步提出一个基于主观逻辑的自适应Web服务信任模型iWSTrust。通过利用iWSTrust对Web服务环境的交易过程所涉及的实体间的各种信任关系进行详细的建模和推理,并区分不同类型的服务请求者,iWSTrust能够使实体的信任度和声誉随着交易经验的增加而自适应地改变,预测实体的未来行为,并对恶意欺骗的实体进行惩罚,从而更好地保护服务请求者和服务提供者的利益。模拟实验表明改进的主观逻辑能更好地建模信任关系和改善Web服务环境的安全性。 展开更多
关键词 WEB服务 信任模型 主观逻辑 声誉 信任度
下载PDF
基于软件Agent的电子政务安全设计 被引量:3
7
作者 苏锦钿 郭荷清 高英 《计算机应用与软件》 CSCD 北大核心 2006年第3期56-58,共3页
同传统的协作式工作平台或工作流系统相比,电子政务对安全性具有更高的要求。根据我国当前电子政务建设中存在的各种安全问题,着重介绍了软件Agent技术,并分别讨论了如何在电子政务的公众网、外网、内网和公文流转的安全设计中利用软件A... 同传统的协作式工作平台或工作流系统相比,电子政务对安全性具有更高的要求。根据我国当前电子政务建设中存在的各种安全问题,着重介绍了软件Agent技术,并分别讨论了如何在电子政务的公众网、外网、内网和公文流转的安全设计中利用软件Agent技术来提高系统的安全性。 展开更多
关键词 软件AGENT 电子政务 公众网 外网 内网 公文流转
下载PDF
基于Dirichlet分布的扩展主观逻辑 被引量:2
8
作者 苏锦钿 郭荷清 刘淼 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第6期108-111,116,共5页
针对基于二值逻辑的主观逻辑中存在的一些问题,提出了基于D irichlet分布的扩展主观逻辑.在利用三值逻辑代替原来二值逻辑的基础上,扩展主观逻辑重新定义了事实空间与观念空间之间的映射关系和映射函数,并给出了新的扩展合意规则.扩展... 针对基于二值逻辑的主观逻辑中存在的一些问题,提出了基于D irichlet分布的扩展主观逻辑.在利用三值逻辑代替原来二值逻辑的基础上,扩展主观逻辑重新定义了事实空间与观念空间之间的映射关系和映射函数,并给出了新的扩展合意规则.扩展主观逻辑保留了主观逻辑基于统计推断和概率理论的优点,并考虑了事件结果不确定时的情况,从而可更好地建模和处理信任中的主观性和不确定性.实例分析表明,扩展主观逻辑具有合理的事实根据和理论基础. 展开更多
关键词 主观逻辑 Dirichlet分布 证据理论 二值逻辑 三值逻辑 合意规则
下载PDF
广义共迭代及其计算律 被引量:3
9
作者 苏锦钿 余珊珊 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第9期62-68,共7页
针对函数式编程中的共归纳数据类型上的各种共递归操作缺乏统一描述的问题,利用Monads及其与共代数函子之间的分配律给出了共归纳数据类型上的一种广义共迭代定义——gunfold,证明了gunfold可以为共迭代、原始共递归和Course-of-Value... 针对函数式编程中的共归纳数据类型上的各种共递归操作缺乏统一描述的问题,利用Monads及其与共代数函子之间的分配律给出了共归纳数据类型上的一种广义共迭代定义——gunfold,证明了gunfold可以为共迭代、原始共递归和Course-of-Value共迭代提供一种统一和抽象的描述.在此基础上进一步从范畴论的角度分析了gunfold上的各种性质和计算律. 展开更多
关键词 函数式编程 共归纳数据类型 终结共代数 共递归 MONADS 范畴论
下载PDF
一种结合词性及注意力的句子情感分类方法 被引量:3
10
作者 苏锦钿 余珊珊 李鹏飞 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第6期10-17,30,共9页
针对目前各种基于长短期记忆网络LSTM的句子情感分类方法没有考虑词的词性信息这一问题,将词性与自注意力机制相结合,提出一种面向句子情感分类的神经网络模型PALSTM(Pos and Attention-based LSTM).首先,结合预训练词向量和词性标注工... 针对目前各种基于长短期记忆网络LSTM的句子情感分类方法没有考虑词的词性信息这一问题,将词性与自注意力机制相结合,提出一种面向句子情感分类的神经网络模型PALSTM(Pos and Attention-based LSTM).首先,结合预训练词向量和词性标注工具分别给出句子中词的语义词向量和词性词向量表示,并作为LSTM的输入用于学习词在内容和词性方面的长期依赖关系,有效地弥补了一般LSTM单纯依赖预训练词向量中词的共现信息的不足;接着,利用自注意力机制学习句子中词的位置信息和权重向量,并构造句子的最终语义表示;最后由多层感知器进行分类和输出.实验结果表明,PALSTM在公开语料库Movie Reviews、Internet Movie Database和Stanford Sentiment Treebank二元分类及五元情感上的准确率均比一般的LSTM和注意力LSTM模型有一定的提升. 展开更多
关键词 自然语言处理 情感分类 神经网络 词性 自注意力
下载PDF
基于多模型集成的语义文本相似性判断 被引量:3
11
作者 苏锦钿 洪晓斌 余珊珊 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第4期1-9,共9页
作为目前自然语言处理及人工智能领域的主流方法,各种预训练语言模型由于在语言建模、特征表示、模型结构、训练目标及训练语料等方面存在差异,导致它们在下游任务中的表现各有优劣。为了更好地融合不同预训练语言模型中的知识及在下游... 作为目前自然语言处理及人工智能领域的主流方法,各种预训练语言模型由于在语言建模、特征表示、模型结构、训练目标及训练语料等方面存在差异,导致它们在下游任务中的表现各有优劣。为了更好地融合不同预训练语言模型中的知识及在下游任务中的学习能力,结合语义文本相似性判断任务的特点,提出一种多模型集成方法MME-STS,给出相应的模型总体架构及相应的特征表示,并针对多模型的集成问题分别提出基于平均值、基于全连接层训练和基于Adaboost算法的3种不同集成策略,同时在两个常用的经典基准数据集上验证该方法的有效性。实验结果表明,MME-STS在国际语义评测SemEval 2014任务4的SICK和SemEval 2017 STS-B数据集上的Pearson共关系值和Spearman相关系数值均超过单个预训练语言模型方法。 展开更多
关键词 深度学习 语义文本相似度 自然语言处理 预训练语言模型 多模型集成
下载PDF
带参数的共递归操作及其计算律 被引量:3
12
作者 苏锦钿 余珊珊 《计算机研究与发展》 EI CSCD 北大核心 2013年第12期2676-2690,共15页
针对共归纳数据类型上的unfold无法描述带参数的共递归操作的问题,证明了笛卡儿封闭范畴上的有限扩展多项式函子的终结共代数在固定参数和累积参数下都是强终结的,并利用该强终结性给出强共归纳数据类型的定义以及带固定参数和累积参数... 针对共归纳数据类型上的unfold无法描述带参数的共递归操作的问题,证明了笛卡儿封闭范畴上的有限扩展多项式函子的终结共代数在固定参数和累积参数下都是强终结的,并利用该强终结性给出强共归纳数据类型的定义以及带固定参数和累积参数的共递归操作——punfold和aunfold,从而将Pardo对强归纳数据类型及带参数的递归计算pfold和afold的研究扩展到共归纳数据类型上,使得unfold可直接包含额外的参数用于作为计算的输入或者保存临时的计算结果,避免采用高阶函数的方式.从范畴论的角度给出punfold和aunfold的各种性质、计算律及在函数式程序语言Haskell中的实现,并指出它们在程序推导、转换和优化中的应用. 展开更多
关键词 共归纳数据类型 终结共代数 共递归 累积计算 范畴论
下载PDF
基于依存树及距离注意力的句子属性情感分类 被引量:12
13
作者 苏锦钿 欧阳志凡 余珊珊 《计算机研究与发展》 EI CSCD 北大核心 2019年第8期1731-1745,共15页
目前基于注意力机制的句子属性情感分类方法由于忽略句子中属性的上下文信息以及单词与属性间的距离特征,从而导致注意力机制难以学习到合适的注意力权重.针对该问题,提出一种基于依存树及距离注意力的句子属性情感分类模型(dependency ... 目前基于注意力机制的句子属性情感分类方法由于忽略句子中属性的上下文信息以及单词与属性间的距离特征,从而导致注意力机制难以学习到合适的注意力权重.针对该问题,提出一种基于依存树及距离注意力的句子属性情感分类模型(dependency tree and distance attention, DTDA).首先根据句子的依存树得到包含属性的依存子树,并利用双向GRU学习句子及属性的上下文特征表示;根据句子中单词和属性在依存树中的最短路径确定相应的语法距离及位置权重,同时结合相对距离构造包含语义信息和距离信息的句子特征表示,并进一步利用注意力机制生成属性相关的句子情感特征表示;最后,将句子的上下文信息与属性相关的情感特征表示合并后并通过softmax进行分类输出.实验结果表明:DTDA在国际语义评测SemEval2014的2个基准数据集Laptop和Restaurant上取得与目前最好方法相当的结果.当使用相关领域训练的词向量时,DTDA在Laptop上的精确率为77.01%,在Restaurant上的准确率为81.68%. 展开更多
关键词 深度学习 属性情感分类 注意力 依存树 自然语言处理
下载PDF
强共归纳数据类型上的Comonadic共递归 被引量:2
14
作者 苏锦钿 余珊珊 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期128-134,共7页
针对共归纳数据类型上的unfold无法描述带参数的共递归计算的问题,首先证明了笛卡尔封闭范畴上的终结共代数是强终结的,并给出强共归纳数据类型的范畴论定义及其上一种带固定参数的共递归——punfold,使得共归纳数据类型上的共递归计算... 针对共归纳数据类型上的unfold无法描述带参数的共递归计算的问题,首先证明了笛卡尔封闭范畴上的终结共代数是强终结的,并给出强共归纳数据类型的范畴论定义及其上一种带固定参数的共递归——punfold,使得共归纳数据类型上的共递归计算可以包含额外的参数作为计算的输入;然后利用基于Comonads的Comonadic共递归给出了unfold和punfold的一种统一的描述,并进一步分析了punfold上的各种计算律,从而将Pardo对基于Comonads的带参数的递归计算研究扩展到共归纳数据类型. 展开更多
关键词 递归函子 共归纳数据类型 终结共代数 共递归
下载PDF
带固定参数的Monadic递归 被引量:1
15
作者 苏锦钿 余珊珊 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第7期33-39,73,共8页
针对归纳数据类型上的递归操作可能包含固定参数且产生计算副作用的问题,结合函数式程序语言中的monads及范畴论中的伴随关系给出monadic强归纳数据类型的定义及monadic强初始性的证明;在此基础上,进一步提出一种带固定参数且产生计算... 针对归纳数据类型上的递归操作可能包含固定参数且产生计算副作用的问题,结合函数式程序语言中的monads及范畴论中的伴随关系给出monadic强归纳数据类型的定义及monadic强初始性的证明;在此基础上,进一步提出一种带固定参数且产生计算副作用的递归操作的定义,证明了它比一般的递归具有更好的抽象性和封装性,同时分析了相应的范畴论性质和计算律. 展开更多
关键词 递归 归纳数据类型 初始代数 MONAD 范畴论 程序语言
下载PDF
抽象数据类型的双代数结构 被引量:5
16
作者 苏锦钿 余珊珊 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第12期44-50,共7页
对抽象数据类型的语法构造和动态行为的性质及两者的关系而言,单纯利用代数或共代数方法进行研究存在一定的不足.文中结合范畴论及分配律给出抽象数据类型的双代数结构,并通过λ-双代数自然地描述了语法构造与动态行为之间的转换关系;... 对抽象数据类型的语法构造和动态行为的性质及两者的关系而言,单纯利用代数或共代数方法进行研究存在一定的不足.文中结合范畴论及分配律给出抽象数据类型的双代数结构,并通过λ-双代数自然地描述了语法构造与动态行为之间的转换关系;分别利用分配律对共代数函子及代数函子进行函子化提升,证明这种函子化提升可以将初始代数(或终结共代数)提升为初始(或终结)λ-双代数,并将其应用于递归及共递归函数的定义及计算中.实例表明,这种函子化提升可以扩展代数中的归纳原理和共代数中的共归纳原理,从而提高程序语言对抽象数据类型的描述与性质证明能力. 展开更多
关键词 抽象数据类型:共代数:双代数:共递归
下载PDF
范畴数据类型上的子类型 被引量:1
17
作者 苏锦钿 余珊珊 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第9期58-64,共7页
为探讨包含构造操作和观察操作的范畴数据类型上的子类型关系及性质,将双代数作为范畴数据类型上构造操作和观察操作的统一数学描述,分析了归纳数据类型上代数子类型和共归纳数据类型上共代数子类型的范畴论定义及其语义,给出了双代数... 为探讨包含构造操作和观察操作的范畴数据类型上的子类型关系及性质,将双代数作为范畴数据类型上构造操作和观察操作的统一数学描述,分析了归纳数据类型上代数子类型和共归纳数据类型上共代数子类型的范畴论定义及其语义,给出了双代数结构中代数子类型和共代数子类型的范畴论定义及其语义解释,从而将代数子类型和共代数子类型的研究扩展到双代数上. 展开更多
关键词 代数 共代数 双代数 范畴数据类型 子类型
下载PDF
计算机科学中的范畴数据类型的研究综述 被引量:2
18
作者 苏锦钿 《计算机科学》 CSCD 北大核心 2016年第10期9-18,39,共11页
范畴数据类型是指以范畴论为数学理论基础研究数据类型的描述、计算、语义和应用。早期的范畴数据类型研究以归纳数据类型为主,采用代数从归纳的角度研究有限数据类型的构造语义和递归性质。近年来,归纳数据类型的对偶概念——共归纳数... 范畴数据类型是指以范畴论为数学理论基础研究数据类型的描述、计算、语义和应用。早期的范畴数据类型研究以归纳数据类型为主,采用代数从归纳的角度研究有限数据类型的构造语义和递归性质。近年来,归纳数据类型的对偶概念——共归纳数据类型逐渐引起计算机科学工作者的关注与研究,他们采用共代数从观察的角度研究无限数据类型的行为语义和共递归性质。利用范畴论可以为数据类型研究提供统一的数学理论基础,并将代数和共代数中的各种重要研究成果有机地融合在一起,如语法构造与动态行为、递归与共递归、同余与互模拟等。目前,范畴数据类型已经在程序语言、计算描述、理论证明器和并行计算等领域得到广泛的应用。对范畴数据类型的基本概念、数学理论基础、逻辑基础及应用等方面的最新研究成果进行介绍,以引起国内外相关研究领域的学者对计算机科学中的范畴数据类型理论的关注。 展开更多
关键词 数据类型 范畴论 代数 共代数 逻辑演算 程序语言
下载PDF
扩展主观逻辑的粗化与细化
19
作者 苏锦钿 郭荷清 高英 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第9期65-69,84,共6页
为了提高主观逻辑的扩展性和灵活性,文中结合证据理论及信任结构,提出了基于三项事件的扩展主观逻辑.通过重新定义观念空间与事实空间之间的映射关系,给出扩展主观逻辑的粗化和细化映射及相应的计算规则,扩展主观逻辑能够根据实际环境... 为了提高主观逻辑的扩展性和灵活性,文中结合证据理论及信任结构,提出了基于三项事件的扩展主观逻辑.通过重新定义观念空间与事实空间之间的映射关系,给出扩展主观逻辑的粗化和细化映射及相应的计算规则,扩展主观逻辑能够根据实际环境的需要提供不同详细程度的识别框架,并利用粗化和细化映射在扩展主观逻辑上统一对信任函数进行结合,而结果可重新映射回原识别框架.实例及分析表明,利用扩展主观逻辑可以解决不同识别框架之间信任信息的融合问题. 展开更多
关键词 主观逻辑 信任结构 证据理论 粗化 细化
下载PDF
一种面向中文拼写纠错的自监督预训练方法
20
作者 苏锦钿 余珊珊 洪晓斌 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第9期90-98,共9页
预训练语言模型BERT/RoBERTa/MacBERT等虽然能够通过预训练任务中的掩码语言模型(MLM)很好地学习字和词的语法、语义及上下文特征,但其缺乏拼写错误识别及纠正能力,且在中文拼写纠错(CSC)任务中面临预训练与下游任务微调目标不一致的问... 预训练语言模型BERT/RoBERTa/MacBERT等虽然能够通过预训练任务中的掩码语言模型(MLM)很好地学习字和词的语法、语义及上下文特征,但其缺乏拼写错误识别及纠正能力,且在中文拼写纠错(CSC)任务中面临预训练与下游任务微调目标不一致的问题。为了进一步提升BERT/RoBERTa/MacBERT等模型的拼写错误识别及纠正能力,提出一种面向中文拼写纠错的自监督预训练方法MASC。MASC在MLM的基础上将对被掩码字的正确值预测转换成对拼写错误字的识别和纠正。首先,MASC将MLM对字的掩码扩展为相应的全词掩码,目的是提升BERT对单词级别的语义表征学习能力;接着,利用混淆集从音调相同、音调相近和字形相近等方面对MLM中的被掩码字进行替换,并将MLM的训练目标更改为识别正确的字,从而增强了BERT的拼写错误识别及纠正能力;最后,在3个公开的CSC语料集sighan13、sighan14和sighan15上的实验结果表明,MASC可在不改变BERT/RoBERTa/MacBERT等模型结构的前提下进一步提升它们在下游CSC任务中的效果,并且消融实验也证明了全词掩码、音调和字形等信息的重要性。 展开更多
关键词 中文拼写纠错 文本纠错 自然语言处理 预训练语言模型 深度学习 自监督
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部