期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
一种基于成对字向量和噪声鲁棒学习的同义词挖掘算法
1
作者 张浩宇 王戟 《自动化学报》 EI CAS CSCD 北大核心 2023年第6期1181-1194,共14页
同义词挖掘是自然语言处理中一项重要任务.为了构建大规模训练语料,现有研究利用远程监督、点击图筛选等方式抽取同义词种子,而这几种方式都不可避免地引入了噪声标签,从而影响高质量同义词挖掘模型的训练.此外,由于大量实体词所具有的... 同义词挖掘是自然语言处理中一项重要任务.为了构建大规模训练语料,现有研究利用远程监督、点击图筛选等方式抽取同义词种子,而这几种方式都不可避免地引入了噪声标签,从而影响高质量同义词挖掘模型的训练.此外,由于大量实体词所具有的少样本特性、领域分布差异性和预训练词向量训练目标与同义词挖掘任务的不一致性,在同义词挖掘任务中,词级别的预训练词向量很难产生高质量的实体语义表示.为解决这两个问题,提出了一种利用成对字向量和噪声鲁棒学习框架的同义词挖掘模型.模型利用预训练的成对字向量增强实体语义表示,并利用自动标注的噪声标签通过交替优化的方式,估计真实标签的分布并产生伪标签,希望通过这些改进提升模型的表示能力和鲁棒性.最后,使用WordNet分析和过滤带噪声数据集,并在不同规模、不同领域的同义词数据集上进行了实验验证.实验结果和分析表明,该同义词挖掘模型在各种数据分布和噪声比例下,与有竞争力的基准方法相比,均提升了同义词判别和同义词集合生成的效果. 展开更多
关键词 同义词挖掘 噪声标签学习 自然语言处理 成对字向量 信息抽取
下载PDF
针对同义词替换信息隐藏的检测方法研究 被引量:9
2
作者 罗纲 孙星明 +2 位作者 向凌云 刘玉玲 甘灿 《计算机研究与发展》 EI CSCD 北大核心 2008年第10期1696-1703,共8页
基于同义词替换的文本信息隐藏方法,可以通过对载体中的同义词进行有选择的替换来嵌入隐藏信息.通过分析,发现这种方法嵌入隐藏信息后会导致载体文本中同义词结对概率的明显增加.基于此,提出了一种通过分析文本中同义词结对值来进行隐... 基于同义词替换的文本信息隐藏方法,可以通过对载体中的同义词进行有选择的替换来嵌入隐藏信息.通过分析,发现这种方法嵌入隐藏信息后会导致载体文本中同义词结对概率的明显增加.基于此,提出了一种通过分析文本中同义词结对值来进行隐藏信息检测的算法.实验表明,该检测算法漏警率约为4%,虚警率约为9.8%,证明该检测算法可以有效地检测基于同义词替换的文本信息隐藏方法隐藏的信息. 展开更多
关键词 信息隐藏 隐写分析 同义词结对 同义词替换 文本
下载PDF
大肠杆菌基因中密码对使用的规律 被引量:2
3
作者 王志坚 王芳平 +1 位作者 方玉田 李宏 《基因组学与应用生物学》 CAS CSCD 北大核心 2010年第5期976-981,共6页
为了探讨基因组序列的非随机性对密码对使用的影响程度,揭示依赖上下文的密码对偏爱性(CDCB)可能存在的规律,本文主要对大肠杆菌基因组中密码子及其紧邻密码子(密码对)偏爱作了全面的统计分析。结果发现85%的密码子在其紧邻密码子位点... 为了探讨基因组序列的非随机性对密码对使用的影响程度,揭示依赖上下文的密码对偏爱性(CDCB)可能存在的规律,本文主要对大肠杆菌基因组中密码子及其紧邻密码子(密码对)偏爱作了全面的统计分析。结果发现85%的密码子在其紧邻密码子位点有显著依赖上下文的密码对偏爱性,通过密码对与全序列六联体(三联体对)的相对丰度比较发现,大约35%的密码对偏好性不能用基因组的序列组分来解释。当密码子第二和第三位点核苷酸相同,且紧邻密码子相同时,它们的相对丰度有显著相关性。结果表明我们的数据支持依赖上下文的密码子偏好的主要原因是蛋白质合成精确性选择的假设,即本文结果揭示了依赖上下文的密码对偏好性可能存在的规律,从而为今后进一步研究大肠杆菌基因组中密码对使用偏好性提供参考。 展开更多
关键词 基因组 密码对偏爱 紧邻密码子 同义密码子
下载PDF
论杜甫七律中的连用字对 被引量:1
4
作者 张金明 裴旭岩 《燕山大学学报(哲学社会科学版)》 2021年第2期47-53,共7页
连用字对作为律诗对仗类型中的一种,在唐以来的众多诗人的诗篇中偶有涉及,但真正自觉、频繁地运用连用字对作诗的为数不多,杜甫无疑是其中的佼佼者。立足于杜甫七律,分析了连用字对的三种类别——反义连用字对、同义连用字对和相混连用... 连用字对作为律诗对仗类型中的一种,在唐以来的众多诗人的诗篇中偶有涉及,但真正自觉、频繁地运用连用字对作诗的为数不多,杜甫无疑是其中的佼佼者。立足于杜甫七律,分析了连用字对的三种类别——反义连用字对、同义连用字对和相混连用字对,讨论连用字对在律诗创作中的独特作用——意象罗列与场景勾勒的作用和情感的强化作用,并进一步探讨了连用字对的拆用和连用字在不对仗句式中的使用这两种连用字对的变体。 展开更多
关键词 杜甫七律 连用字对 同义连用字对 相混连用字对 反义连用字对
下载PDF
闪烁古生球菌基因中密码对的偏好性
5
作者 王芳平 王志坚 《中国医学物理学杂志》 CSCD 2011年第5期2934-2936,2944,共4页
目的:如同密码子的偏爱性使用一样,密码对的使用也有偏爱性,为了揭示基因组中密码对使用的规律,对闪烁古生球菌基因组中密码子及其紧邻密码子(密码子对)偏爱分布作较全面的统计分析。方法:生物统计学。结果:通过定义密码对的相对丰度,发... 目的:如同密码子的偏爱性使用一样,密码对的使用也有偏爱性,为了揭示基因组中密码对使用的规律,对闪烁古生球菌基因组中密码子及其紧邻密码子(密码子对)偏爱分布作较全面的统计分析。方法:生物统计学。结果:通过定义密码对的相对丰度,发现81%的密码子对其紧邻密码子有偏爱性,这种偏爱性与同义密码子的使用有关。此外,通过密码子及其紧邻密码子与全序列六联体的相对丰度比较发现,大约30%的紧邻密码对偏爱性不能用基因组的序列组分来解释。结论:密码对的偏爱性与它的核苷酸组分有显著相关性。 展开更多
关键词 基因组 密码对 紧邻密码子 同义密码子
下载PDF
商务英语合同中同义词并用的特征及其翻译 被引量:3
6
作者 许志珊 《长春工程学院学报(社会科学版)》 2012年第3期101-104,共4页
研究指出,为了确保准确性和严密性,商务英语合同中存在着同义词并用的现象。根据目的的不同,可以将这些词归纳为两类,即"求同型同义词"和"求异型同义词"。按照词性的不同,文章进一步将这些词进行分类,并尝试通过例... 研究指出,为了确保准确性和严密性,商务英语合同中存在着同义词并用的现象。根据目的的不同,可以将这些词归纳为两类,即"求同型同义词"和"求异型同义词"。按照词性的不同,文章进一步将这些词进行分类,并尝试通过例句论证在翻译这些词语时可以采用的策略。 展开更多
关键词 商务英语合同 同义词并用 翻译策略
下载PDF
词汇同义关系对多维词汇知识习得的影响研究 被引量:7
7
作者 王新朋 孔文 《外语界》 CSSCI 北大核心 2014年第2期49-57,共9页
本研究基于Nation的多维词汇知识框架设计了多维词汇知识测试,从拼写、词义、句法搭配、语法功能、语义联系5个维度考察有无同义词的词表和例句学习对目标词多维词汇知识习得的影响。实验结果表明,有已知高频同义词的目标词在拼写接受... 本研究基于Nation的多维词汇知识框架设计了多维词汇知识测试,从拼写、词义、句法搭配、语法功能、语义联系5个维度考察有无同义词的词表和例句学习对目标词多维词汇知识习得的影响。实验结果表明,有已知高频同义词的目标词在拼写接受性词汇知识、语义联系产出性词汇知识和句法搭配接受性词汇知识上的得分显著高于无已知同义词的目标词。由此,已知同义词能够促进未知同义新词的习得。 展开更多
关键词 多维词汇知识 已知同义词 词表 例句
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部