期刊文献+
共找到274篇文章
< 1 2 14 >
每页显示 20 50 100
试论汉英肤觉形容词义位衍生现象的共性与差异
1
作者 王淼 张道新 《辽宁师范大学学报(社会科学版)》 2024年第2期50-57,共8页
通过引申和比喻扩展词义是语言系统高度发展的特征之一。以汉英肤觉形容词为切入点,运用词汇语义逻辑理论,发现两种语言在义位衍生机制方面存在共性,即引申、比喻义位的衍生分别遵循“以属指名”和“以名指属”的语义逻辑机制。通过对... 通过引申和比喻扩展词义是语言系统高度发展的特征之一。以汉英肤觉形容词为切入点,运用词汇语义逻辑理论,发现两种语言在义位衍生机制方面存在共性,即引申、比喻义位的衍生分别遵循“以属指名”和“以名指属”的语义逻辑机制。通过对比还发现,英语作为形态语言,衍生的义位明显多于汉语,而汉语衍生义位的透明度和理据性更高。 展开更多
关键词 肤觉形容词 义位衍生 语义逻辑机制 汉英比较
下载PDF
面向新词义原推荐的相似性判别方法
2
作者 白宇 田雨 +1 位作者 王之光 张桂平 《中文信息学报》 CSCD 北大核心 2024年第1期36-44,共9页
义原(Sememe)是构成《知网》(HowNet)概念描述的核心部件,新词概念描述义原的推荐是HowNet自动或半自动扩展中涉及的关键问题。面向新词义原推荐,该文提出一种融合义原注意力的预训练语言模型优化方法——SaBERT。在判别新词与HowNet词... 义原(Sememe)是构成《知网》(HowNet)概念描述的核心部件,新词概念描述义原的推荐是HowNet自动或半自动扩展中涉及的关键问题。面向新词义原推荐,该文提出一种融合义原注意力的预训练语言模型优化方法——SaBERT。在判别新词与HowNet词表词之间的语义相似性的过程中,该方法利用词表词已知概念描述义原序列的注意力分布,以相似性同构为目标,对基于BERT+CNN的相似性判别模型进行优化,从而为义原推荐任务提供相似概念集合。实验结果表明,采用SaBERT可以有效解决未登录词与词表词的相似性判别问题,准确率、召回率、F1值分别达到0.8314、0.8007和0.8158。在基于协同过滤框架的义原推荐任务上进行的实验表明,相似性同构程度与义原推荐效果正相关,说明该文方法能够有效解决候选义原选择问题。 展开更多
关键词 义原推荐 相似性同构 知网
下载PDF
基于网络嵌入和预训练模型的义原预测
3
作者 白宇 王之光 +1 位作者 刘懿萱 蔡东风 《计算机应用与软件》 北大核心 2024年第7期42-48,共7页
义原是构成《知网》概念描述的核心部件,义原预测是HowNet自动或半自动扩展中涉及的关键问题之一。提出一种基于网络嵌入和预训练模型的义原预测方法,通过对《知网》中的字-词-义项-义原及其关系的表示学习,融合预训练语言模型动态构建... 义原是构成《知网》概念描述的核心部件,义原预测是HowNet自动或半自动扩展中涉及的关键问题之一。提出一种基于网络嵌入和预训练模型的义原预测方法,通过对《知网》中的字-词-义项-义原及其关系的表示学习,融合预训练语言模型动态构建局部“义项-义原”关系网络,实现新概念与候选义原的动态匹配。实验结果中的义原预测F1值达到0.6237,表明该方法能够更有效地解决《知网》中未登录词的义原预测问题。 展开更多
关键词 义原 预训练语言模型 网络嵌入
下载PDF
基于语义感知的工业制造领域知识抽取方法
4
作者 黄子麒 胡建鹏 《计算机工程与应用》 CSCD 北大核心 2024年第12期357-365,共9页
工业制造领域通用知识抽取方法研究对于实现工业知识库自动化构建意义重大。针对工业本体定义需要大量人工成本和专家经验作指导的问题,基于义原分析设计了一种半自动本体构建方法,最后以汽车生产制造故障维修数据为例,完成了本体、本... 工业制造领域通用知识抽取方法研究对于实现工业知识库自动化构建意义重大。针对工业本体定义需要大量人工成本和专家经验作指导的问题,基于义原分析设计了一种半自动本体构建方法,最后以汽车生产制造故障维修数据为例,完成了本体、本体类、层级和关系定义。为解决工业领域关系抽取存在的关系嵌套和级联模型误差传播问题,设计了一种基于语义感知的关系抽取模型:在该模型的潜在关系挖掘、主语抽取、宾语抽取三个环节中,基于阅读理解方法拼接不同的引导问句,得到适用于不同环节的句子编码;为利用主语先验知识,在宾语抽取模块融入注意力机制,提高了该模块编码的表达能力;三环节联合优化训练提升抽取效果。在汽车生产制造故障维修数据集、汽车工业故障模式抽取评测数据集、装备制造数据集中进行实验,提出的模型比其他关系抽取基线模型取得了更好的效果。 展开更多
关键词 本体构建 义原分析 关系抽取 注意力机制 工业制造领域
下载PDF
实体类别增强的汽车领域嵌套命名实体识别
5
作者 黄子麒 胡建鹏 《计算机应用》 CSCD 北大核心 2024年第2期377-384,共8页
针对中文汽车领域实体抽取任务中对嵌套实体、长实体识别效果差的问题,提出一种实体类别增强的嵌套实体抽取(ECE-NER)模型。首先,基于特征融合编码,提高模型对领域实体边界的感知能力;然后,尾词识别模块利用多层感知机得到实体尾词集合... 针对中文汽车领域实体抽取任务中对嵌套实体、长实体识别效果差的问题,提出一种实体类别增强的嵌套实体抽取(ECE-NER)模型。首先,基于特征融合编码,提高模型对领域实体边界的感知能力;然后,尾词识别模块利用多层感知机得到实体尾词集合;最后,前向边界识别模块基于义原构造的实体类别特征和自注意力机制得到实体类别增强的候选尾词表征,融合领域实体类别特征,利用双仿射编码器计算特定尾词和实体类型的实体跨度概率,从而确定命名实体。在某汽车企业生产线故障数据集、汽车工业故障抽取评测数据集CCL2022和中文医学文本数据集CHIP2020上进行模型验证。实验结果表明,所提模型在前两个数据集上的实体识别F1值比序列标注模型(BERT+BiLSTM+CRF)、基于跨度的实体抽取模型(PURE(Princeton University Relation Extraction)、SpERT(Span-based Entity and Relation Transformer))分别提高了4.1、1.8、1.6个百分点和9.0、5.4、7.3个百分点;在第一个数据集和第三个数据集中嵌套实体识别F1值与PURE、SpERT模型相比提高了13.3、8.3个百分点和21.7、9.3个百分点,验证了所提模型在嵌套实体识别上的有效性。 展开更多
关键词 特征融合 义原特征 自注意力机制 双仿射编码器 中文嵌套命名实体识别
下载PDF
术语的学科义位与普通义位及其在语文词典中的处理
6
作者 王迎春 《中国科技术语》 2024年第2期13-21,共9页
术语的学科义位与普通义位之间往往存在着互相演变的关系。文章对兼具学科义位与普通义位的术语条目其学科义位与普通义位之间的关系进行较为系统的梳理与分析:使用新创词命名的术语一般由学科义位衍生出普通义位,而使用现成词命名的术... 术语的学科义位与普通义位之间往往存在着互相演变的关系。文章对兼具学科义位与普通义位的术语条目其学科义位与普通义位之间的关系进行较为系统的梳理与分析:使用新创词命名的术语一般由学科义位衍生出普通义位,而使用现成词命名的术语则一般由普通义位衍生出学科义位。在此基础上以《现代汉语词典》为例来讨论该类术语条目在语文词典中的处理方式:《现代汉语词典》对前者的处理方式是先释出学科义位,后释出普通义位,对后者的处理方式是先释出普通义位,后释出学科义位。通过对术语学科义位与普通义位的梳理分析,能够加深对术语及其词义演变的认识,从而丰富术语学理论,同时对术语的标准化规范化工作也有所助益。 展开更多
关键词 术语 学科义位 普通义位 《现代汉语词典》
下载PDF
新疆吐鲁番出土随葬衣物疏分类释考及所见中华文化的交融与共生
7
作者 李宁 李文亮 《吐鲁番学研究》 2024年第1期87-99,141,142,共15页
吐鲁番历来为古丝路重镇,同时亦是中华文化交往交流交融之地。就吐鲁番的随葬衣物疏而言,其不仅所载物品数量丰富,种类繁多,样式齐全,而且蕴含中华多元文化基因。义素分析法是语义研究的一大优化路径,如果以义素分析和语义场的角度审视... 吐鲁番历来为古丝路重镇,同时亦是中华文化交往交流交融之地。就吐鲁番的随葬衣物疏而言,其不仅所载物品数量丰富,种类繁多,样式齐全,而且蕴含中华多元文化基因。义素分析法是语义研究的一大优化路径,如果以义素分析和语义场的角度审视,衣物疏所载名物的多样性及其分类依据便得以显现和琢磨。时隔弥久,衣物疏物品名目,已不可尽知,考字训词,还原其适时本义,亦为必要。交往交流交融自立于根本,自中华文化“重孝尊礼“”慕仙崇神“”尚善克己”三维之下观照随葬衣物疏,可见其内蕴交融与共生之多重文化语境。 展开更多
关键词 中华民族共同体 吐鲁番 随葬衣物疏 多重语境 义素分析法
下载PDF
基于Transformer与HowNet义原知识融合的双驱动语义蕴含识别
8
作者 陈帆 黄炎 张新访 《计算机系统应用》 2023年第5期291-299,共9页
语义蕴含识别旨在检测和判断两个语句的语义是否一致,以及是否存在蕴含关系.然而现有方法通常面临中文同义词、一词多义现象困扰和长文本难理解的挑战.针对上述问题,本文提出了一种基于Transformer和HowNet义原知识融合的双驱动中文语... 语义蕴含识别旨在检测和判断两个语句的语义是否一致,以及是否存在蕴含关系.然而现有方法通常面临中文同义词、一词多义现象困扰和长文本难理解的挑战.针对上述问题,本文提出了一种基于Transformer和HowNet义原知识融合的双驱动中文语义蕴含识别方法,首先通过Transformer对中文语句内部结构语义信息进行多层次编码和数据驱动,并引入外部知识库HowNet进行知识驱动建模词汇之间的义原知识关联,然后利用softattention进行交互注意力计算并与义原矩阵实现知识融合,最后用BiLSTM进一步编码文本概念层语义信息并推理判别语义一致性和蕴含关系.本文所提出的方法通过引入HowNet义原知识手段解决多义词及同义词困扰,通过Transformer策略解决长文本挑战问题.在BQ、AFQMC、PAWSX等金融和多语义释义对数据集上的实验结果表明,与DSSM、MwAN、DRCN等轻量化模型以及ERNIE等预训练模型相比,该模型不仅可以有效提升中文语义蕴含识别的准确率(相比DSSM模型提升2.19%),控制模型的参数量(16 M),还能适应50字及以上的长文本蕴含识别场景. 展开更多
关键词 义原知识融合 TRANSFORMER HOWNET 蕴含识别
下载PDF
基于义原级语句稀释法的文本对抗攻击能力强化方法
9
作者 叶文滔 张敏 陈仪香 《软件学报》 EI CSCD 北大核心 2023年第7期3313-3328,共16页
随着近年来机器学习方法在自然语言处理领域的应用越发广泛,自然语言处理任务的安全性也引起了研究者们重视.现有研究发现,向样本施加细微扰动可能令机器学习模型得到错误结果,这种方法称之为对抗攻击.文本对抗攻击能够有效发现自然语... 随着近年来机器学习方法在自然语言处理领域的应用越发广泛,自然语言处理任务的安全性也引起了研究者们重视.现有研究发现,向样本施加细微扰动可能令机器学习模型得到错误结果,这种方法称之为对抗攻击.文本对抗攻击能够有效发现自然语言模型的弱点从而进行改进.然而,目前的文本对抗攻击方法都着重于设计复杂的对抗样本生成策略,对抗攻击成功率提升有限,且对样本进行高侵入性修改容易导致样本质量下降.如何更简单、更高效地提升对抗攻击效果,并输出高质量对抗样本已经成为重要需求.为解决此问题,从改进对抗攻击过程的新角度,设计了义原级语句稀释法(sememe-level sentence dilution algorithm,SSDA)及稀释池构建算法(dilution pool construction algorithm,DPCA).SSDA是一种可以自由嵌入经典对抗攻击过程中的新过程,它利用DPCA构建的稀释池先对输入样本进行稀释,再进行对抗样本生成.在未知文本数据集与自然语言模型的情况下,不仅能够提升任意文本对抗攻击方法的攻击成功率,还能够获得相较于原方法更高的对抗样本质量.通过对不同文本数据集、稀释池规模、自然语言模型,以及多种主流文本对抗攻击方法进行对照实验,验证了SSDA对文本对抗攻击方法成功率的提升效果以及DPCA构建的稀释池对SSDA稀释能力的提升效果.实验结果显示,SSDA稀释过程能够比经典对抗攻击过程发现更多模型漏洞,且DPCA能够帮助SSDA在提升成功率的同时进一步提升对抗样本的文本质量. 展开更多
关键词 对抗攻击 机器学习 自然语言处理 边界值分析 义原
下载PDF
动词义素的重新分布与中动结构的生成
10
作者 冯静 《黑河学院学报》 2023年第8期106-109,共4页
动词的论元结构决定动词谓语句的句法结构,动词通过与特定的论元合并生成某种论元结构,达成语义表现。与某些罗曼语的中动结构相似,英语中动结构的谓语动词在词库中合并一个反身代词附着语,因此,其义素重新分布,[+RELATIONAL]义素加强,... 动词的论元结构决定动词谓语句的句法结构,动词通过与特定的论元合并生成某种论元结构,达成语义表现。与某些罗曼语的中动结构相似,英语中动结构的谓语动词在词库中合并一个反身代词附着语,因此,其义素重新分布,[+RELATIONAL]义素加强,其他义素如[+DYNAMIC][+ACTION][+CAUSATIVE]减弱,导致中动结构的各种句法、语义表现。 展开更多
关键词 中动结构 谓语 义素 关系动词
下载PDF
汉语复合词语素义和词义关系新探——以“点”词族的形成轨迹及词义演变为例
11
作者 王远 《山西大同大学学报(社会科学版)》 2023年第4期91-96,共6页
以“点”词族的形成轨迹及词义演变为例,以顺向思维方式、语义分析纵横两个角度,深入语素内部,探讨语素A与B的结合理据及它们对词义C的贡献。研究发现:语素义的呈现是一个在组合关系中竞争选择的过程,其结合理据在于语素内部潜在义素的... 以“点”词族的形成轨迹及词义演变为例,以顺向思维方式、语义分析纵横两个角度,深入语素内部,探讨语素A与B的结合理据及它们对词义C的贡献。研究发现:语素义的呈现是一个在组合关系中竞争选择的过程,其结合理据在于语素内部潜在义素的吸引和融合。语素义和词义的关系可表现为:语素整合特征揭示词义;语素强化特征凸显词义;语素显化特征暗示词义;语素凝结词义参与新词;语素隐喻特征表达词义五个方面。 展开更多
关键词 语素义 词义 义素 “点” 词义演变
下载PDF
四种归肝经明目中药防护晶状体氧化损伤和上皮细胞凋亡的研究 被引量:28
12
作者 黄秀榕 祁明信 +1 位作者 汪朝阳 王勇 《中国临床药理学与治疗学》 CAS CSCD 2004年第4期441-446,共6页
目的 :探讨四种归肝经明目中药车前子、青葙子、菊花和熟地对晶状体氧化损伤及晶状体上皮细胞 (lensepithelialcell,LEC)凋亡的防护作用。方法 :将 2 1只 (42眼 )新西兰白兔晶状体分成 7组 :空白对照组、Fenton组、吡诺克辛钠 (PS)组和... 目的 :探讨四种归肝经明目中药车前子、青葙子、菊花和熟地对晶状体氧化损伤及晶状体上皮细胞 (lensepithelialcell,LEC)凋亡的防护作用。方法 :将 2 1只 (42眼 )新西兰白兔晶状体分成 7组 :空白对照组、Fenton组、吡诺克辛钠 (PS)组和车前子、青葙子、菊花及熟地四种归肝明目中药组。采用Fenton反应复制兔晶状体氧化损伤模型 ,在显微镜下观察各组晶状体的混浊程度 ,并分别测定晶状体酶性和非酶性抗氧化剂水平。同样 ,将 2 1只 (42眼 )SD大鼠双眼随机分成上述 7组 ,采用H2 O2 复制LEC凋亡模型 ,同时分别采用上述不同药物干预。应用TUNEL法检测LEC凋亡及凋亡率、透射电子显微镜观察LEC超微结构改变和凋亡小体形成。结果 :四种归肝明目中药组的晶状体混浊程度均明显轻于Fenton组 ;四种归肝明目中药组晶状体中酶性抗氧化剂的活性和非酶性抗氧化剂的含量均明显高于Fenton组。四种归肝明目中药组LEC凋亡率均显著低于H2 O2 组 (P <0 .0 1) ,且与PS组均有显著性差异 (P <0 .0 5 )。超微结构研究显示 ,H2 O2 组绝大多数LEC发生凋亡 ,并呈凋亡各期改变 ;四种归肝明目中药组均仅有少数LEC发生凋亡 ,并多为早期或中期的轻微改变。结论 :四种归肝经明目中药均可通过提高晶状体的抗氧化能力对抗晶状体的氧化损伤 ,抑? 展开更多
关键词 车前子 青葙子 菊花 熟地 晶状体 晶状体上皮细胞 氧化损伤 凋亡
下载PDF
4种归肝经明目中药对晶状体上皮细胞凋亡相关基因Bcl-2和Bax的调控 被引量:17
13
作者 黄秀榕 祁明信 +1 位作者 汪朝阳 王勇 《中国临床药理学与治疗学》 CAS CSCD 2004年第3期322-325,共4页
目的 :探讨 4种归肝经明目中药车前子、青葙子、菊花和熟地对实验性氧化损伤大鼠晶状体上皮细胞 (lensepithelialcell,LEC)凋亡相关基因Bcl 2和Bax的调控。方法 :将SD大鼠双眼随机分成 7组 :空白对照组、过氧化氢 (H2 O2 )组、吡诺克辛 ... 目的 :探讨 4种归肝经明目中药车前子、青葙子、菊花和熟地对实验性氧化损伤大鼠晶状体上皮细胞 (lensepithelialcell,LEC)凋亡相关基因Bcl 2和Bax的调控。方法 :将SD大鼠双眼随机分成 7组 :空白对照组、过氧化氢 (H2 O2 )组、吡诺克辛 (PS)组、车前子组、青葙子组、菊花组和熟地组。无菌操作摘除眼球并在手术显微镜下分离晶状体 ,使晶状体孵育在 30 0 μmol·L-1H2 O2 培养液中复制LEC凋亡模型 ,同时采用 4种归肝经明目中药干预 ,置二氧化碳培养箱共同孵育 2 4h。取晶状体前囊膜采用免疫组化法检测凋亡相关基因Bcl 2和Bax的蛋白表达并进行比较。结果 :正常SD大鼠LEC中Bcl 2和Bax均有表达 ,Bcl 2表达较Bax表达强 ;H2 O2组Bcl 2表达显著下调 ,Bax表达显著上调 (P <0 .0 1) ,Bcl 2 Bax比率下降 ;与H2 O2 组比较 ,4种归肝经明目中药可明显上调Bcl 2表达 ,下调Bax表达(P <0 .0 1) ,Bcl 2 Bax比率上升 ;PS与 4种归肝经明目中药的调节作用相似 ,但弱于 4种归肝经明目中药的作用 (P <0 .0 5 )。结论 :4种归肝经明目中药调控凋亡相关基因Bcl 2和Bax的表达可能是其抑制LEC凋亡的分子机制。 展开更多
关键词 中药 车前子 青葙子 菊花 熟地 晶状体上皮细胞 凋亡 基因
下载PDF
一种基于知网的词汇语义相似度改进计算方法 被引量:22
14
作者 蒋溢 丁优 +1 位作者 熊安萍 王化晶 《重庆邮电大学学报(自然科学版)》 北大核心 2009年第4期533-537,共5页
汉语词语语义相似度计算是中文信息处理中的一个关键问题。在知网(HowNet)环境下,通过分析影响词汇相似度计算结果的概念层次树结构,提出了一种同时考虑层次树深度、密度及语义路径等多因素的义元相似度计算方法,并应用于词汇相似度计... 汉语词语语义相似度计算是中文信息处理中的一个关键问题。在知网(HowNet)环境下,通过分析影响词汇相似度计算结果的概念层次树结构,提出了一种同时考虑层次树深度、密度及语义路径等多因素的义元相似度计算方法,并应用于词汇相似度计算过程。实验结果表明,该方法使词汇相似度计算结果更趋于合理,绝大部分结果更符合人们的日常体验,有效提高了词汇相似度计算结果的精确度和准确性。 展开更多
关键词 知网 语义 词汇相似度 义元
下载PDF
基于词汇语义计算的文本相似度研究 被引量:25
15
作者 余刚 裴仰军 +1 位作者 朱征宇 陈华月 《计算机工程与设计》 CSCD 北大核心 2006年第2期241-244,共4页
基于《知网》的词汇语义计算方法揭示了词汇间的语义信息。根据文本的向量空间模型描述形式,采用了基于《知网》的词汇语义计算方法来计算两篇文章向量的相关性,并用最大匹配算法来获得这两篇文章的相似度,通过该计算过程达到揭示文本... 基于《知网》的词汇语义计算方法揭示了词汇间的语义信息。根据文本的向量空间模型描述形式,采用了基于《知网》的词汇语义计算方法来计算两篇文章向量的相关性,并用最大匹配算法来获得这两篇文章的相似度,通过该计算过程达到揭示文本所蕴涵概念的目的,并用实验对该方法的有效性进行了验证,提出了今后的改进方向。 展开更多
关键词 《知网》 相似度计算 义原 匹配 向量空间模型
下载PDF
基于领域词语本体的短文本分类 被引量:41
16
作者 宁亚辉 樊兴华 吴渝 《计算机科学》 CSCD 北大核心 2009年第3期142-145,共4页
短文本自身长度较短,描述概念能力弱,常用文本分类方法都不太适用于短文本分类。提出了基于领域词语本体的短文本分类方法。首先抽取领域高频词作为特征词,借助知网从语义方面将特征词扩展为概念和义元,通过计算不同概念所包含相同义元... 短文本自身长度较短,描述概念能力弱,常用文本分类方法都不太适用于短文本分类。提出了基于领域词语本体的短文本分类方法。首先抽取领域高频词作为特征词,借助知网从语义方面将特征词扩展为概念和义元,通过计算不同概念所包含相同义元的信息量来衡量词的相似度,从而进行分类。对比实验表明,该方法在一定程度上弥补了短文本特征不足的缺点,且提高了准确率和召回率。 展开更多
关键词 短文本 本体 知网 文本分类 语义 义元
下载PDF
基于《知网》2008的词语相似度计算 被引量:7
17
作者 刘杰 郭宇 +1 位作者 汤世平 樊孝忠 《小型微型计算机系统》 CSCD 北大核心 2015年第8期1728-1733,共6页
《知网》是一部比较详尽的语义知识词典,含有丰富的语义信息和世界知识,研究其特定的语言描述方法是科学合理利用《知网》的关键.《知网》的知识系统描述语言方式也在不断改进和改善,已经从过去的线性方式发展为现在的立体、可嵌套的方... 《知网》是一部比较详尽的语义知识词典,含有丰富的语义信息和世界知识,研究其特定的语言描述方法是科学合理利用《知网》的关键.《知网》的知识系统描述语言方式也在不断改进和改善,已经从过去的线性方式发展为现在的立体、可嵌套的方式.因此,本文对《知网》2008版本所使用的描述方式进行介绍,并基于此描述方式实现了两种词语相似度计算方法.其中,方法一的设计思想源于《知网》2000版本的计算方法;方法二是对现有《知网》2008版本的计算方法进行了适当改进.实验结果表明,与现有《知网》2008版本的词语相似度计算方法进行比较,运用本文所实现两种方法,一些词语的相似度计算结果更为合理,从而更加符合人们的主观判断. 展开更多
关键词 义原 词语相似度 语义 《知网》
下载PDF
一种改进的基于《知网》的词语相似度计算方法 被引量:26
18
作者 林丽 薛方 任仲晟 《计算机应用》 CSCD 北大核心 2009年第1期217-220,共4页
《知网》是一部比较详尽的中文语义知识词典,共用1618个义原描述词语,故相关的词语用《知网》的概念描述时,有相同的义原。通过这一规律,与当前的词语相似度计算方法结合,提出改进的方法计算相关词对的相似度。并引入弱义原的概念,排除... 《知网》是一部比较详尽的中文语义知识词典,共用1618个义原描述词语,故相关的词语用《知网》的概念描述时,有相同的义原。通过这一规律,与当前的词语相似度计算方法结合,提出改进的方法计算相关词对的相似度。并引入弱义原的概念,排除弱义原对词语相似度计算的干扰。实验证明:该改进方法更符合人的直观,更适用于文本挖掘。 展开更多
关键词 《知网》 词语相似度 相关词对 弱义原
下载PDF
改进的基于《知网》的词汇语义相似度计算 被引量:58
19
作者 朱征宇 孙俊华 《计算机应用》 CSCD 北大核心 2013年第8期2276-2279,2288,共5页
针对当前基于《知网》的词汇语义相似度计算方法没有充分考虑知识库描述语言对概念描述的线性特征的情况,提出一种改进的词汇语义相似度计算方法。首先,充分考虑概念描述式中各义原之间的线性关系,提出一种位置相关的权重分配策略;然后... 针对当前基于《知网》的词汇语义相似度计算方法没有充分考虑知识库描述语言对概念描述的线性特征的情况,提出一种改进的词汇语义相似度计算方法。首先,充分考虑概念描述式中各义原之间的线性关系,提出一种位置相关的权重分配策略;然后,将所提出的策略结合二部图最大权匹配进行概念相似度计算。实验结果表明,采用改进方法得到的聚类结果 F值较对比方法平均提高了5%,从而验证了改进方法的合理性和有效性。 展开更多
关键词 知网 义原 概念 权重 语义相似度
下载PDF
基于《知网》的词语语义相似度算法 被引量:16
20
作者 王小林 王东 +2 位作者 杨思春 邰伟鹏 郑啸 《计算机工程》 CAS CSCD 2014年第12期177-181,共5页
词语语义相似度计算在信息检索、文本聚类、语义消歧等方面有着广泛的应用。基于《知网》提出一种词语语义相似度算法。设计一种义原分类,将义原分为第一基本义原、其他基本义原和间接义原3类。与以往义项相似度计算方法不同,根据不同... 词语语义相似度计算在信息检索、文本聚类、语义消歧等方面有着广泛的应用。基于《知网》提出一种词语语义相似度算法。设计一种义原分类,将义原分为第一基本义原、其他基本义原和间接义原3类。与以往义项相似度计算方法不同,根据不同类义原对义项相似度影响的大小,分别使用不同的义原相似度计算方法进行义项相似度的计算。利用词语之间第一基本义原相似度最高的义项组合进行词语语义相似度计算,剔除相似度较低的组合对词语语义相似度结果的影响。实验结果表明,该算法能有效提高运算效率和精确度。 展开更多
关键词 义原 义项 词语语义相似度 知识描述语言
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部