期刊文献+
共找到239篇文章
< 1 2 12 >
每页显示 20 50 100
A Machine Learning-Based Technique with Intelligent WordNet Lemmatize for Twitter Sentiment Analysis
1
作者 S.Saranya G.Usha 《Intelligent Automation & Soft Computing》 SCIE 2023年第4期339-352,共14页
Laterally with the birth of the Internet,the fast growth of mobile stra-tegies has democratised content production owing to the widespread usage of social media,resulting in a detonation of short informal writings.Twi... Laterally with the birth of the Internet,the fast growth of mobile stra-tegies has democratised content production owing to the widespread usage of social media,resulting in a detonation of short informal writings.Twitter is micro-blogging short text and social networking services,with posted millions of quick messages.Twitter analysis addresses the topic of interpreting users’tweets in terms of ideas,interests,and views in a range of settings andfields.This type of study can be useful for a variation of academics and applications that need knowing people’s perspectives on a given topic or event.Although sentiment examination of these texts is useful for a variety of reasons,it is typically seen as a difficult undertaking due to the fact that these messages are frequently short,informal,loud,and rich in linguistic ambiguities such as polysemy.Furthermore,most contemporary sentiment analysis algorithms are based on clean data.In this paper,we offers a machine-learning-based sentiment analysis method that extracts features from Term Frequency and Inverse Document Frequency(TF-IDF)and needs to apply deep intelligent wordnet lemmatize to improve the excellence of tweets by removing noise.We also utilise the Random Forest network to detect the emotion of a tweet.To authenticate the proposed approach performance,we conduct extensive tests on publically accessible datasets,and thefindings reveal that the suggested technique significantly outperforms sentiment classification in multi-class emotion text data. 展开更多
关键词 Random Forest sentiment analysis social media term frequency and inverse document frequency TWITTER wordnet lemmatize
下载PDF
中文WordNet的研究及实现 被引量:20
2
作者 张俐 李晶皎 +1 位作者 胡明涵 姚天顺 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第4期327-329,共3页
提出了一种从英文WordNet转换生成中文WordNet的方法 ,并设计实现了中文WordNet的转换生成系统·论述了在构造中文WordNet的语义网络时 ,概念结点的转换原则 ,中文词形与词义映射关系的重新聚合 ,以及转换生成中文WordNet的可行性... 提出了一种从英文WordNet转换生成中文WordNet的方法 ,并设计实现了中文WordNet的转换生成系统·论述了在构造中文WordNet的语义网络时 ,概念结点的转换原则 ,中文词形与词义映射关系的重新聚合 ,以及转换生成中文WordNet的可行性及转换中的相关问题 。 展开更多
关键词 wordnet 中文wordnet 同义词集合 概念映射
下载PDF
基于Sketch Engine和WordNet“雨”的概念隐喻研究
3
作者 黄锦云 《现代语言学》 2023年第6期2688-2694,共7页
雨是人们经常接触到的一种天气现象。人们通过各种不同的生活经历和历史、文化的积累,赋予它越来越深刻的意义。基于BNC语料库,本文借助Sketch Engine和WordNet收集所有与“雨”有关的表达式,并运用概念隐喻理论系统地分析英语中有关“... 雨是人们经常接触到的一种天气现象。人们通过各种不同的生活经历和历史、文化的积累,赋予它越来越深刻的意义。基于BNC语料库,本文借助Sketch Engine和WordNet收集所有与“雨”有关的表达式,并运用概念隐喻理论系统地分析英语中有关“雨”的隐喻表达。得出以下发现:1) “雨”作名词时的隐喻表达明显多于其作为动词时的表达。2) 9个“雨”的名词隐喻表达式的成因与体认有关,人们在特定的文化模式下形成了独特的认知。 展开更多
关键词 概念隐喻 Sketch Engine wordnet
下载PDF
基于知识图谱WordNet实现多数据集合并及其在YOLO9000中的应用
4
作者 褚云飞 陈业红 吴朝军 《电脑知识与技术》 2023年第4期10-13,39,共5页
超大规模训练数据及数据标注的高额代价是基于深度学习的目标检测算法面临的挑战之一,随着可检测目标类别数目的增加,情况变得尤其严重。YOLO9000提出一种目标检测和图像分类联合训练的方法,对COCO检测数据集和ImageNet分类数据集合并使... 超大规模训练数据及数据标注的高额代价是基于深度学习的目标检测算法面临的挑战之一,随着可检测目标类别数目的增加,情况变得尤其严重。YOLO9000提出一种目标检测和图像分类联合训练的方法,对COCO检测数据集和ImageNet分类数据集合并使用,提供了充足的训练数据,检测对象类别达到9000种。文章探讨YOLO9000中采用的数据集合并方法,即利用知识图谱WordNet信息,在两个不同类别的大型数据集上实现无冲突的图像标注策略。此方法以WordNet为语义检索,构建WordTree数据结构,辅以在层级间进行局域概率计算的多域Softmax函数设计,使得YOLO9000可以检测没有任何标记的检测数据的对象类别,大大提高了目标检测系统的检测数量,同时依然保持良好的实时性。本文论述的方法对于不同来源的数据集实施合并具有重要的指导意义。 展开更多
关键词 wordnet WordTree 深度学习 目标检测 YOLO9000 Softmax
下载PDF
基于MMR和WordNet的新闻文本摘要生成研究 被引量:1
5
作者 张琪 范永胜 金独亮 《西南师范大学学报(自然科学版)》 CAS 2023年第5期77-86,共10页
针对新闻文本摘要提取过程中,传统抽取式算法存在对文本内容概括不全面、摘要内容冗余、关键词提取时未考虑异词同义等问题,提出了一种基于最大边界相关算法(MMR)和词汇语义网(WordNet)的新闻文本摘要生成算法--WMMR.该算法综合考虑文... 针对新闻文本摘要提取过程中,传统抽取式算法存在对文本内容概括不全面、摘要内容冗余、关键词提取时未考虑异词同义等问题,提出了一种基于最大边界相关算法(MMR)和词汇语义网(WordNet)的新闻文本摘要生成算法--WMMR.该算法综合考虑文本相似度、关键词、句子位置信息、线索词等特征对句子权重的影响,从而优化MMR算法中的句子得分,并在计算关键词得分时引入WordNet合并同义词.在NLPCC2017公开数据集上验证本文算法的有效性,结果表明WMMR算法的ROUGE值相较于TextRank算法提升4个百分点,相较于MMR算法提升7个百分点.在神策杯2018与SogouCS公开数据集上验证本文算法的普适性,结果表明WMMR算法的ROUGE值相较于传统TextRank,MMR等算法均有提升,证明WMMR算法有效提升了生成摘要的质量. 展开更多
关键词 新闻文本摘要 抽取式算法 最大边界相关算法 词汇语义网 异词同义
下载PDF
一种基于WordNet的短文本语义相似性算法 被引量:34
6
作者 翟延冬 王康平 +2 位作者 张东娜 黄岚 周春光 《电子学报》 EI CAS CSCD 北大核心 2012年第3期617-620,共4页
短文本语义相似性计算在文献检索、信息抽取、文本挖掘等方面应用日益广泛.本文提出了一种短文本语义相似性计算算法ST-CW.此算法使用WordNet和Brown文集来计算文本中的概念相似性,在此基础上提出了一个新的方法综合考虑概念、句法等信... 短文本语义相似性计算在文献检索、信息抽取、文本挖掘等方面应用日益广泛.本文提出了一种短文本语义相似性计算算法ST-CW.此算法使用WordNet和Brown文集来计算文本中的概念相似性,在此基础上提出了一个新的方法综合考虑概念、句法等信息来计算短文本的语义相似性.在R&B及Miller数据集上进行实验,实验结果验证了算法的有效性. 展开更多
关键词 短文本语义相似性 wordnet 基于文集的方法
下载PDF
WordNet综述 被引量:33
7
作者 姚天顺 张俐 高竹 《语言文字应用》 CSSCI 北大核心 2001年第1期27-32,共6页
WordNet是一个在线的词典参照系统 ,它是在当前基于人类词汇记忆的心理语言学理论推动下产生的。这个系统中的名词、动词和形容词都聚类为代表某一基本词汇概念的同义词集合 。
关键词 词典参照系统 心理语言学 同义词 wordnet 词汇
下载PDF
基于WordNet和自然语言处理技术的半自动领域本体构建 被引量:15
8
作者 徐力斌 刘宗田 +1 位作者 周文 宋二伟 《计算机科学》 CSCD 北大核心 2007年第6期219-222,共4页
现有的大多数本体都是通过手工构建的,然而,本体的构建是一项非常费时费力的过程,近年来有关如何半自动地构建领域本体的研究越来越多。本文提出了一种基于WordNet和自然语言处理技术的领域本体半自动构建方法,该方法能够大大提高本体... 现有的大多数本体都是通过手工构建的,然而,本体的构建是一项非常费时费力的过程,近年来有关如何半自动地构建领域本体的研究越来越多。本文提出了一种基于WordNet和自然语言处理技术的领域本体半自动构建方法,该方法能够大大提高本体的构建效率,并且一定程度上能够保证结果本体的质量。实验表明,本文的方法在一定程度上令本体的生成过程实现自动化。 展开更多
关键词 领域本体 语义单元 wordnet 自然语言处理
下载PDF
基于边权重的WordNet词语相似度计算 被引量:10
9
作者 郭小华 彭琦 +1 位作者 邓涵 朱新华 《计算机工程与应用》 CSCD 北大核心 2018年第1期172-178,共7页
针对目前词语相似度算法中普遍存在的信息源单一化,计算结果非线性偏高,以及计算性能和效率的不一致的缺陷,提出了一种基于边权重的WordNet词语相似度的计算方法。该方法在路径与深度的基础上,通过边权重改善WordNet结构中的层次不均匀... 针对目前词语相似度算法中普遍存在的信息源单一化,计算结果非线性偏高,以及计算性能和效率的不一致的缺陷,提出了一种基于边权重的WordNet词语相似度的计算方法。该方法在路径与深度的基础上,通过边权重改善WordNet结构中的层次不均匀性,引入编码概念唯一标识两个概念间的相似度,并利用余弦函数修正计算结果的非线性偏差。实验结果表明,对于MC30和RG65测试集,使用该方法计算的词语相似度值与人工判定值计算得到的Pearson相关系数均达到0.87;此外,该方法在计算性能和效率上均保持较高水平。 展开更多
关键词 词语相似度 边权重 wordnet 编码
下载PDF
基于WordNet的中泰文跨语言文本相似度计算 被引量:12
10
作者 石杰 周兰江 +1 位作者 线岩团 余正涛 《中文信息学报》 CSCD 北大核心 2016年第4期65-70,共6页
文本相似度在信息检索、文本挖掘、抄袭检测等领域有着广泛的应用。目前,大多数研究都只是针对同一种语言的文本相似度计算,关于跨语言文本相似度计算的研究则很少,不同语言之间的差异使得跨语言文本相似度计算很困难,针对这种情况,该... 文本相似度在信息检索、文本挖掘、抄袭检测等领域有着广泛的应用。目前,大多数研究都只是针对同一种语言的文本相似度计算,关于跨语言文本相似度计算的研究则很少,不同语言之间的差异使得跨语言文本相似度计算很困难,针对这种情况,该文提出一种基于WordNet的中泰文跨语言文本相似度的计算方法。首先对中泰文本进行预处理和特征选择,然后利用语义词典WordNet将中泰文本转换成中间层语言,最后在中间层上计算中泰文本的相似度。实验结果表明,该方法准确率达到82%。 展开更多
关键词 wordnet 中间层语言 跨语言文本相似度
下载PDF
基于Wordnet关系数据库的专利本体半自动构建研究 被引量:6
11
作者 吴鹏 马文虎 严明 《情报学报》 CSSCI 北大核心 2011年第6期598-604,共7页
专利本体满足用户对专利信息系统检索的语义需求,但是目前缺乏有效的构建方法,基于WordNet关系数据库的本体构建方法可以根据领域概念直接从关系数据库中获得实体的关系,并扩展原有的领域概念,实现专利领域本体的半自动构建。本文提出... 专利本体满足用户对专利信息系统检索的语义需求,但是目前缺乏有效的构建方法,基于WordNet关系数据库的本体构建方法可以根据领域概念直接从关系数据库中获得实体的关系,并扩展原有的领域概念,实现专利领域本体的半自动构建。本文提出了一种基于WordNet关系数据库的本体半自动构建方法,其核心思想是以WordNet关系数据库为主要知识来源,来生成可被本体工具编辑的OWL格式文件,包括两个部分:专利本体数据库半自动构建系统和基于关系数据库本体生成器,本文分析了专利本体数据库半自动构建系统模型,以及专利本体生成与转换流程,并结合实例进行专利本体的构建和应用。 展开更多
关键词 wordnet 专利本体 关系发现 概念发现
下载PDF
基于WordNet概念向量空间模型的文本分类 被引量:16
12
作者 张剑 李春平 《计算机工程与应用》 CSCD 北大核心 2006年第4期174-178,共5页
文章提出了一种文本特征提取方法,以WordNet语言本体库为基础,以同义词集合概念代替词条,同时考虑同义词集合间的上下位关系,建立文本的概念向量空间模型作为文本特征向量,使得在训练过程中能够提取出代表类别的高层次信息。实验结果表... 文章提出了一种文本特征提取方法,以WordNet语言本体库为基础,以同义词集合概念代替词条,同时考虑同义词集合间的上下位关系,建立文本的概念向量空间模型作为文本特征向量,使得在训练过程中能够提取出代表类别的高层次信息。实验结果表明,当训练文本集合很小时,方法能够较大地提高文本的分类准确率。 展开更多
关键词 文本自动分类 wordnet 概念向量 向量空间模型
下载PDF
基于WordNet重用的领域本体构建方法 被引量:11
13
作者 赵天忠 苗壮 +2 位作者 张亚非 徐伟光 陆建江 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第19期4583-4586,4598,共5页
构建本体是开发基于语义信息系统的重要步骤,提出了一种基于WordNet重用的领域本体构建方法。该方法分析了WordNet的结构和语义关系,将WordNet抽象为图模型,从中抽取以领域术语为节点的子图,得到一个领域子本体,再利用编辑工具对其进行... 构建本体是开发基于语义信息系统的重要步骤,提出了一种基于WordNet重用的领域本体构建方法。该方法分析了WordNet的结构和语义关系,将WordNet抽象为图模型,从中抽取以领域术语为节点的子图,得到一个领域子本体,再利用编辑工具对其进行修改和完善。实验结果表明,该方法可以重用WordNet的结构并从中获取领域知识,并半自动地快速构建领域本体。 展开更多
关键词 wordnet 本体 重用 图模型
下载PDF
WordNet中基于IC的概念语义相似度算法 被引量:5
14
作者 王艳娜 周子力 何艳 《计算机工程》 CAS CSCD 北大核心 2011年第22期42-44,共3页
提出一种计算WordNet中概念间语义相似度的算法,该算法同时考虑概念的信息内容(IC)以及2个概念在WordNet is_a关系分类树中的距离信息,由此提高算法性能。给出一种计算概念IC值的新方法,通过考虑概念的子节点数及概念所处WordNet分类树... 提出一种计算WordNet中概念间语义相似度的算法,该算法同时考虑概念的信息内容(IC)以及2个概念在WordNet is_a关系分类树中的距离信息,由此提高算法性能。给出一种计算概念IC值的新方法,通过考虑概念的子节点数及概念所处WordNet分类树中的深度,使计算结果更精确。与其他5种语义相似度算法的比较结果表明,该算法能够求得更准确的相似度。 展开更多
关键词 信息内容 wordnet本体 语义相似度 子节点 分类树
下载PDF
基于中文WordNet的中英文词语相似度计算 被引量:21
15
作者 吴思颖 吴扬扬 《郑州大学学报(理学版)》 CAS 北大核心 2010年第2期66-69,共4页
介绍一种基于中文WordNet的中英文词语相似度计算方法.在WordNet同义词集的上下位关系图中,引入了距离、密度、深度3个因素来估计同义词集之间的相似度,采用一个自适应的方案来解决候选同义词集组合的权重和取舍问题.实现了一个可以计算... 介绍一种基于中文WordNet的中英文词语相似度计算方法.在WordNet同义词集的上下位关系图中,引入了距离、密度、深度3个因素来估计同义词集之间的相似度,采用一个自适应的方案来解决候选同义词集组合的权重和取舍问题.实现了一个可以计算英-英、汉-英、汉-汉词语之间相似度的算法,所得结果比较符合人们对词语的理解. 展开更多
关键词 中文wordnet 词语相似度 语义相似度
下载PDF
基于WordNet的无导词义消歧方法 被引量:6
16
作者 王瑞琴 孔繁胜 潘俊 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2010年第4期732-737,共6页
有导词义消歧机器学习方法由于需要大量人力进行词义标注,难以适用于大规模词义消歧任务.提出一种避免人工词义标注的无导消歧方法.该方法综合利用WordNet知识库中的多种知识源(包括:词义定义描述、使用实例、结构化语义关系、领域属性... 有导词义消歧机器学习方法由于需要大量人力进行词义标注,难以适用于大规模词义消歧任务.提出一种避免人工词义标注的无导消歧方法.该方法综合利用WordNet知识库中的多种知识源(包括:词义定义描述、使用实例、结构化语义关系、领域属性等)描述歧义词的词义信息,生成词义的"代表词汇集"和"领域代表词汇集",结合词汇的词频分布信息和所处的上下文环境进行词义判定.利用通用测试集Senseval-3对6个典型的无导词义消歧方法进行开放实验,该方法取得平均正确率为49.93%的消歧结果. 展开更多
关键词 词义消歧 wordnet知识库 结构化语义关系
下载PDF
FrameNet、WordNet、VerbNet比较研究 被引量:10
17
作者 贾君枝 董刚 《情报科学》 CSSCI 北大核心 2007年第11期1682-1686,共5页
FrameNet、WordNet、VerbNet作为语义型词典,在自然语言处理及其电子词典编纂领域得到广泛应用。这三种语义类型的词典各自从不同侧面表达词汇概念及语义关系,彼此之间互为补充,并且建立相互之间的映射,共同为语义分析提供了丰富知识资... FrameNet、WordNet、VerbNet作为语义型词典,在自然语言处理及其电子词典编纂领域得到广泛应用。这三种语义类型的词典各自从不同侧面表达词汇概念及语义关系,彼此之间互为补充,并且建立相互之间的映射,共同为语义分析提供了丰富知识资源。但这些语义型词典构建理论基础不同,形成各自明显的特征,因此文章从理论基础、组织结构、语义关系、应用范围四个层面上对这三种语义词典进行具体比较分析,明确其各自侧重点及差异,以帮助词典使用者及语言信息处理人员更好地应用。 展开更多
关键词 FRAMENET wordnet VerbNet 比较研究
下载PDF
基于WordNet的关联数据本体映射研究 被引量:7
18
作者 潘有能 刘朝霞 《情报杂志》 CSSCI 北大核心 2013年第2期99-102,共4页
随着越来越多的数据集以关联数据的形式发布到数据网络中,不同数据集之间的本体映射成为当前的研究热点。本文以WordNet为基础,通过对从数据网络中获取的XML格式的本体文档进行解析以获取待映射概念,并建立待映射概念节点的父概念树和... 随着越来越多的数据集以关联数据的形式发布到数据网络中,不同数据集之间的本体映射成为当前的研究热点。本文以WordNet为基础,通过对从数据网络中获取的XML格式的本体文档进行解析以获取待映射概念,并建立待映射概念节点的父概念树和子概念树并计算其相似度,提出了一种新的关联数据本体映射方法。 展开更多
关键词 关联数据 本体映射 wordnet DOM 相似度计算 概念树
下载PDF
WNCT:一种WordNet概念自动翻译方法 被引量:6
19
作者 王石 曹存根 《中文信息学报》 CSCD 北大核心 2009年第4期63-70,94,共9页
WordNet是在自然语言处理领域有重要作用的英语词汇知识库,该文提出了一种将WordNet中词汇概念自动翻译为中文的方法。首先,利用电子词典和术语翻译工具将英语词汇在义项的粒度上翻译为中文;其次,将特定概念中词汇的正确义项选择看作分... WordNet是在自然语言处理领域有重要作用的英语词汇知识库,该文提出了一种将WordNet中词汇概念自动翻译为中文的方法。首先,利用电子词典和术语翻译工具将英语词汇在义项的粒度上翻译为中文;其次,将特定概念中词汇的正确义项选择看作分类问题,归纳出基于翻译唯一性、概念内和概念间翻译交集、中文短语结构规则,以及基于PMI的翻译相关性共12个特征,训练分类模型实现正确义项的选择。实验结果表明,该方法对WordNet 3.0中概念翻译的覆盖率为85.21%,准确率为81.37%。 展开更多
关键词 人工智能 机器翻译 wordnet翻译 词汇翻译 翻译消歧 中文词汇知识库 中文信息处理
下载PDF
WordNet与BNC介入下的第二语言心理词汇联系模式实证研究 被引量:4
20
作者 李小撒 王文宇 《语言科学》 CSSCI 北大核心 2016年第1期74-84,共11页
文章旨在通过词汇联想测试手段探索中国英语学习者心理词汇的联系模式。八十四名美国与中国大学生分别独立完成英语词汇联想测试。数据收集结束后,研究者借助WordNet及BNC对联想测试的反应词加以分类。研究结果表明:第一,英语本族语者... 文章旨在通过词汇联想测试手段探索中国英语学习者心理词汇的联系模式。八十四名美国与中国大学生分别独立完成英语词汇联想测试。数据收集结束后,研究者借助WordNet及BNC对联想测试的反应词加以分类。研究结果表明:第一,英语本族语者纵聚合联系、横组合联系与百科式联系呈逐级递减态势,而学习者这三种联系则呈现U型态势,横组合联系比例偏低,并且横组合联系词整体提取速度较慢;第二,高水平学习者纵聚合词汇联系的比例显著高于中等水平的学习者,而两组学习者的横组合联系却没有显著差异,这在某种程度上验证了语言间概念共享节点远多于搭配共享节点。 展开更多
关键词 心理词汇 wordnet BNC 纵聚合联系 横组合联系
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部