期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
融合多窗口特征的词对标记情感三元组抽取
1
作者 林杰 刘建华 +2 位作者 陈林颖 郑智雄 孙水华 《计算机工程与应用》 CSCD 北大核心 2024年第16期159-167,共9页
方面情感三元组抽取旨在从句子中抽取方面词、意见词和对应的情感极性。针对目前研究未充分挖掘局部上下文语义信息,缺乏对局部范围内的方面意见词对关联学习,以及遭受错误传播等问题,提出一种融合多窗口特征的词对标记情感三元组抽取... 方面情感三元组抽取旨在从句子中抽取方面词、意见词和对应的情感极性。针对目前研究未充分挖掘局部上下文语义信息,缺乏对局部范围内的方面意见词对关联学习,以及遭受错误传播等问题,提出一种融合多窗口特征的词对标记情感三元组抽取模型。该模型利用BERT对句子信息进行处理,获取句子编码特征,采用多窗口特征学习机制学习局部范围内的情感特征关联,并挖掘句子包含的潜在语义信息,使用多头注意力图转换模块将所学习到的特征聚合成标记分布概率,利用改进的词对标记方案标记句子并解码得到三元组。在SemEval-ASTE的四个基准数据集上进行实验分析,相比GTS-BERT模型,所提模型在三元组抽取任务上F1分值分别提高了2.33、6.57、2.97、4.84个百分点。实验结果表明,所提模型可以有效学习局部语义信息,准确标记方面意见跨度,较为精确地提取情感三元组。 展开更多
关键词 方面情感三元组 情感极性 特征学习 多头注意力 词对标记方案
下载PDF
一种针对对话文本属性级情感信息抽取的词对关系建模方法
2
作者 曾涛 王晶晶 +1 位作者 张涵 刘一丁 《计算机工程与科学》 CSCD 北大核心 2024年第12期2239-2251,共13页
属性级情感分析旨在获取文本中包含的细粒度情感信息,因其应用广泛而备受关注。然而传统的属性级情感分析研究大多基于非交互场景下的普通评价文本,针对对话文本的交互式场景下属性级情感分析的研究工作则非常稀缺。基于此现状,提出了... 属性级情感分析旨在获取文本中包含的细粒度情感信息,因其应用广泛而备受关注。然而传统的属性级情感分析研究大多基于非交互场景下的普通评价文本,针对对话文本的交互式场景下属性级情感分析的研究工作则非常稀缺。基于此现状,提出了针对对话文本交互式场景下的属性级情感信息联合抽取任务,获取由目标属性、意见表达以及意见对应的情感极性构成的完整的细粒度情感信息三元组,旨在通过一个任务获取交互式对话中最后一条发言包含的完整细粒度情感信息。针对该任务设计了一种端到端的基于词对关系建模的抽取方法,对词对间关系进行建模后将对话文本映射成一个有向图,将解码过程转换为在有向图中寻找特定环结构的过程。为了提升词对关系建模的准确率,设计了一种新颖的模型结构,在构建词对关系表征时融合词对相对距离信息与对话轮次信息,并通过多粒度二维卷积加强词对间的信息交互。此外,设计了一种动态损失权重方法,有效缓解了对话文本中词对关系类别分布不平衡问题。实验结果显示,本文方法与选用的强基线方法对比,F 1分数平均提升了7.70%,最高提升了15.05%。 展开更多
关键词 属性级情感分析 细粒度情感信息抽取 对话文本 词对关系建模
下载PDF
在线产品评论用户满意度综合评价研究 被引量:17
3
作者 吕品 钟珞 唐琨皓 《电子学报》 EI CAS CSCD 北大核心 2014年第4期740-746,共7页
文中提出一种基于灰色理论的用户满意度评价方法。基本思想:根据对各种类型的产品和对象(如旅社、酒店等)的评价具有相对性、不确定性和模糊性(这三种特性统称为灰色性)的特征,将用户满意度分为很满意,满意,一般,不满意和很不满意等五... 文中提出一种基于灰色理论的用户满意度评价方法。基本思想:根据对各种类型的产品和对象(如旅社、酒店等)的评价具有相对性、不确定性和模糊性(这三种特性统称为灰色性)的特征,将用户满意度分为很满意,满意,一般,不满意和很不满意等五种类型,克服了已有方法将情感分为满意和不满意的粗粒度定性评价缺陷。构建了用户满意度灰色评估模型,为了扩大对各类型产品评价的适应性,引用了相似性情感词匹配词对和对象对应产品的对应性热点词匹配词对来构建用户对产品和对象的满意度评测指标。以实际产品为实验数据对象,仿真结果表明:提出的方法不仅能获得产品或对象的总体满意度结论值VB,还能得到各项评测指标(影响产品或对象的因素)的量化评估结论值VBi,有效解决了定性评价方法的不足,为消费者提供了更详细的消费指导,为商业机构提供了有针对性的生产销售措施。 展开更多
关键词 在线产品评论 满意度评价 灰色理论 观点挖掘 相似性情感词匹配词对 对应性热点词匹配词对
下载PDF
基于文本语义和表情倾向的微博情感分析方法 被引量:23
4
作者 王文 王树锋 李洪华 《南京理工大学学报》 EI CAS CSCD 北大核心 2014年第6期733-738,749,共7页
针对基于机器学习的中文微博情感分析方法存在处理过程复杂、判断准确率低等问题,该文提出了一种新的情感分析方法。将微博爬虫和Web应用程序编程接口(API)相结合,对动态微博数据进行收集和预处理。基于NTUSD和How Net中文情感词典的微... 针对基于机器学习的中文微博情感分析方法存在处理过程复杂、判断准确率低等问题,该文提出了一种新的情感分析方法。将微博爬虫和Web应用程序编程接口(API)相结合,对动态微博数据进行收集和预处理。基于NTUSD和How Net中文情感词典的微博情感词的抽取和分类,计算词语语义相似度和倾向性。综合考虑表情、文本情感倾向的加权和正面情感增强等因素。实验结果表明:表情情感倾向对微博情感倾向起着重要作用;在表情和文本情感倾向比值固定的情况下,调整因素和中性区间的选择会对情感倾向判断准确率产生影响;通过与基于How Net语义相似度的计算模型比较,该文方法使得情感倾向判断准确率提高约5%。 展开更多
关键词 文本语义 表情倾向 微博 情感分析 机器学习 微博爬虫 应用程序编程接口 情感词典 语义相似度
下载PDF
基于语义模式与词汇情感倾向的舆情态势研究 被引量:14
5
作者 王铁套 王国营 +1 位作者 陈越 黄惠新 《计算机工程与设计》 CSCD 北大核心 2012年第1期74-77,共4页
针对互联网上的舆论信息传播速度快,对社会造成巨大影响这一问题,社会管理者应该进行及时的舆情分析,从而进行有效控制和引导,避免形成更大的社会影响和危害。为了从网络信息中分析网络舆情的发展态势,将文本情感分析技术应用于网络舆... 针对互联网上的舆论信息传播速度快,对社会造成巨大影响这一问题,社会管理者应该进行及时的舆情分析,从而进行有效控制和引导,避免形成更大的社会影响和危害。为了从网络信息中分析网络舆情的发展态势,将文本情感分析技术应用于网络舆情研究。针对网络舆情的话题评论,采用语义模式和词汇情感倾向相结合的方法,并形成了一种判定算法,该算法比较全面地判定话题评论的情感倾向性,把握网络舆情的正面或负面导向性。实验结果表明了该方法的有效性和准确性。 展开更多
关键词 网络舆情 语义模式 情感倾向性 语义相似度 中文分词 知网
下载PDF
基于语义与最大匹配度的短文本分类研究 被引量:18
6
作者 孙建旺 吕学强 张雷瀚 《计算机工程与设计》 CSCD 北大核心 2013年第10期3613-3618,共6页
为了解决基于VSM方法在进行短文本分类时存在的严重数据稀疏问题,提出了基于语义与最大匹配度的短文本分类方法。以《知网》为知识源,设计了基于义原距离、义原深度与区域密度的义原相似度计算方法,实现基于词类的词语相似度计算;提出... 为了解决基于VSM方法在进行短文本分类时存在的严重数据稀疏问题,提出了基于语义与最大匹配度的短文本分类方法。以《知网》为知识源,设计了基于义原距离、义原深度与区域密度的义原相似度计算方法,实现基于词类的词语相似度计算;提出了基于语义与最大匹配度的方法计算短文本相似度,应用KNN算法进行短文本分类。实验结果表明,该方法与基于语义、基于AD_NB等方法相比,正确率、召回率和F值均得到了明显的提高。 展开更多
关键词 短文本分类 义原相似度 词语相似度 语义 最大匹配度 KNN算法
下载PDF
语义关系相似度计算中的数据标准化方法比较 被引量:16
7
作者 王正鹏 谢志鹏 邱培超 《计算机工程》 CAS CSCD 2012年第10期38-40,共3页
研究数据标准化处理对语义关系相似度计算的影响。从大规模文本语料中提取词法模式,生成词对-词法模式矩阵,利用3种数据标准化方式对矩阵数据进行处理,通过规律学习方法对隐含语义关系相似度进行计算。实验结果表明,不做数据标准化、z-s... 研究数据标准化处理对语义关系相似度计算的影响。从大规模文本语料中提取词法模式,生成词对-词法模式矩阵,利用3种数据标准化方式对矩阵数据进行处理,通过规律学习方法对隐含语义关系相似度进行计算。实验结果表明,不做数据标准化、z-score标准化、范围标准化、熵加权标准化处理的分类准确率分别为0.87、0.89、0.95、0.96。 展开更多
关键词 语义关系 相似度 词法模式 词对-词法模式矩阵 数据标准化 WEB数据挖掘
下载PDF
基于语义角色标注的汉语句子相似度算法 被引量:11
8
作者 田堃 柯永红 穗志方 《中文信息学报》 CSCD 北大核心 2016年第6期126-132,共7页
在语义角色标注过程中,经常需要检索相似的已标注语料,以便进行参考和分析。现有方法未能充分利用动词及其支配的成分信息,无法满足语义角色标注的相似句检索需求。基于此,本文提出一种新的汉语句子相似度计算方法。该方法基于已标注好... 在语义角色标注过程中,经常需要检索相似的已标注语料,以便进行参考和分析。现有方法未能充分利用动词及其支配的成分信息,无法满足语义角色标注的相似句检索需求。基于此,本文提出一种新的汉语句子相似度计算方法。该方法基于已标注好语义角色的语料资源,以动词为分析核心,通过语义角色分析、标注句型的相似匹配、标注句型间相似度计算等步骤来实现句子语义的相似度量。为达到更好的实验效果,论文还综合比较了基于知网、词向量等多种计算词语相似度的算法,通过分析与实验对比,将实验效果最好的算法应用到句子相似度计算的研究中。实验结果显示,基于语义角色标注的句子相似度计算方法相对传统方法获得了更好的测试结果。 展开更多
关键词 语义角色标注 词语相似度 知网 词向量 标注句型匹配
下载PDF
基于对偶编码的中文分词算法 被引量:6
9
作者 张冰怡 魏博 +2 位作者 陈建成 魏杰 饶国政 《南京理工大学学报》 EI CAS CSCD 北大核心 2014年第4期526-530,共5页
为了提高中文分词算法的切分速度和存储效率,提出一种基于对偶编码的特征匹配算法。由中文分词的字符集和字符相邻关系提取特征值,根据此特征值在中文分词词典中进行快速匹配,基于字符的位置相邻关系提取特征值,支持模糊匹配,因此无需... 为了提高中文分词算法的切分速度和存储效率,提出一种基于对偶编码的特征匹配算法。由中文分词的字符集和字符相邻关系提取特征值,根据此特征值在中文分词词典中进行快速匹配,基于字符的位置相邻关系提取特征值,支持模糊匹配,因此无需对多字词进行单独匹配,从而有效节省匹配时间。实验仿真表明,该算法可以降低特征存储空间,有效提高中文分词精度和效率。 展开更多
关键词 对偶编码 中文分词 特征匹配 数据压缩 散列 特征值 模糊匹配
下载PDF
WCONS+:一种基于WCONS的本体集成方法 被引量:5
10
作者 卢胜军 李法勇 +1 位作者 钱建军 真溱 《现代图书情报技术》 CSSCI 北大核心 2009年第2期18-22,共5页
提出一种本体集成方法WCONS+,将本体集成过程分为准备、映射、集成和检测4个阶段,并通过集成军用飞机本体和电子对抗装备本体对这一方法进行了实验,结果初步证明该方法的有效性。
关键词 本体集成 本体映射 本体匹配 词语相似度 语境相似度
下载PDF
面向倾向性分析的基于词聚类的基准词选择方法 被引量:7
11
作者 彭学仕 孙春华 《计算机应用研究》 CSCD 北大核心 2011年第1期114-116,共3页
现有的基准词选择方法存在着随机性和主观性的缺陷,提出了一种基于词聚类的基准词的选择方法:从目标领域本体中选出一组初始种子词进行扩展,聚类得出二代种子词,对二代种子词再进行扩展、聚类,依次迭代直至得到最优的聚类种子词,并作为... 现有的基准词选择方法存在着随机性和主观性的缺陷,提出了一种基于词聚类的基准词的选择方法:从目标领域本体中选出一组初始种子词进行扩展,聚类得出二代种子词,对二代种子词再进行扩展、聚类,依次迭代直至得到最优的聚类种子词,并作为最终选取的基准词。实验结果表明该方法提取的基准词在词的情感倾向分类中具有较高的准确率。 展开更多
关键词 基准词 词汇情感倾向 词的相似度 词的聚类 领域本体
下载PDF
面向机构知识库结构化数据的文本相似度评价算法 被引量:6
12
作者 吴旭 郭芳毓 +1 位作者 颉夏青 许晋 《信息网络安全》 2015年第5期16-20,共5页
机构知识库是一个以机构成员在工作过程中所创建的各种数字化产品为内容,以网络为依托,以收集、整理、保存、检索、提供利用为目的的知识库,其中文本数据集多呈现结构化,且具有离散性。而个性化推荐技术可以有效提高机构知识库资源的曝... 机构知识库是一个以机构成员在工作过程中所创建的各种数字化产品为内容,以网络为依托,以收集、整理、保存、检索、提供利用为目的的知识库,其中文本数据集多呈现结构化,且具有离散性。而个性化推荐技术可以有效提高机构知识库资源的曝光率和利用率,将现有的"用户主导行为"模式转变为"以知识驱动行为"模式,使得机构知识库用户能够更高效地获取学术信息。为此,文章在研究国内外已有的相似性度量方法的基础上,引入不同权重词语对整体相似度有不同影响的思想,提出一种基于TF-IDF和词语匹配的文本相似度评价算法。通过分析DC(Dublin Core)元数据格式,筛选其中有效数据,计算特定词语在指定域中的权重并统计匹配次数,在文本长度归一化的基础上进行文本相似度计算。实验以手动建立文本测试集进行相似度计算,经统计分析,表明该算法能够对结构化离散文本数据的相似度进行合理计算,降低了机构知识库离散数据集在进行相似度计算时的向量维度,计算结果与实际数据吻合较好,具有可行性和实际应用价值。 展开更多
关键词 机构知识库 离散化数据 结构化数据 词语匹配 TF-IDF 文本相似度
下载PDF
基于局部字袋模型的三维部分形状检索方法 被引量:2
13
作者 刘一 王旭磊 查红彬 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第6期965-972,共8页
提出一种新的基于"局部字袋混合模型"表示的三维部分形状检索方法。该方法首先定义一种支撑范围相互重叠的三维局部字袋模型表示,并在该形状表示下,给出"推土机距离"的基础距离度量的定义,并运用"层次匹配核&q... 提出一种新的基于"局部字袋混合模型"表示的三维部分形状检索方法。该方法首先定义一种支撑范围相互重叠的三维局部字袋模型表示,并在该形状表示下,给出"推土机距离"的基础距离度量的定义,并运用"层次匹配核"方法计算三维模型间部分相似性的具体步骤,显著提高了原方法的效率和鲁棒性。在理论上证明了所提出的距离度量改进了整体字袋模型低估三维形状之间距离的问题。实验结果显示了该方法对三维部分形状检索的有效性。 展开更多
关键词 字袋模型 三维形状检索 推土机距离 层次匹配核 部分相似性度量
下载PDF
融合语义依存关联对的句子相似度的负面在线评论案例推理 被引量:2
14
作者 冯进展 蔡淑琴 《计算机应用研究》 CSCD 北大核心 2021年第7期2096-2102,共7页
及时有效地处理负面在线评论能提高企业的声誉和维护消费者对企业的信任,而面对大量的负面在线评论,企业很难在短期内及时有效回复。根据在线评论是短文本的特点,运用基于句子相似度的负面在线评论进行案例推理处理。针对负面在线评论... 及时有效地处理负面在线评论能提高企业的声誉和维护消费者对企业的信任,而面对大量的负面在线评论,企业很难在短期内及时有效回复。根据在线评论是短文本的特点,运用基于句子相似度的负面在线评论进行案例推理处理。针对负面在线评论句子相似度计算问题,抽取句子中评价对象词和评价词作为关键词,同时考虑评价词的修饰词和句子语义依存关联对。除提出的关键词、修饰词、语义依存分析关联对三个特征外,再融入句子中的公共词、语义等两个特征,提出一种融合公共词、关键词、修饰词、语义、语义依存分析关联对等五个特征的句子相似度计算方法,检索相似负面评论句子的案例。通过实验验证,融入多特征的句子相似度计算优于常见句子相似度计算方法,其准确率为83.3%,有效地检索案例句子集并自动推荐回复方案。 展开更多
关键词 负面在线评论 语义依存分析关联对 关键词 句子相似度 案例推理
下载PDF
基于改进型最大匹配法的教学资源自然语义查询 被引量:1
15
作者 曾立胜 刘志勤 《计算机工程与设计》 CSCD 北大核心 2008年第6期1559-1561,1564,共4页
中文智能信息检索中的关键是自然语言处理技术,汉语自动分词技术是中文自然语言处理的基础。基于机械匹配的分词方法简洁、实用,但该方法切分精度不高且无法有效克服切分歧义。针对机械匹配最大匹配算法的应用进行了改进,并将相似串应... 中文智能信息检索中的关键是自然语言处理技术,汉语自动分词技术是中文自然语言处理的基础。基于机械匹配的分词方法简洁、实用,但该方法切分精度不高且无法有效克服切分歧义。针对机械匹配最大匹配算法的应用进行了改进,并将相似串应用于教学资源自然语义查询。 展开更多
关键词 汉语分词技术 相似串 自然查询 最大匹配算法 教学资源 信息检索
下载PDF
基于贝叶斯信念网络的多案例库检索方法 被引量:1
16
作者 李明 刘鲁 +1 位作者 苗蕊 朱延秋 《北京工业大学学报》 EI CAS CSCD 北大核心 2012年第1期81-85,共5页
为了克服在基于案例推理中单一案例库检索的局限性,提出了基于贝叶斯信念网络的多案例库检索方法.该方法仅要求用户采用关键词对目标案例进行描述,通过贝叶斯信念网络计算关键词与各案例库的特征属性的匹配概率,以获得适应各案例库的完... 为了克服在基于案例推理中单一案例库检索的局限性,提出了基于贝叶斯信念网络的多案例库检索方法.该方法仅要求用户采用关键词对目标案例进行描述,通过贝叶斯信念网络计算关键词与各案例库的特征属性的匹配概率,以获得适应各案例库的完整的目标案例描述,然后对相应的案例库进行案例检索;将从多案例库中检索到的案例通过相似度线性归一处理后,结合目标案例描述的匹配概率获得与目标案例的最终相似度,统一排序后返回检索结果.最后通过航空企业的实际应用与性能分析进一步验证了多案例库检索方法的有效性. 展开更多
关键词 贝叶斯信念网络 基于案例推理 知识管理
下载PDF
学术论文抄袭检测方法研究综述 被引量:3
17
作者 赵俊杰 《湖南工业大学学报(社会科学版)》 2010年第1期157-159,共3页
从学术论文抄袭的现象和危害出发,分析归纳了学术论文抄袭的主要类型及形式。接着从论点抄袭、文本抄袭、算法与程序代码抄袭和图片与公式抄袭等几个方面,综述了近阶段所采用的主要抄袭检测方法。最后概述了解决论文抄袭检测问题的重要... 从学术论文抄袭的现象和危害出发,分析归纳了学术论文抄袭的主要类型及形式。接着从论点抄袭、文本抄袭、算法与程序代码抄袭和图片与公式抄袭等几个方面,综述了近阶段所采用的主要抄袭检测方法。最后概述了解决论文抄袭检测问题的重要意义,并对如何防止学术论文抄袭提出建议。 展开更多
关键词 抄袭检测 文本相似度 词频统计 数字指纹 图像匹配
下载PDF
英语同义词对子与汉语重叠词相似性对比研究 被引量:1
18
作者 陈永亮 《贵州大学学报(社会科学版)》 2003年第5期123-127,共5页
本文以对比手段来分析研究英语同义词对子和汉语重叠词结构相似性的关系,学习对比语言学,对跨文化语言研究作一些初步的探讨。
关键词 英语同义词对子 汉语重叠词 相似性 对比分析
下载PDF
基于二元模糊匹配的编程题智能评分方法 被引量:1
19
作者 冷强奎 刘雨晴 秦玉平 《计算机技术与发展》 2020年第2期71-74,共4页
针对传统编程题自动评分方法不能准确衡量学生程序与参考答案之间的接近程度等问题,提出了一种基于二元模糊匹配的编程题智能评分方法。第一元为结构匹配,检测学生程序在变量声明、数据输入、函数调用、控制结构等方面与参考答案的相似... 针对传统编程题自动评分方法不能准确衡量学生程序与参考答案之间的接近程度等问题,提出了一种基于二元模糊匹配的编程题智能评分方法。第一元为结构匹配,检测学生程序在变量声明、数据输入、函数调用、控制结构等方面与参考答案的相似程度,目的是快速判断学生程序中是否存在关键的采分点。第二元为词语匹配,首先进行词频统计,以确定每个词的权重。然后,分别构造学生程序与参考答案的向量空间模型,并计算两者的余弦相似度,来作为评判词语相似的依据。最终的分数由结构相似度和词语相似度的加权分数计算得出。由于该二元匹配方法不关心程序中结构/词语的先后顺序和是否为精确表达,因此被称为是模糊的。仿真实验表明,该方法具有不错的评分准确性,尽管与人工评分相比还存在一定的差距,但当试题规模较大时,可以作为人工评分的替代手段。 展开更多
关键词 二元模糊匹配 自动评分 词频统计 余弦相似度 向量空间模型
下载PDF
基于评论文本的词语极性分析
20
作者 马力 刘笑 宫玉龙 《计算机工程与设计》 北大核心 2016年第8期2277-2280,F0003,共5页
通过对基于知网语义相似度计算和基于点对互信息两种词语情感极性判别方法的分析研究,针对两种方法在某类词极性判别不准确的问题,采用多方法融合的思想,提出一种改进的词语情感极性判别方法。在词语语义相似度高于设定阈值时,采用知网... 通过对基于知网语义相似度计算和基于点对互信息两种词语情感极性判别方法的分析研究,针对两种方法在某类词极性判别不准确的问题,采用多方法融合的思想,提出一种改进的词语情感极性判别方法。在词语语义相似度高于设定阈值时,采用知网语义相似度计算的方法,低于阈值时,采用同义词扩展的点对互信息方法判断词语情感极性。实验结果表明,改进方法可以有效提高判别准确率。 展开更多
关键词 情感倾向 词语极性 语义相似度 知网 点互信息
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部