期刊文献+
共找到165篇文章
< 1 2 9 >
每页显示 20 50 100
电力设备缺陷文本的双通道语义增强网络挖掘方法 被引量:1
1
作者 张宇波 王有元 +1 位作者 梁玄鸿 夏宇 《高电压技术》 EI CAS CSCD 北大核心 2024年第5期1923-1932,共10页
电力设备运维环节积累的缺陷文本可指导设备的状态评价和检修工作。然而缺陷文本结构多样且背景噪声强,导致智能挖掘信息的难度大。针对该问题,提出了基于双通道语义增强网络的电力设备缺陷文本挖掘方法。首先,分析缺陷文本的内容,结合... 电力设备运维环节积累的缺陷文本可指导设备的状态评价和检修工作。然而缺陷文本结构多样且背景噪声强,导致智能挖掘信息的难度大。针对该问题,提出了基于双通道语义增强网络的电力设备缺陷文本挖掘方法。首先,分析缺陷文本的内容,结合自然语言处理方法预处理缺陷文本。利用Glove词向量嵌入模型将缺陷文本映射至数值空间表征语义。然后,基于词移距离构建缺陷文本的增强文本,通过含注意力机制的双向长短时记忆神经网络分别提取缺陷文本和增强文本的特征,进而在网络末端融合特征实现关键信息加强,提升模型分类性能。实例表明,所提双通道语义增强网络的分类Macro-F1指标相比于传统机器学习方法、单通道深度学习方法至少提高6.2%、5.2%,同时所提方法为实现图像、文本等多源运维数据的特征增强提供新思路。 展开更多
关键词 缺陷文本 信息智能挖掘 词移距离 双通道语义增强网络 特征融合
下载PDF
两阶段问答范式的生物医学事件触发词检测
2
作者 行帅 熊玉洁 +1 位作者 苏前敏 黄继汉 《计算机工程与应用》 CSCD 北大核心 2024年第10期121-131,共11页
现有的生物医学事件触发词检测存在以下缺陷:保留了与触发词无关的冗余信息;忽略了实体与事件之间的潜在关联性;传统方法容易受到数据稀缺性的影响。针对上述问题,提出了一种两阶段问答范式的生物医学事件触发词检测方法。在事件类型识... 现有的生物医学事件触发词检测存在以下缺陷:保留了与触发词无关的冗余信息;忽略了实体与事件之间的潜在关联性;传统方法容易受到数据稀缺性的影响。针对上述问题,提出了一种两阶段问答范式的生物医学事件触发词检测方法。在事件类型识别阶段,采用基于句法距离的注意力捕获更有意义的上下文特征,排除无关信息的干扰;为了有效利用实体中的潜在特征,采用全局统计的单词-实体-事件共现特征,指导事件类型感知注意力挖掘词与事件之间的强关联性。在触发词定位阶段,根据识别出的事件类型,制定问题回答该事件对应的触发词索引,从而利用丰富的问答数据库实现数据增强。在MLEE语料库上的结果表明,两阶段问答范式、句法距离和事件类型感知注意力都有效地提升了模型性能,所提出的模型取得了81.39%的F1分数,并在多个事件类型上的详细结果均优于其他基线模型。 展开更多
关键词 生物医学事件 触发词检测 句法距离 单词-实体-事件共现特征 两阶段问答范式
下载PDF
基于Bi-LSTM神经网络的短文本敏感词识别方法 被引量:1
3
作者 周军芽 吴进伟 +1 位作者 吴广飞 张何为 《武汉理工大学学报(信息与管理工程版)》 CAS 2024年第2期312-316,共5页
为了准确识别与处理敏感词,针对分词时延较高、识别精度较低的问题,提出基于双向长短期记忆(Bi-LSTM)神经网络的短文本敏感词识别方法。分析敏感词库,将敏感词库划分为两大类、三个等级,预处理短文本干扰信息(特殊字符、繁体字与拆分汉... 为了准确识别与处理敏感词,针对分词时延较高、识别精度较低的问题,提出基于双向长短期记忆(Bi-LSTM)神经网络的短文本敏感词识别方法。分析敏感词库,将敏感词库划分为两大类、三个等级,预处理短文本干扰信息(特殊字符、繁体字与拆分汉字),引入Bi-LSTM神经网络构建短文本分词模型,二次训练确定最佳参数,反复计算词语的敏感性数值,通过敏感性对比函数,提取短文本敏感词,并匹配敏感词库,确定敏感词的类别与等级,实现短文本敏感词识别。实验结果表明:在不同实验组别下,应用本文方法获得的短文本分词时延均低于给定最大限值,短文本敏感词识别精度高于84.42%,应用性能较佳。 展开更多
关键词 短文本 敏感词识别 文本过滤 编辑距离 双向长短期记忆神经网络
下载PDF
A Harmonic Approach to Handwriting Style Synthesis Using Deep Learning
4
作者 Mahatir Ahmed Tusher Saket Choudary Kongara +2 位作者 Sagar Dhanraj Pande Seong Ki Kim Salil Bharany 《Computers, Materials & Continua》 SCIE EI 2024年第6期4063-4080,共18页
The challenging task of handwriting style synthesis requires capturing the individuality and diversity of human handwriting.The majority of currently available methods use either a generative adversarial network(GAN)o... The challenging task of handwriting style synthesis requires capturing the individuality and diversity of human handwriting.The majority of currently available methods use either a generative adversarial network(GAN)or a recurrent neural network(RNN)to generate new handwriting styles.This is why these techniques frequently fall short of producing diverse and realistic text pictures,particularly for terms that are not commonly used.To resolve that,this research proposes a novel deep learning model that consists of a style encoder and a text generator to synthesize different handwriting styles.This network excels in generating conditional text by extracting style vectors from a series of style images.The model performs admirably on a range of handwriting synthesis tasks,including the production of text that is out-of-vocabulary.It works more effectively than previous approaches by displaying lower values on key Generative Adversarial Network evaluation metrics,such Geometric Score(GS)(3.21×10^(-5))and Fréchet Inception Distance(FID)(8.75),as well as text recognition metrics,like Character Error Rate(CER)and Word Error Rate(WER).A thorough component analysis revealed the steady improvement in image production quality,highlighting the importance of specific handwriting styles.Applicable fields include digital forensics,creative writing,and document security. 展开更多
关键词 Recurrent neural network generative adversarial network style encoder fréchet inception distance geometric score character error rate mixture density network word error rate
下载PDF
基于Word2Vec的编程领域词语拼写错误检测算法 被引量:4
5
作者 刘峻松 唐明靖 +1 位作者 薛岗 杨成荣 《计算机应用与软件》 北大核心 2022年第3期277-284,共8页
Stack Overflow是一个计算机编程领域的问答社区,其中的文本蕴含大量有价值的信息可供挖掘,但由于其本身存在大量的错误词汇,给文本的分析造成影响。对此,提出一种词语自动检测纠错算法,通过词向量的技术以语义相似度为核心,对错误词汇... Stack Overflow是一个计算机编程领域的问答社区,其中的文本蕴含大量有价值的信息可供挖掘,但由于其本身存在大量的错误词汇,给文本的分析造成影响。对此,提出一种词语自动检测纠错算法,通过词向量的技术以语义相似度为核心,对错误词汇进行分析,结合改进的编辑距离算法对文本进行自动检测纠错。实验结果表明,该算法能够对诸如此类专业性较强的领域主题文本进行自动检测纠错,并且能够较好地还原标准文段用词。 展开更多
关键词 词向量 编辑距离 拼写纠错 word2Vec Stack Overflow
下载PDF
基于哈希算法的互联网平台数据中台资源检索方法
6
作者 梁艳春 阮宜龙 +1 位作者 李晨阳 张宏俊 《现代传输》 2024年第2期37-40,共4页
由于检索请求数据自身具有高维特征,导致检索输出的查准率和查全率偏低,为此,本文提出基于哈希算法的互联网平台数据中台资源检索方法。以信息跨域检索为导向,借助哈希算法实现对输入互联网平台数据中台资源检索请求的降维处理,在对输... 由于检索请求数据自身具有高维特征,导致检索输出的查准率和查全率偏低,为此,本文提出基于哈希算法的互联网平台数据中台资源检索方法。以信息跨域检索为导向,借助哈希算法实现对输入互联网平台数据中台资源检索请求的降维处理,在对输入数据进行清洗、去重、分词等预处理操作的基础上,使用词袋模型的方法,将文本转化为向量,再借助主成分分析法实现对向量的降维。在检索阶段,将与检索请求相似度最高(欧氏距离最小的)资源作为最终的检索输出结果。在测试结果中,资源检索方法面对不同类型的资源检索请求,对应的查准率稳定在91.0%以上,查全率稳定在90.0%以上。 展开更多
关键词 哈希算法 互联网平台 数据中台 资源检索 信息跨域检索 降维处理 词袋模型 主成分分析法 欧氏距离
下载PDF
一种基于Word2Vector与编辑距离的句子相似度计算方法 被引量:4
7
作者 陆尹浩 《电脑知识与技术(过刊)》 2017年第2X期146-147,共2页
随着各种问答系统的流行与聊天机器人的火热,对句子相似性的比较和处理越来越成为各类类似系统的核心部分。因此,研究并设计出一种好的句子相似性比较方法变得越来越关键。该文基于一种深度学习模型Word2Vector并且结合编辑距离算法提... 随着各种问答系统的流行与聊天机器人的火热,对句子相似性的比较和处理越来越成为各类类似系统的核心部分。因此,研究并设计出一种好的句子相似性比较方法变得越来越关键。该文基于一种深度学习模型Word2Vector并且结合编辑距离算法提出了一种句子相似度计算方法,给出了具体的设计思路,并且通过实验验证了该方法的有效性,最后总结了该方法的优缺点。 展开更多
关键词 句子相似度计算 word2Vector 编辑距离 Edit distance
下载PDF
基于Levenshtein距离的Word操作题自动评分算法 被引量:1
8
作者 罗泉 刘芝 《现代计算机》 2020年第32期90-93,共4页
针对学生基于素材完成操作练习的场景,提出一种基于Levenshtein距离的Word操作题自动评分算法。该算法通过测量学生作品文档分别到素材、标准答案的距离来计算分值。实验结果表明,该算法在执行速度、Precision、Recall、F1-Score等指标... 针对学生基于素材完成操作练习的场景,提出一种基于Levenshtein距离的Word操作题自动评分算法。该算法通过测量学生作品文档分别到素材、标准答案的距离来计算分值。实验结果表明,该算法在执行速度、Precision、Recall、F1-Score等指标均有所提升,能运用于日常操作练习评分。 展开更多
关键词 自动评分 Levenshtein距离 word操作题
下载PDF
Statute Recommendation Based on Word Embedding
9
作者 Peitang Ling Zian Wang +4 位作者 Yi Feng Jidong Ge Mengting He Chuanyi Li Bin Luo 《国际计算机前沿大会会议论文集》 2019年第1期546-548,共3页
The statute recommendation problem is a sub problem of the automated decision system, which can help the legal staff to deal with the process of the case in an intelligent and automated way. In this paper, an improved... The statute recommendation problem is a sub problem of the automated decision system, which can help the legal staff to deal with the process of the case in an intelligent and automated way. In this paper, an improved common word similarity algorithm is proposed for normalization. Meanwhile, word mover’s distance (WMD) algorithm was applied to the similarity measurement and statute recommendation problem, and the problem scene which was originally used for classification was extended. Finally, a variety of recommendation strategies different from traditional collaborative filtering methods were proposed. The experimental results show that it achieves the best value of Fmeasure reaching 0.799. And the comparative experiment shows that WMD algorithm can achieve better results than TF-IDF and LDA algorithm. 展开更多
关键词 Statute RECOMMENDATION word EMBEDDING word mover’s distance COLLABORATIVE FILTERING
下载PDF
中国经典诠释传统中的文本诠释空间问题初探
10
作者 蔡祥元 《社会科学》 CSSCI 北大核心 2023年第8期36-45,共10页
中国哲学传统有丰富的经典诠释实践,但是,要建构经典诠释学,必须有不同于西方方法论诠释学、本体论诠释学的思想视野。文本的诠释空间是诠释学的核心问题,在西方诠释学传统中大致有神人距离、精神距离和时间距离三种表现形态,分别构成... 中国哲学传统有丰富的经典诠释实践,但是,要建构经典诠释学,必须有不同于西方方法论诠释学、本体论诠释学的思想视野。文本的诠释空间是诠释学的核心问题,在西方诠释学传统中大致有神人距离、精神距离和时间距离三种表现形态,分别构成圣经诠释学、方法论诠释学与哲学诠释学的基本视野。“言意之辨”的诠释学内涵表明,中国的经典诠释传统对文本的诠释空间有一种新的理解,那就是思想距离。思想距离能够克服精神距离可能导致的独断论困境,也比哲学诠释学的时间距离更为切中文本诠释现象的核心,还能更好地解释文本的开放性,可以构成经典诠释学的理论根基。 展开更多
关键词 诠释空间 时间距离 言意之辨 思想距离
下载PDF
多源异构环境下基于层次约简分类的大数据清洗方法研究
11
作者 陈旭 《电脑与电信》 2023年第1期86-90,104,共6页
大数据清洗是数据分析与应用的关键环节之一,针对传统大数据清洗方法缺陷提出一种基于层次约简分类的大数据清洗方法研究。利用大数据清洗原理先判定数据集的属性类别,并建立层次约简分类模型,按照大数据集中值域范围最广的属性确定字... 大数据清洗是数据分析与应用的关键环节之一,针对传统大数据清洗方法缺陷提出一种基于层次约简分类的大数据清洗方法研究。利用大数据清洗原理先判定数据集的属性类别,并建立层次约简分类模型,按照大数据集中值域范围最广的属性确定字符串之间的编辑距离,遍历掉重要性和相关性较弱的干扰数据;采用逆文本词频分割的方式,对大量的冗余数据做聚合处理,进一步降低大数据集冗余程度。实验结果表明,提出方法在数据清理运行时间、查全率和查准率等指标控制方面均有优势。 展开更多
关键词 多元异构 层次约简分类 编辑距离 词频分割 冗余程度
下载PDF
基于EMD的快速活动轮廓图像分割算法 被引量:7
12
作者 孔丁科 汪国昭 《电子与信息学报》 EI CSCD 北大核心 2010年第5期1094-1099,共6页
C-V模型等传统基于区域的几何活动轮廓模型仅将灰度同质作为区域相似性的测度,致使其在分割噪声分布大、灰度复杂的自然及遥感图像时难有较好的分割结果。为此,该文提出基于Earth Mover's Distance(EMD)的快速活动轮廓图像分割算法... C-V模型等传统基于区域的几何活动轮廓模型仅将灰度同质作为区域相似性的测度,致使其在分割噪声分布大、灰度复杂的自然及遥感图像时难有较好的分割结果。为此,该文提出基于Earth Mover's Distance(EMD)的快速活动轮廓图像分割算法。首先,给出了基于EMD的区域相似性测度,并引入到模型的定义;接着,提出了基于过分割的规则化和快速曲线演化方法,很好地克服了传统模型的冗余轮廓、计算复杂等问题。对合成图像和遥感图像的实验结果证明了算法的有效性。 展开更多
关键词 图像分割 活动轮廓 相似性测度 EARTH mover's distance(EMD) 过分割
下载PDF
基于语义树的中文词语相似度计算与分析 被引量:36
13
作者 张亮 尹存燕 陈家骏 《中文信息学报》 CSCD 北大核心 2010年第6期23-30,共8页
词语相似度的分析与计算是自然语言处理关键技术之一,对句法分析、机器翻译、信息检索等能提供很好的帮助。基于语义资源Hownet的中文词语相似度计算是近年来的研究热点,但大多数的研究都是对中国科学院计算技术研究所刘群提出的计算方... 词语相似度的分析与计算是自然语言处理关键技术之一,对句法分析、机器翻译、信息检索等能提供很好的帮助。基于语义资源Hownet的中文词语相似度计算是近年来的研究热点,但大多数的研究都是对中国科学院计算技术研究所刘群提出的计算方法的改进和完善。该文充分分析和利用新版Hownet(2007)的概念架构和语义多维表达形式,从概念的主类义原、主类义原框架以及概念特性描述三个方面综合分析词语相似度,并在计算中区分语义特征相似度和句法特征相似度。实验结果理想,与人的直观判断基本一致。 展开更多
关键词 语义树 词语相似度 《知网》2007 语义距离
下载PDF
基于线索词识别和训练集扩展的中文问题分类 被引量:6
14
作者 张志昌 张宇 +1 位作者 刘挺 李生 《高技术通讯》 EI CAS CSCD 北大核心 2009年第2期111-118,共8页
针对问题分类的数据稀疏问题,提出了一种以疑问词和焦点词为关键线索的中文事实型问题分类方法。该方法首先自动识别用户提出的问题中的疑问词和焦点词,若疑问词和焦点词存在,则用最近邻模型进行分类,而对没有用最近邻方法分类的其他问... 针对问题分类的数据稀疏问题,提出了一种以疑问词和焦点词为关键线索的中文事实型问题分类方法。该方法首先自动识别用户提出的问题中的疑问词和焦点词,若疑问词和焦点词存在,则用最近邻模型进行分类,而对没有用最近邻方法分类的其他问题,则用支持向量机(SVM)模型进行分类。训练SVM模型时,从Web上自动获取新问题来对训练集进行扩展,最近邻方法只利用线索词词义距离进行类别判断。实验表明,这种按照问题结构的不同而选择不同分类器的方法,在性能上要优于单一分类方法;词义距离的应用和训练集自动扩展改善了训练数据的稀疏,提高了分类性能。 展开更多
关键词 问题分类 焦点词 词义距离 训练集扩展
下载PDF
基于语义的文本流形研究 被引量:10
15
作者 杨震 范科峰 +1 位作者 雷建军 郭军 《电子学报》 EI CAS CSCD 北大核心 2009年第3期557-561,共5页
本文通过引入包括Isomap流形降维、查询语义词典(WordNet)等高度非线性的方法,期望将文本信息处理领域长期专注于"语法"层次的研究,演进到"语义"的层次.利用流形学习工具研究了中文词汇在语义空间(分类空间)的分布... 本文通过引入包括Isomap流形降维、查询语义词典(WordNet)等高度非线性的方法,期望将文本信息处理领域长期专注于"语法"层次的研究,演进到"语义"的层次.利用流形学习工具研究了中文词汇在语义空间(分类空间)的分布聚集情况,通过利用WordNet词典进行了短信聚类的研究.实验结果表明,本文的方法能够更好地反映文本之间的内在联系. 展开更多
关键词 语义距离 流形学习 词汇分布 短信聚类
下载PDF
电子口碑的影响边界与作用机制研究 被引量:11
16
作者 吴水龙 白莹 +1 位作者 袁永娜 蒋廉雄 《管理工程学报》 CSSCI CSCD 北大核心 2017年第2期55-63,共9页
以往对于电子口碑(eWOM)产生的研究往往集中在动机领域,鲜有人涉足个体关系互依程度的影响;而对于电子口碑影响的研究也大多关注企业与消费者(audience),对于电子口碑发出者(speaker)本身的影响研究则易被忽视。本文通过三个实验探讨电... 以往对于电子口碑(eWOM)产生的研究往往集中在动机领域,鲜有人涉足个体关系互依程度的影响;而对于电子口碑影响的研究也大多关注企业与消费者(audience),对于电子口碑发出者(speaker)本身的影响研究则易被忽视。本文通过三个实验探讨电子口碑意向的影响机制,并进一步了解电子口碑行为对口碑发出者品牌态度的影响。研究表明:(1)相较于负面经历,具有正面经历的消费者eWOM意向更强;(2)互依自我消费者的积极eWOM意向强于消极eWOM意向,而独立自我消费者的负面eWOM意向强于正面eWOM意向,验证了自我建构的调节作用;(3)电子口碑行为能够强化口碑发出者原有的品牌态度,验证了心理距离的中介作用。研究结论能为企业合理引导积极口碑并避免负面信息传播提供管理建议。 展开更多
关键词 电子口碑 自我建构 心理距离 品牌态度
下载PDF
维汉机器翻译未登录词识别研究 被引量:9
17
作者 米成刚 王磊 +1 位作者 杨雅婷 陈科海 《计算机应用研究》 CSCD 北大核心 2013年第4期1112-1115,共4页
针对维汉统计机器翻译中未登录词较多的现象和维吾尔语语言资源匮乏这一现状,结合维吾尔语构词特征以及相应的字符串相似度算法,提出了一种基于字符串相似度的维汉机器翻译未登录词识别模型。该模型借助短语表和外部词典,与未翻译的维... 针对维汉统计机器翻译中未登录词较多的现象和维吾尔语语言资源匮乏这一现状,结合维吾尔语构词特征以及相应的字符串相似度算法,提出了一种基于字符串相似度的维汉机器翻译未登录词识别模型。该模型借助短语表和外部词典,与未翻译的维语词求相似度,取相似度最大短语对应的汉语翻译作为此未登录词的最终翻译。实验证明,与基于词干切分的未登录词识别方法相比,此模型较好地保留了维吾尔语词信息,提高了译文的质量。 展开更多
关键词 维汉机器翻译 短语表 字符串相似度算法 未登录词 词切分 编辑距离
下载PDF
领导与下属权力距离一致性对下属工作绩效的影响及其机制 被引量:40
18
作者 刘海洋 刘圣明 +1 位作者 王辉 徐敏亚 《南开管理评论》 CSSCI 北大核心 2016年第5期55-65,共11页
基于资源保存理论,本文分析了领导下属权力距离价值观的一致性对下属工作绩效的影响。通过两次问卷调查,采用跨层次多项式回归分析、块变量分析以及带邹氏检验的"两步法"结构方程分析的方法,对收集到的数据进行了一致效应和... 基于资源保存理论,本文分析了领导下属权力距离价值观的一致性对下属工作绩效的影响。通过两次问卷调查,采用跨层次多项式回归分析、块变量分析以及带邹氏检验的"两步法"结构方程分析的方法,对收集到的数据进行了一致效应和跨层次带调节的中介效应检验。研究结果表明:(1)领导下属权力距离不一致会导致员工情绪衰竭。(2)不一致的情况中,领导权力距离高—下属权力距离低时更容易产生情绪衰竭。(3)情绪衰竭中介了领导下属权力距离一致性对工作绩效的影响。(4)同事支持调节了这一过程。本文提供了领导下属权力距离价值观差异性对员工工作绩效影响的情绪路径及可能的解决途径,也对研究的意义和未来研究方向进行了讨论。 展开更多
关键词 领导下属权力距离一致性 情绪衰竭 同事 支持 工作绩效
下载PDF
基于LDA的新闻话题子话题划分方法 被引量:18
19
作者 赵爱华 刘培玉 郑燕 《小型微型计算机系统》 CSCD 北大核心 2013年第4期732-737,共6页
针对目前网络热点新闻话题中存在的难以区分一个话题下的多个子话题现象,提出一种基于LDA模型的子话题划分方法.首先应用LDA模型对新闻文档进行建模,采用贝叶斯标准方法确定最优主题个数,使LDA模型拟合文档性能达到最佳;其次针对子话题... 针对目前网络热点新闻话题中存在的难以区分一个话题下的多个子话题现象,提出一种基于LDA模型的子话题划分方法.首先应用LDA模型对新闻文档进行建模,采用贝叶斯标准方法确定最优主题个数,使LDA模型拟合文档性能达到最佳;其次针对子话题间文本相似度较高的特点,引入主题特征词相关性分析,采用改进的KL距离公式,计算新闻文档之间相似度,有效区分了文档内容相似但话题重点不同的报道;最后通过single-pass增量聚类算法进行文档聚类,实现子话题划分.实验验证了改进后的相似度计算方法的有效性,实验结果表明该方法能够有效地提高热点新闻话题子话题划分的准确率. 展开更多
关键词 潜在狄利克雷分布(LDA) 子话题划分 主题特征词 KL距离 相似度计算
下载PDF
基于词语距离的网络图词义消歧 被引量:22
20
作者 杨陟卓 黄河燕 《软件学报》 EI CSCD 北大核心 2012年第4期776-785,共10页
传统的基于知识库的词义消歧方法,以一定窗口大小下的词语作为背景,对歧义词词义进行推断.该窗口大小下的所有词语无论距离远近,都对歧义词的词义具有相同的影响,使词义消歧效果不佳.针对此问题,提出了一种基于词语距离的网络图词义消... 传统的基于知识库的词义消歧方法,以一定窗口大小下的词语作为背景,对歧义词词义进行推断.该窗口大小下的所有词语无论距离远近,都对歧义词的词义具有相同的影响,使词义消歧效果不佳.针对此问题,提出了一种基于词语距离的网络图词义消歧模型.该模型在传统的网络图词义消歧模型的基础上,充分考虑了词语距离对消歧效果的影响.通过模型重构、优化改进、参数估计以及评测比较,论证了该模型的特点:距离歧义词较近的词语,会对其词义有较强的推荐作用;而距离较远的词,会对其词义有较弱的推荐作用.实验结果表明,该模型可以有效提高中文词义消歧性能,与SemEval-2007:task#5最好的成绩相比,该方法在MacroAve(macro-average accuracy)上提高了3.1%. 展开更多
关键词 词语距离 马尔可夫链 网络图模型 PAGERANK 参数估计
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部