期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于VCK-vector模型的词义消歧方法 被引量:1
1
作者 戴洪涛 侯开虎 +1 位作者 周洲 肖灵云 《软件》 2020年第2期134-140,共7页
自然语言处理(NLP)旨在如何让计算机更好的理解人类的语言,但是在自然语言中句段、词汇本身存在多义和歧义,计算机无法将其转换为能识别的二进制编码,这是当下NLP领域内存在的最大问题。本文将Viterbi算法的词性标注模型、CBOW语言模型... 自然语言处理(NLP)旨在如何让计算机更好的理解人类的语言,但是在自然语言中句段、词汇本身存在多义和歧义,计算机无法将其转换为能识别的二进制编码,这是当下NLP领域内存在的最大问题。本文将Viterbi算法的词性标注模型、CBOW语言模型及K-Means聚类算法组合,构建一种基于词向量的多义词组合消歧模型(VCK-Vector)。通过词性分布对比、语义相关度任务和聚类效果分析等方法评测模型,最后通过百度AI词向量与模型输出结果进行对比。结果显示基于VCK-vector模型在实际场景运用中是可行的。 展开更多
关键词 自然语言处理 多义词消歧 VCK-vector模型
下载PDF
基于查询日志分析的中文网页关键词抽取方法 被引量:1
2
作者 王晓艳 王珍珍 《广西师范大学学报(自然科学版)》 CAS 北大核心 2015年第2期42-48,共7页
以全文索引为基础的网页搜索引擎检索相关度偏低。针对这一问题,本文提出了一种基于查询日志分析的中文网页关键词抽取方法。该方法利用用户对网页与查询词的相关性判断来选择关键词。为了量化用户的相关性判断,提出了单位篇幅停留时间... 以全文索引为基础的网页搜索引擎检索相关度偏低。针对这一问题,本文提出了一种基于查询日志分析的中文网页关键词抽取方法。该方法利用用户对网页与查询词的相关性判断来选择关键词。为了量化用户的相关性判断,提出了单位篇幅停留时间、逆向点击率、排名补偿因子3个指标,并对其进行综合加权。在查询串分词、同义词识别及多义词消歧、关键短语组配方面,也做了特殊处理。实验结果表明:抽取关键词的准确率较高,综合性能也高于TF.IDF和SVM方法。该方法能得到较满意的关键词抽取效果。 展开更多
关键词 查询日志 关键词抽取 关键短语组配 同义词识别 多义词消歧
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部