期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于词频加权和余弦相似度的模糊匹配算法 被引量:2
1
作者 李彤 崔琪伟 李夏 《企业科技与发展》 2022年第11期49-51,共3页
随着电子元器件技术领域的快速发展,在元器件管理过程中使用传统的EXCEL工具进行元器件信息的匹配已经很难满足高数量级的产品需求。提出一种基于词频加权和余弦相似度的模糊匹配算法,旨在解决当前电子元器件领域存在的数量庞大、信息... 随着电子元器件技术领域的快速发展,在元器件管理过程中使用传统的EXCEL工具进行元器件信息的匹配已经很难满足高数量级的产品需求。提出一种基于词频加权和余弦相似度的模糊匹配算法,旨在解决当前电子元器件领域存在的数量庞大、信息模糊、录入错误、效率低下等难题。实验结果表明,算法在准确率和运行时间两个主要方面均有较大改善。 展开更多
关键词 电子元器件 词频加权 余弦相似度 模糊匹配
下载PDF
一种基于混合判定模型的复合概念抽取方法 被引量:3
2
作者 欧阳柳波 邹北骥 刘丽杰 《电子学报》 EI CAS CSCD 北大核心 2013年第3期488-495,共8页
从大规模领域语料库中抽取领域概念,现有方法不能有效识别复合概念.本文提出一种基于混合判定模型的复合概念抽取方法,首先对文本进行分词处理,为每个词条添加词条标签,并对词条集进行噪音词消除和同义词合并处理,然后统计词条的加权词... 从大规模领域语料库中抽取领域概念,现有方法不能有效识别复合概念.本文提出一种基于混合判定模型的复合概念抽取方法,首先对文本进行分词处理,为每个词条添加词条标签,并对词条集进行噪音词消除和同义词合并处理,然后统计词条的加权词频,根据词条标签值计算位置亲和度和位置匹配度,判定和筛选可组合成复合概念的原子词条,最后通过设置不同复合深度值,实现多重复合概念抽取.采用不同规模语料库进行抽取实验,实验结果表明本文方法具有更高的召回率和准确率. 展开更多
关键词 语料库 领域概念 复合概念 加权词频 词条标签 位置亲和度 复合深度
下载PDF
语义分析在汉语相似性文献检测中的应用研究 被引量:1
3
作者 谈文蓉 冯山 刘莉 《四川师范大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第4期554-558,共5页
相似性文献检测技术在数字图书馆、知识产权保护等应用中有着较强的实际意义和应用价值.汉语中存在着许多歧义现象,导致汉语相似性文献检测的难度远大于英文文献.结合汉语的特点,提出了一种改进的基于词频统计的汉语相似性文献检测方法... 相似性文献检测技术在数字图书馆、知识产权保护等应用中有着较强的实际意义和应用价值.汉语中存在着许多歧义现象,导致汉语相似性文献检测的难度远大于英文文献.结合汉语的特点,提出了一种改进的基于词频统计的汉语相似性文献检测方法.首先,利用关键词和统计信息进行切词与消歧.其次,在语义分析的基础上抽取特征词并计算权重.最后,通过构造加权词频向量空间完成相似性检测.对本科生毕业论文的小规模实验表明:该方法能有效消除切分歧义,降低运算规模,提高检测精度与速度. 展开更多
关键词 语义分析 相似度 切分歧义 汉语文献 特征提取 加权词频
下载PDF
一种基于文本的领域本体进化需求自动生成模型 被引量:1
4
作者 欧阳柳波 兰小飞 伍振兴 《计算机系统应用》 2010年第6期144-147,共4页
本体进化研究已经成为领域本体研究的一个重要内容。本体进化需求是本体进化的前提,提出一种基于文本的本体进化需求自动生成框架,首先从自然语言描述的纯文本中提取相关概念,然后利用加权词频算法判断是否为领域关键概念,最后结合本体... 本体进化研究已经成为领域本体研究的一个重要内容。本体进化需求是本体进化的前提,提出一种基于文本的本体进化需求自动生成框架,首先从自然语言描述的纯文本中提取相关概念,然后利用加权词频算法判断是否为领域关键概念,最后结合本体搜索算法和进化需求生成规则,自动生成本体进化需求。 展开更多
关键词 本体进化 进化需求 自动生成模型 加权词频
下载PDF
面向暴恐音视频的内容检测系统研究与实现 被引量:1
5
作者 黄超 易平 《通信技术》 2018年第1期75-81,共7页
网络上有海量的音视频,其中暴恐音视频不容忽视。对面向暴恐音视频的内容检测系统进行研究,选取音频特征MFCC作为检测特征,采用词袋模型建模,利用支持向量机分类,优化了多个全局参数,过滤了无用镜头,采用欠采样平衡正负样本的数目差距,... 网络上有海量的音视频,其中暴恐音视频不容忽视。对面向暴恐音视频的内容检测系统进行研究,选取音频特征MFCC作为检测特征,采用词袋模型建模,利用支持向量机分类,优化了多个全局参数,过滤了无用镜头,采用欠采样平衡正负样本的数目差距,减少了冗余和训练复杂度,取得了理想的检测效果,且能给出暴恐程度的评估。具体地,提出了词频加权参数c的改进算法和基于距离倍数的词频加权改进算法,能使词袋模型表示更精确,从而提高了准确率。 展开更多
关键词 暴恐检测 词袋模型 支持向量机 词频加权
下载PDF
搜索引擎的几种常用排序算法 被引量:26
6
作者 常璐 夏祖奇 《图书情报工作》 CSSCI 北大核心 2003年第6期70-73,88,共5页
介绍几种比较著名的搜索引擎排序算法,分别是词频位置加权、Direct Hit、PageRank和竞价排名服务,并重点讨论影响它们的因素以及各自的优缺点,最后对它们进行简要的分析和比较。
关键词 搜索引擎 排序算法 词频位置加权 DirectHit PAGERANK 竞价排名
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部