期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于知识图谱使用多特征语义融合的文档对匹配
1
作者 陈毅波 张祖平 +2 位作者 黄鑫 向行 何智强 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第8期3122-3131,共10页
为了区分文档间的同源性和异质性,首先,提出一种多特征语义融合模型(Multi-Feature Semantic Fusion Model,MFSFM)来捕获文档关键字,它采用语义增强的多特征表示法来表示实体,并在多卷积混合残差CNN模块中引入局部注意力机制以提高实体... 为了区分文档间的同源性和异质性,首先,提出一种多特征语义融合模型(Multi-Feature Semantic Fusion Model,MFSFM)来捕获文档关键字,它采用语义增强的多特征表示法来表示实体,并在多卷积混合残差CNN模块中引入局部注意力机制以提高实体边界信息的敏感性;然后,通过对文档构建一个关键字共现图,并应用社区检测算法检测概念进而表示文档,从而匹配文档对;最后,建立两个多特征文档数据集,以验证所提出的基于MFSFM的匹配方法的可行性,每一个数据集都包含约500份真实的科技项目可行性报告。研究结果表明:本文所提出的模型在CNSR和CNSI数据集上的分类精度分别提高了13.67%和15.83%,同时可以实现快速收敛。 展开更多
关键词 文档匹配 多特征语义融合 知识图谱 概念图
下载PDF
财务文档分词及文档相关性分析 被引量:1
2
作者 殷伟 《电脑知识与技术》 2013年第3期1718-1719,1722,共3页
搜集财务专业语料库,利用中科院的分词工具对专业语料库进行分词,计算分词的准确率和召回率,并将结果保存在文件中。计算文档中给定词的词频和反文档频率,并对专业词汇加权,提高专业词汇的重要性,利用数学模型进行文档的相似度匹配。设... 搜集财务专业语料库,利用中科院的分词工具对专业语料库进行分词,计算分词的准确率和召回率,并将结果保存在文件中。计算文档中给定词的词频和反文档频率,并对专业词汇加权,提高专业词汇的重要性,利用数学模型进行文档的相似度匹配。设置阈值,若两篇文档的相似度大于指定阈值,即认定两篇文档相似,进而生成一个矩阵,求解矩阵的连通性,得到该本聚类的结果,并进行文章的相关性分析。该文有利于财务分析人员根据已分类好的财务文档,了解企业过去,评价企业现状,作出对企业有长远影响的决策。 展开更多
关键词 准确率和召回率 财务文档相似度匹配 财务文档相关性分析
下载PDF
基于动态评分的视频监控中心云存储系统
3
作者 陈宏兴 张红 《可编程控制器与工厂自动化(PLC FA)》 2015年第8期99-102,51,共5页
针对企业视频监控中心视频、音频和图片等监控资料的使用特点,设计了应用在视频监控中心环境下的云存储系统。系统以HDFS分布式文件系统为基础构建,使用节点动态评分算法划分数据存储节点的文件块粒度,并使用文件类型匹配算法分配不同... 针对企业视频监控中心视频、音频和图片等监控资料的使用特点,设计了应用在视频监控中心环境下的云存储系统。系统以HDFS分布式文件系统为基础构建,使用节点动态评分算法划分数据存储节点的文件块粒度,并使用文件类型匹配算法分配不同类型文件的存取位置,达到了分布式存储的资源优化。系统使用冗余策略和负载均衡手段确保了文件存取操作的可靠性,并通过文件类型匹配算法保证了文档读取的速度。实验和应用表明,基于动态评分的云存储系统具有较高的可靠性,在大负载情况下文件的读取速度得到了优化,对大数据条件下的数据存储和操作应用具有一定的研究意义。 展开更多
关键词 云存储 HDFS 动态评分 文档匹配算法
下载PDF
基于整体相似度的文档主题匹配研究 被引量:1
4
作者 魏小锐 《网络安全技术与应用》 2018年第3期44-46,共3页
基于内容的网络信息过滤需要动态地比较网页与用户模板。传统文档主题匹配算法主要以两两文档间的相似度为基础来计算,这在高维的文档向量空间并不总是合适。超团模式是一种附加了整体相似度约束的频繁项集,其内部文档更有可能属于同一... 基于内容的网络信息过滤需要动态地比较网页与用户模板。传统文档主题匹配算法主要以两两文档间的相似度为基础来计算,这在高维的文档向量空间并不总是合适。超团模式是一种附加了整体相似度约束的频繁项集,其内部文档更有可能属于同一类别。利用超团模式这种特性,提出了基于整体相似度的文档主题匹配方法,只利用同一个超团内部的文档来预测类别。该方法通过在现实世界数据集上与K-最近邻算法进行比较,实验结果证实了超团算法应用于文档主题匹配的优越性。 展开更多
关键词 文本挖掘 文档匹配 整体相似度 超团模式
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部