期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
余弦相似度在高校综合信息系统中的应用
被引量:
5
1
作者
朱浩
连德富
+1 位作者
左志宏
颜凯
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2017年第A01期123-128,共6页
针对电子科技大学综合信息系统中学术论文填报数据不准确的问题,提出了通过余弦相似度计算来识别标准期刊名或会议名的方案.首先对填报名进行预处理,并清洗来自互联网的爬取名,进而得到测试名.通过经典的TF-IDF方法,对所有测试名和标准...
针对电子科技大学综合信息系统中学术论文填报数据不准确的问题,提出了通过余弦相似度计算来识别标准期刊名或会议名的方案.首先对填报名进行预处理,并清洗来自互联网的爬取名,进而得到测试名.通过经典的TF-IDF方法,对所有测试名和标准期刊名进行分词、去除停止词和取词操作,在计算出每个单词的TF-IDF值后,即可将所有的测试名和标准期刊名都转化为由所有单词的TF-IDF值构成的多维向量.通过计算测试名和标准期刊名间的余弦相似度,即可最终识别出正确的标准期刊名.实际的识别结果表明,余弦相似度计算极大地提高了学术论文填报数据的质量.
展开更多
关键词
大数据分析
综合信息系统
余弦相似度
多维向量转换
数据治理
下载PDF
职称材料
题名
余弦相似度在高校综合信息系统中的应用
被引量:
5
1
作者
朱浩
连德富
左志宏
颜凯
机构
电子科技大学信息中心
威廉玛丽学院信息技术部
电子科技大学大数据研究中心
出处
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2017年第A01期123-128,共6页
基金
电子科技大学专项建设资助项目(Y03093036001089)
文摘
针对电子科技大学综合信息系统中学术论文填报数据不准确的问题,提出了通过余弦相似度计算来识别标准期刊名或会议名的方案.首先对填报名进行预处理,并清洗来自互联网的爬取名,进而得到测试名.通过经典的TF-IDF方法,对所有测试名和标准期刊名进行分词、去除停止词和取词操作,在计算出每个单词的TF-IDF值后,即可将所有的测试名和标准期刊名都转化为由所有单词的TF-IDF值构成的多维向量.通过计算测试名和标准期刊名间的余弦相似度,即可最终识别出正确的标准期刊名.实际的识别结果表明,余弦相似度计算极大地提高了学术论文填报数据的质量.
关键词
大数据分析
综合信息系统
余弦相似度
多维向量转换
数据治理
Keywords
big data analysis
comprehensive information system
cosine similarity
multidimensional vector transformation
data governance
分类号
TP315 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
余弦相似度在高校综合信息系统中的应用
朱浩
连德富
左志宏
颜凯
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2017
5
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部