期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
余弦相似度在高校综合信息系统中的应用 被引量:5
1
作者 朱浩 连德富 +1 位作者 左志宏 颜凯 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第A01期123-128,共6页
针对电子科技大学综合信息系统中学术论文填报数据不准确的问题,提出了通过余弦相似度计算来识别标准期刊名或会议名的方案.首先对填报名进行预处理,并清洗来自互联网的爬取名,进而得到测试名.通过经典的TF-IDF方法,对所有测试名和标准... 针对电子科技大学综合信息系统中学术论文填报数据不准确的问题,提出了通过余弦相似度计算来识别标准期刊名或会议名的方案.首先对填报名进行预处理,并清洗来自互联网的爬取名,进而得到测试名.通过经典的TF-IDF方法,对所有测试名和标准期刊名进行分词、去除停止词和取词操作,在计算出每个单词的TF-IDF值后,即可将所有的测试名和标准期刊名都转化为由所有单词的TF-IDF值构成的多维向量.通过计算测试名和标准期刊名间的余弦相似度,即可最终识别出正确的标准期刊名.实际的识别结果表明,余弦相似度计算极大地提高了学术论文填报数据的质量. 展开更多
关键词 大数据分析 综合信息系统 余弦相似度 多维向量转换 数据治理
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部