期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
科研论文基金项目“一文多注”和不实标注研究——以2014-2018年国家社科基金项目为例 被引量:8
1
作者 叶文豪 洪磊 +1 位作者 唐梦嘉 张逸勤 《图书与情报》 CSSCI 北大核心 2020年第6期65-72,共8页
学术期刊数据库的建设为科研论文标注基金的深入研究提供了条件。文章以国家社科基金项目为例,从CNKI数据库获取了基金项目的论文成果,对这些论文的基金标注情况进行了统计分析。采用Word2vec模型计算了论文与标注基金研究内容的相关性... 学术期刊数据库的建设为科研论文标注基金的深入研究提供了条件。文章以国家社科基金项目为例,从CNKI数据库获取了基金项目的论文成果,对这些论文的基金标注情况进行了统计分析。采用Word2vec模型计算了论文与标注基金研究内容的相关性,并结合人工,识别出基金不实标注的现象。结果表明,论文一文多注的情况较为常见;在基金不实标注的数据中,重大项目和重点项目作为高学术影响力的项目被不实标注的比例较高。 展开更多
关键词 科研论文 国家社科基金 一文多注 基金不实标注
下载PDF
基于大数据岗位需求的文本聚类研究 被引量:20
2
作者 刘睿伦 叶文豪 +2 位作者 高瑞卿 唐梦嘉 王东波 《数据分析与知识发现》 CSSCI CSCD 2017年第12期32-40,共9页
【目的】对大数据工作岗位需求文本进行挖掘,帮助大数据企业更精准地定位所需人才。【方法】抽取招聘网站上2017年第一季度关于"大数据"的工作岗位信息,使用TF-IDF并结合Word2Vec和K-means实现基于语义的聚类,并利用轮廓系数... 【目的】对大数据工作岗位需求文本进行挖掘,帮助大数据企业更精准地定位所需人才。【方法】抽取招聘网站上2017年第一季度关于"大数据"的工作岗位信息,使用TF-IDF并结合Word2Vec和K-means实现基于语义的聚类,并利用轮廓系数方法获取最佳聚类效果。【结果】利用抽取获得的实体对文本向量进行表达能够达到良好的聚类效果,最终将岗位需求文本分为工作能力要求、学历要求以及工作经验要求三类。【局限】各网站信息发布的格式不统一,数据清洗不够全面,对聚类效果产生影响;挖掘获取的招聘信息数据量不充足,使Word2Vec模型训练集较小,训练结果还有提升空间。【结论】根据聚类结果发现大数据岗位对学历要求不高、企业偏好有经验的但也不排除无经验的求职者、企业对职位素养要求要高于计算机技术要求等特点。 展开更多
关键词 大数据岗位 Word2Vec K-MEANS 轮廓系数
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部