期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
科研论文基金项目“一文多注”和不实标注研究——以2014-2018年国家社科基金项目为例
被引量:
8
1
作者
叶文豪
洪磊
+1 位作者
唐梦嘉
张逸勤
《图书与情报》
CSSCI
北大核心
2020年第6期65-72,共8页
学术期刊数据库的建设为科研论文标注基金的深入研究提供了条件。文章以国家社科基金项目为例,从CNKI数据库获取了基金项目的论文成果,对这些论文的基金标注情况进行了统计分析。采用Word2vec模型计算了论文与标注基金研究内容的相关性...
学术期刊数据库的建设为科研论文标注基金的深入研究提供了条件。文章以国家社科基金项目为例,从CNKI数据库获取了基金项目的论文成果,对这些论文的基金标注情况进行了统计分析。采用Word2vec模型计算了论文与标注基金研究内容的相关性,并结合人工,识别出基金不实标注的现象。结果表明,论文一文多注的情况较为常见;在基金不实标注的数据中,重大项目和重点项目作为高学术影响力的项目被不实标注的比例较高。
展开更多
关键词
科研论文
国家社科基金
一文多注
基金不实标注
下载PDF
职称材料
基于大数据岗位需求的文本聚类研究
被引量:
20
2
作者
刘睿伦
叶文豪
+2 位作者
高瑞卿
唐梦嘉
王东波
《数据分析与知识发现》
CSSCI
CSCD
2017年第12期32-40,共9页
【目的】对大数据工作岗位需求文本进行挖掘,帮助大数据企业更精准地定位所需人才。【方法】抽取招聘网站上2017年第一季度关于"大数据"的工作岗位信息,使用TF-IDF并结合Word2Vec和K-means实现基于语义的聚类,并利用轮廓系数...
【目的】对大数据工作岗位需求文本进行挖掘,帮助大数据企业更精准地定位所需人才。【方法】抽取招聘网站上2017年第一季度关于"大数据"的工作岗位信息,使用TF-IDF并结合Word2Vec和K-means实现基于语义的聚类,并利用轮廓系数方法获取最佳聚类效果。【结果】利用抽取获得的实体对文本向量进行表达能够达到良好的聚类效果,最终将岗位需求文本分为工作能力要求、学历要求以及工作经验要求三类。【局限】各网站信息发布的格式不统一,数据清洗不够全面,对聚类效果产生影响;挖掘获取的招聘信息数据量不充足,使Word2Vec模型训练集较小,训练结果还有提升空间。【结论】根据聚类结果发现大数据岗位对学历要求不高、企业偏好有经验的但也不排除无经验的求职者、企业对职位素养要求要高于计算机技术要求等特点。
展开更多
关键词
大数据岗位
Word2Vec
K-MEANS
轮廓系数
原文传递
题名
科研论文基金项目“一文多注”和不实标注研究——以2014-2018年国家社科基金项目为例
被引量:
8
1
作者
叶文豪
洪磊
唐梦嘉
张逸勤
机构
南京大学信息管理学院
江苏省数据工程与知识服务重点实验室
江苏警官学院计算机信息与网络安全系
南京农业大学信息管理学院
出处
《图书与情报》
CSSCI
北大核心
2020年第6期65-72,共8页
基金
国家社科基金特别委托项目“国家社科基金项目成果学术影响力评估”(项目编号:16@ZH081)研究成果之一。
文摘
学术期刊数据库的建设为科研论文标注基金的深入研究提供了条件。文章以国家社科基金项目为例,从CNKI数据库获取了基金项目的论文成果,对这些论文的基金标注情况进行了统计分析。采用Word2vec模型计算了论文与标注基金研究内容的相关性,并结合人工,识别出基金不实标注的现象。结果表明,论文一文多注的情况较为常见;在基金不实标注的数据中,重大项目和重点项目作为高学术影响力的项目被不实标注的比例较高。
关键词
科研论文
国家社科基金
一文多注
基金不实标注
Keywords
scientific paper
National Social Science Fund Projects
multiple labeling
false labeling
分类号
G31 [文化科学]
下载PDF
职称材料
题名
基于大数据岗位需求的文本聚类研究
被引量:
20
2
作者
刘睿伦
叶文豪
高瑞卿
唐梦嘉
王东波
机构
南京农业大学信息科学技术学院
出处
《数据分析与知识发现》
CSSCI
CSCD
2017年第12期32-40,共9页
基金
江苏省社会科学基金项目"大数据环境下汉英短语级平行语料标注及知识挖掘研究"(项目编号:13XWC017)的研究成果之一
文摘
【目的】对大数据工作岗位需求文本进行挖掘,帮助大数据企业更精准地定位所需人才。【方法】抽取招聘网站上2017年第一季度关于"大数据"的工作岗位信息,使用TF-IDF并结合Word2Vec和K-means实现基于语义的聚类,并利用轮廓系数方法获取最佳聚类效果。【结果】利用抽取获得的实体对文本向量进行表达能够达到良好的聚类效果,最终将岗位需求文本分为工作能力要求、学历要求以及工作经验要求三类。【局限】各网站信息发布的格式不统一,数据清洗不够全面,对聚类效果产生影响;挖掘获取的招聘信息数据量不充足,使Word2Vec模型训练集较小,训练结果还有提升空间。【结论】根据聚类结果发现大数据岗位对学历要求不高、企业偏好有经验的但也不排除无经验的求职者、企业对职位素养要求要高于计算机技术要求等特点。
关键词
大数据岗位
Word2Vec
K-MEANS
轮廓系数
Keywords
Big DATA Jobs Word2Vec K-means Silhouette Coefficient
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
科研论文基金项目“一文多注”和不实标注研究——以2014-2018年国家社科基金项目为例
叶文豪
洪磊
唐梦嘉
张逸勤
《图书与情报》
CSSCI
北大核心
2020
8
下载PDF
职称材料
2
基于大数据岗位需求的文本聚类研究
刘睿伦
叶文豪
高瑞卿
唐梦嘉
王东波
《数据分析与知识发现》
CSSCI
CSCD
2017
20
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部