期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
中文招聘文档中专业技能词抽取的跨域迁移学习
被引量:
4
1
作者
易新河
杨鹏
文益民
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2022年第2期274-288,共15页
【目的】利用在线招聘文档,准确分析用人单位需求,为解决劳动力供需失配提供技术支持。【方法】提出一种基于跨域迁移学习的专业技能词识别方法(CDTL-PSE)。CDTL-PSE将专业技能词的识别任务当作序列标注任务,首先将SIGHAN语料库分解为...
【目的】利用在线招聘文档,准确分析用人单位需求,为解决劳动力供需失配提供技术支持。【方法】提出一种基于跨域迁移学习的专业技能词识别方法(CDTL-PSE)。CDTL-PSE将专业技能词的识别任务当作序列标注任务,首先将SIGHAN语料库分解为三个源域,利用插入在Bi-LSTM层和CRF层之间的域自适应层来有效实现从各个源域到目标域的跨域迁移学习;然后采用参数迁移法训练每个子模型;最后通过多数投票获得标签序列的预测结果。【结果】在自建在线招聘文档数据集上,相对于基线方法,使用交替训练的具有Bi-LSTM域自适应层的CDTL-PSE的F1值提高0.91%,能减少50%左右的标记样本。【局限】模型的可解释性有待进一步改善。【结论】CDTL-PSE能有效实现对技能词的自动抽取,还可有效缓解目标域标注样本的不足。
展开更多
关键词
专业技能词
跨域迁移学习
域自适应
原文传递
题名
中文招聘文档中专业技能词抽取的跨域迁移学习
被引量:
4
1
作者
易新河
杨鹏
文益民
机构
桂林电子科技大学图书馆
桂林电子科技大学计算机与信息安全学院
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2022年第2期274-288,共15页
基金
教育部人文社会科学研究专项任务项目(项目编号:17JDGC022)
广西学位与研究生教育改革课题(项目编号:JGY2017055)
广西自然科学基金项目(项目编号:2018GXNSFDA138006)的研究成果之一。
文摘
【目的】利用在线招聘文档,准确分析用人单位需求,为解决劳动力供需失配提供技术支持。【方法】提出一种基于跨域迁移学习的专业技能词识别方法(CDTL-PSE)。CDTL-PSE将专业技能词的识别任务当作序列标注任务,首先将SIGHAN语料库分解为三个源域,利用插入在Bi-LSTM层和CRF层之间的域自适应层来有效实现从各个源域到目标域的跨域迁移学习;然后采用参数迁移法训练每个子模型;最后通过多数投票获得标签序列的预测结果。【结果】在自建在线招聘文档数据集上,相对于基线方法,使用交替训练的具有Bi-LSTM域自适应层的CDTL-PSE的F1值提高0.91%,能减少50%左右的标记样本。【局限】模型的可解释性有待进一步改善。【结论】CDTL-PSE能有效实现对技能词的自动抽取,还可有效缓解目标域标注样本的不足。
关键词
专业技能词
跨域迁移学习
域自适应
Keywords
Professional Skill Words
Cross Domain Transfer Learning
Domain Adaptation
分类号
TP393 [自动化与计算机技术—计算机应用技术]
G250 [文化科学—图书馆学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
中文招聘文档中专业技能词抽取的跨域迁移学习
易新河
杨鹏
文益民
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2022
4
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部