-
题名基于深度学习的简历信息实体抽取方法
被引量:7
- 1
-
-
作者
黄胜
李伟
张剑
-
机构
重庆邮电大学光通信与网络重点实验室
北京大学深圳研究院
-
出处
《计算机工程与设计》
北大核心
2018年第12期3873-3878,共6页
-
基金
国家自然科学基金项目(61371096)
深圳市科技计划基金项目(JCYJ20170307151743672)
-
文摘
针对传统的简历信息实体抽取方法泛化能力差、难以维护的问题,提出一种基于深层神经网络的简历信息实体抽取方法。经过数据清洗、分词等预处理将非结构化的简历文本信息处理为词序列,通过由Word2Vec在大规模语料库以无监督方式训练得到的词向量表,将每个词映射为低维实数向量,由双向LSTM层融合待标注词所处的语境信息,输出所有可能标签序列的分值给CRF层,由其引入前后标签之间的约束求解最优标签序列,以随机梯度下降法训练该模型,辅以Dropout防止过拟合。实验结果表明,该方法提升了相应的解析标注性能,提高了泛化能力。
-
关键词
简历抽取
信息实体
序列标注
长短期记忆
条件随机场
-
Keywords
resume extraction
information entity
sequence labeling
long short term memory
conditional random fields
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-