-
题名基于Hadoop平台的人才发现与推荐系统研究
被引量:5
- 1
-
-
作者
王孟頔
邰泳
薛安荣
-
机构
江苏大学计算机科学与通信工程学院
-
出处
《软件导刊》
2014年第1期4-6,共3页
-
文摘
随着互联网和社交网络的发展,个人信息越来越多地暴露在网络空间中,有效收集和挖掘这些信息可发现所需要的人才信息。设计了一个人才发现与推荐系统,该系统基于Hadoop平台,利用网络爬虫程序寻找网页,通过信息抽取技术获取页面内容,利用lucene的分词器提取文本中的关键词,根据关联规则算法挖掘出关联关键词,采用基于相似项的策略推荐人才。系统为企业提供了一种基于网页数据的技术人才发现和推荐工具,节约了大量时间和成本。
-
关键词
人才推荐系统
HADOOP平台
网络爬虫
信息抽取
相似项
-
Keywords
Talents Recommended Hadoop platform Web Crawlers Information Extraction Similar Items
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-
-
题名基于VIPS的职位信息抽取技术研究
被引量:1
- 2
-
-
作者
王孟頔
邰泳
-
机构
江苏大学计算机科学与通信工程学院
-
出处
《软件导刊》
2015年第9期22-24,共3页
-
文摘
随着网络招聘的普及,求职者需要浏览和筛选的数据越来越多,如何从大量的、非结构化的网络信息中快速而准确地抽取需要的信息非常重要。基于VIPS视觉分割算法,利用网页所呈现出来的布局结构和视觉特征,对招聘页面进行视觉分割处理,在页面分割的基础上,抽取特定块内的文本信息,实现了关键词查找抽取感兴趣的视觉块内信息。实验结果表明,基于VIPS的职位信息抽取技术能够有效抽取出招聘页面内重要的文本信息,优化了信息抽取结果。
-
关键词
网络招聘
信息抽取
视觉分割
VIPS
职位信息
-
Keywords
Information Extraction
Visual Segmentation
VIPS
Job Information
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-