期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于AdaBoost算法的养老信息筛选及应用

Filtering and Application of Aged Information Based on AdaBoost Algorithm

下载PDF

导出

摘要面对信息社会中老年人对养老信息的关注与需求，本文使用基于Python的网络爬虫技术对民政部网站的新闻和公文进行抓取。针对门户网站的新闻特点，对数据抓取过程以及训练集进行优化，使用AdaBoost算法对给定的文本集合进行训练，得到筛选模型。提供一种有效的特征选择方法，采用χ2统计量准则，有效降低了特征维数，然后用该模型对采集的信息进行筛选得到养老信息。最后，对信息筛选结果进行了分析。实验分析结果表明，本文提出的方法可以实现对养老信息的有效筛选，在应用上可以满足老年人对养老信息的获取需求。 Facing attention to the needs of older persons in the information society for aged information, this paper uses Web crawler technology based on Python to crawl the news and official documents from Ministry of Civil Affairs website. Aiming at the characteristics of news on portals, the paper optimizes data fetching process as well as the training set, uses Adaboost algorithm to train a given collection of text and get filtering model. And the paper provides an effective feature selection method which uses the χ2 statistic principles, effectively reduces the feature dimension, and then uses this model to filter the collection information to get aged information. Finally, the results of information filtering are analyzed. The experimental analysis results show that the proposed method can effectively filter the aged information and meet the elderly demand of aged information acquisition in the practical application. Key words： Web crawler; AdaBoost; aged information; government press ; information filtering

作者程光洋廉彬

机构地区合肥工业大学工业与装备技术研究院安徽省经济信息中心

出处《计算机与现代化》 2016年第12期102-106,110,共6页 Computer and Modernization

关键词网络爬虫 ADABOOST 养老信息政府新闻信息筛选 Web crawler AdaBoost aged information government press information filtering

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1李洪心,李巍.国内外养老模式研究[J].经济与管理,2012,26(12):18-22. 被引量：56
2刘晓梅.我国社会养老服务面临的形势及路径选择[J].人口研究,2012,36(5):104-112. 被引量：130
3张丽雅,宋晓阳.信息技术在养老服务业中的应用与对策研究[J].科技管理研究,2015,35(5):170-174. 被引量：82
4樊兴华,孙茂松.一种高性能的两类中文文本分类方法[J].计算机学报,2006,29(1):124-131. 被引量：70
5张启蕊,张凌,董守斌,谭景华.训练集类别分布对文本分类的影响[J].清华大学学报（自然科学版）,2005,45(S1):1802-1805. 被引量：26
6李惠娟,高峰,管晓宏,黄亮.基于贝叶斯神经网络的垃圾邮件过滤方法[J].微电子学与计算机,2005,22(4):107-111. 被引量：21
7庞剑锋,卜东波,白硕.基于向量空间模型的文本自动分类系统的研究与实现[J].计算机应用研究,2001,18(9):23-26. 被引量：293
8伍洋,钟鸣,姜艳,李石君.面向审计领域的短文本分类技术研究[J].微电子学与计算机,2015,32(1):5-10. 被引量：7
9裴英博,刘晓霞.文本分类中改进型CHI特征选择方法的研究[J].计算机工程与应用,2011,47(4):128-130. 被引量：39
10董乐红,耿国华,周明全.基于Boosting算法的文本自动分类器设计[J].计算机应用,2007,27(2):384-386. 被引量：13

二级参考文献97

1陈永生.对我国社区养老的可行性分析[J].北京城市学院学报,2008(6):45-49. 被引量：35
2王细薇,樊兴华,赵军.一种基于特征扩展的中文短文本分类方法[J].计算机应用,2009,29(3):843-845. 被引量：36
3谢岚旭.智慧养老:让“空巢老人”不再孤单[J].上海信息化,2014(4):50-52. 被引量：14
4唐焕玲,孙建涛,陆玉昌.文本分类中结合评估函数的TEF-WA权值调整技术[J].计算机研究与发展,2005,42(1):47-53. 被引量：26
5宋健.“四二一”结构:形成及其发展趋势[J].中国人口科学,2000(2):41-45. 被引量：40
6龚静怡.居家养老—社区养老服务:符合中国国情的城镇养老模式[J].河海大学学报（哲学社会科学版）,2004,6(4):72-74. 被引量：93
7李惠娟,高峰,管晓宏,黄亮.基于贝叶斯神经网络的垃圾邮件过滤方法[J].微电子学与计算机,2005,22(4):107-111. 被引量：21
8许爱花.中国城市社区老年人养老模式之反思[J].宁夏大学学报（人文社会科学版）,2005,27(3):108-111. 被引量：54
9中国人口与发展研究中心课题组,马力,桂江丰.中国人口老龄化战略研究[J].经济研究参考,2011(34):2-23. 被引量：77
10朱远平,戴汝为.基于SVM决策树的文本分类器[J].模式识别与人工智能,2005,18(4):412-416. 被引量：24

共引文献726

1罗艳,童玉林.服务悬浮:主体行动逻辑下的居家养老服务信息化实践困境[J].郑州大学学报（哲学社会科学版）,2022,55(3):25-30. 被引量：7
2王计生,徐多勇,唐晏.互联网技术环境下老年心理健康服务系统设计[J].心理月刊,2019(21):1-3. 被引量：1
3骆魁永.一种面向不均衡数据集的CHI特征选择改进算法[J].商丘师范学院学报,2021,37(6):9-13.
4温欣.何以为家:跨国青年父母的养老挤压及对策建议[J].社会福利,2021(11):23-29.
5刘苓君.我国养老模式研究热点的知识图谱分析[J].老龄科学研究,2020(11):39-48. 被引量：2
6吴舒婷,于红润,尹航.一种可协助病人自行站立的双用床档设计[J].电子技术（上海）,2021,50(4):114-115.
7Lucheng Huang,Xiaoyu Li,Xin Li,Yang Wen,Fei Yuan.Research on the Influencing Factors of Gerontechnology Acceptance by Seniors:A Case Study of Beijing Elderly Citizens[J].Innovation and Development Policy,2021(2):91-109.
8王兆瑞,刘哲希,陈小亮.人口老龄化对政府债务的影响:基于非线性的视角[J].国际金融研究,2021(3):47-56. 被引量：11
9安艳辉,董五洲,游自英.基于改进的朴素贝叶斯文本分类研究[J].河北省科学院学报,2007,24(1):22-25. 被引量：7
10蒋英华.利用数据挖掘算法实现一个XML文档分类器[J].科技资讯,2005,3(25):66-70.

1王漩.试论政府网络新闻的写作[J].无线互联科技,2012,9(9):23-23.
2仇明.基于Asp.net的社区居家养老信息系统的设计与实现[J].玉林师范学院学报,2014,35(5):123-127. 被引量：1
3北京市将建专门团队管理政务微博[J].电子政务,2011(12):87-87. 被引量：2
4朱顺兵,邹万流.智能化养老系统建设研究[J].智能建筑与城市信息,2013(8):24-27. 被引量：2
5新浪政务微博排行榜发布“@成都发布”列西部首位[J].网友世界,2013(1):10-10.
6余永庆.在海量信息中寻找学习方法[J].教育（教学科研）（下旬）,2014,0(8):18-18.
7图片新闻[J].浙江节能,2010(4).
8陈骞,刘伟,孟庆久.信息资源规划中的主题数据库研究[J].情报杂志,2006,25(2):136-137. 被引量：12
9胡细玲,付达杰.浅析面向移动互联网的个性化新闻推荐算法[J].科技资讯,2015,13(24):21-22. 被引量：2
10徐志立.养老系统监管效果定量评估仿真研究[J].计算机仿真,2016,33(12):449-452. 被引量：2

计算机与现代化

2016年第12期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部