期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多类重采样的非平衡数据极速学习机集成学习
被引量:
5
1
作者
邢胜
王熙照
王晓兰
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2016年第1期203-211,共9页
极速学习机(Extreme learning machine,ELM)虽然已在理论和应用中证实有很好的泛化性能和极快的训练速度,但是在处理非均衡数据时,它更偏向多数类且极容易忽略少数类,基于数据重采样的集成学习可以帮助ELM解决少数类分类精度低的问题....
极速学习机(Extreme learning machine,ELM)虽然已在理论和应用中证实有很好的泛化性能和极快的训练速度,但是在处理非均衡数据时,它更偏向多数类且极容易忽略少数类,基于数据重采样的集成学习可以帮助ELM解决少数类分类精度低的问题.提出一种按类别重采样技术并据此发展了一种ELM集成学习方法.该方法可充分利用少数类样本的信息,实验结果显示该方法性能明显优于单一的ELM学习模型.由于重采样是大数据处理的最核心的技术之一,该方法对非均衡大数据的学习模型建立有着一般性的指导意义.
展开更多
关键词
极速学习机
非均衡数据
重采样
集成学习
下载PDF
职称材料
基于中文短信文本聚类的热点事件发现
被引量:
4
2
作者
刘金岭
王新功
《情报杂志》
CSSCI
北大核心
2013年第2期30-33,共4页
随着通信事业的快速发展,短信文本信息量非常巨大,乃至亿级,同时大类别短信文本中隐含着热点事件。现有聚类算法对海量短信文本进行聚类分析显得力不从心。利用短信文本在给定时间段中的内聚性,对待聚类的短信文本进行排序,并在聚类过...
随着通信事业的快速发展,短信文本信息量非常巨大,乃至亿级,同时大类别短信文本中隐含着热点事件。现有聚类算法对海量短信文本进行聚类分析显得力不从心。利用短信文本在给定时间段中的内聚性,对待聚类的短信文本进行排序,并在聚类过程中清除孤立信息和小类别短信文本。实验表明,对于海量短信文本的大类别聚类效率是非常高的。
展开更多
关键词
大类别
短信文本聚类方法热点事件
下载PDF
职称材料
手机短信文本信息流的自动文摘生成
被引量:
4
3
作者
刘金岭
倪晓红
王新功
《现代图书情报技术》
CSSCI
北大核心
2013年第2期43-49,共7页
针对手机短信文本信息流的特点,设计一种自动文摘生成模型。该模型利用词共现定义语义相似度,根据TF-IDF定义特征词权值以及文摘候选句权值。算法通过清除孤立点、根据权值筛选文摘句以及文摘句排序,生成冗余度较小且可读性较好的短信...
针对手机短信文本信息流的特点,设计一种自动文摘生成模型。该模型利用词共现定义语义相似度,根据TF-IDF定义特征词权值以及文摘候选句权值。算法通过清除孤立点、根据权值筛选文摘句以及文摘句排序,生成冗余度较小且可读性较好的短信文本信息流文摘。相关数据实验证明,文摘句的生成质量和算法效率都比较高。
展开更多
关键词
手机短信文本
信息流
文摘
权值
原文传递
题名
基于多类重采样的非平衡数据极速学习机集成学习
被引量:
5
1
作者
邢胜
王熙照
王晓兰
机构
河北大学管理
学院
沧州师范学院
计算机
系
河北大学数学与信息科学
学院
沧州
职业技术
学院
信息工程
系
出处
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2016年第1期203-211,共9页
基金
国家自然科学基金(61170040
71371063)
文摘
极速学习机(Extreme learning machine,ELM)虽然已在理论和应用中证实有很好的泛化性能和极快的训练速度,但是在处理非均衡数据时,它更偏向多数类且极容易忽略少数类,基于数据重采样的集成学习可以帮助ELM解决少数类分类精度低的问题.提出一种按类别重采样技术并据此发展了一种ELM集成学习方法.该方法可充分利用少数类样本的信息,实验结果显示该方法性能明显优于单一的ELM学习模型.由于重采样是大数据处理的最核心的技术之一,该方法对非均衡大数据的学习模型建立有着一般性的指导意义.
关键词
极速学习机
非均衡数据
重采样
集成学习
Keywords
extreme learning machine(ELM)
imbalanced data
resampling
ensemble learning
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于中文短信文本聚类的热点事件发现
被引量:
4
2
作者
刘金岭
王新功
机构
淮阴工
学院
计算机
工程
学院
淮安
沧州师范学院计算机系沧州
出处
《情报杂志》
CSSCI
北大核心
2013年第2期30-33,共4页
基金
河北省科技支撑计划项目“垃圾信息的预意识别”(编号:10213581)
淮阴工学院重点基金项目(编号:HGA0907)资助
文摘
随着通信事业的快速发展,短信文本信息量非常巨大,乃至亿级,同时大类别短信文本中隐含着热点事件。现有聚类算法对海量短信文本进行聚类分析显得力不从心。利用短信文本在给定时间段中的内聚性,对待聚类的短信文本进行排序,并在聚类过程中清除孤立信息和小类别短信文本。实验表明,对于海量短信文本的大类别聚类效率是非常高的。
关键词
大类别
短信文本聚类方法热点事件
Keywords
large size class SMS text clustering method hot events
分类号
G206.3 [文化科学—传播学]
下载PDF
职称材料
题名
手机短信文本信息流的自动文摘生成
被引量:
4
3
作者
刘金岭
倪晓红
王新功
机构
淮阴工
学院
计算机
工程
学院
沧州师范学院
计算机
系
出处
《现代图书情报技术》
CSSCI
北大核心
2013年第2期43-49,共7页
基金
河北省科技支撑计划项目"手机垃圾短信语义识别与分类"(项目编号:10213581)
淮安市社会支撑基金项目"基于数据挖掘的淮安市人力资源及就业状况研究"(项目编号:HASZ2012046)的研究成果之一
文摘
针对手机短信文本信息流的特点,设计一种自动文摘生成模型。该模型利用词共现定义语义相似度,根据TF-IDF定义特征词权值以及文摘候选句权值。算法通过清除孤立点、根据权值筛选文摘句以及文摘句排序,生成冗余度较小且可读性较好的短信文本信息流文摘。相关数据实验证明,文摘句的生成质量和算法效率都比较高。
关键词
手机短信文本
信息流
文摘
权值
Keywords
Mobile short message text Information flow Abstracts Weights
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于多类重采样的非平衡数据极速学习机集成学习
邢胜
王熙照
王晓兰
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2016
5
下载PDF
职称材料
2
基于中文短信文本聚类的热点事件发现
刘金岭
王新功
《情报杂志》
CSSCI
北大核心
2013
4
下载PDF
职称材料
3
手机短信文本信息流的自动文摘生成
刘金岭
倪晓红
王新功
《现代图书情报技术》
CSSCI
北大核心
2013
4
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部