期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于ETL的金融数据集成过程模型
被引量:
5
1
作者
苌程
李善平
《计算机工程与设计》
CSCD
北大核心
2010年第9期2070-2072,2104,共4页
为了将频繁产生的分布在世界各地的金融数据按需地高性能集成,提出了基于ETL(extract-transform-load)的金融数据集成过程模型。对规则引擎原理进行了研究,建立了基于业务转换规则的插件式扩展实现可复用可定制的业务转换过程。利用事...
为了将频繁产生的分布在世界各地的金融数据按需地高性能集成,提出了基于ETL(extract-transform-load)的金融数据集成过程模型。对规则引擎原理进行了研究,建立了基于业务转换规则的插件式扩展实现可复用可定制的业务转换过程。利用事件驱动的交互模型和元数据映射保证非结构化和半结构化数据之间无差异集成,采用增量式数据处理解决数据集成中棘手的性能问题。通过实践项目的验证,对比传统数据集成方法和该过程模型,验证了该过程模型的有效性。
展开更多
关键词
数据抽取转换装载
数据集成
元数据映射
业务规则转换
按需交互
下载PDF
职称材料
Stack Overflow上机器学习相关问题的大规模实证研究
被引量:
4
2
作者
万志远
陶嘉恒
+4 位作者
梁家坤
才振功
苌程
乔林
周巧妮
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2019年第5期819-828,共10页
为了调查机器学习相关主题分布和发展趋势,从在线问答网站Stack Overflow上,利用过滤标签,从4 178多万帖子中提取出60 028个与机器学习相关的问题帖.通过分析问题帖,统计各个机器学习平台的讨论量,发现Scikit-learn、TensorFlow、Keras...
为了调查机器学习相关主题分布和发展趋势,从在线问答网站Stack Overflow上,利用过滤标签,从4 178多万帖子中提取出60 028个与机器学习相关的问题帖.通过分析问题帖,统计各个机器学习平台的讨论量,发现Scikit-learn、TensorFlow、Keras是前3位频繁被讨论的机器学习平台,占总讨论量的58%.为了进一步分析机器学习相关讨论主题,进行潜在狄利克雷分布(LDA)主题模型训练,提出自适应LDA中的主题数渐进搜索方法,采用主题一致性系数评估输出结果,获得主题最佳数量,从而发现9个讨论主题,分属3个类别:代码相关、模型相关、理论相关.基于主题中问题帖的浏览数、评论数,分析不同主题的流行度和回答困难程度.
展开更多
关键词
实证研究
机器学习
STACK
OVERFLOW
潜在狄利克雷分布(LDA)
主题一致性
下载PDF
职称材料
题名
基于ETL的金融数据集成过程模型
被引量:
5
1
作者
苌程
李善平
机构
浙江大学计算机学院
出处
《计算机工程与设计》
CSCD
北大核心
2010年第9期2070-2072,2104,共4页
文摘
为了将频繁产生的分布在世界各地的金融数据按需地高性能集成,提出了基于ETL(extract-transform-load)的金融数据集成过程模型。对规则引擎原理进行了研究,建立了基于业务转换规则的插件式扩展实现可复用可定制的业务转换过程。利用事件驱动的交互模型和元数据映射保证非结构化和半结构化数据之间无差异集成,采用增量式数据处理解决数据集成中棘手的性能问题。通过实践项目的验证,对比传统数据集成方法和该过程模型,验证了该过程模型的有效性。
关键词
数据抽取转换装载
数据集成
元数据映射
业务规则转换
按需交互
Keywords
ETL
data integration
metadata mapping
business rule transform
on demand request
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Stack Overflow上机器学习相关问题的大规模实证研究
被引量:
4
2
作者
万志远
陶嘉恒
梁家坤
才振功
苌程
乔林
周巧妮
机构
浙江大学计算机科学与技术学院
浙江大学软件学院
国网辽宁省电力有限公司信息通信分公司
出处
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2019年第5期819-828,共10页
基金
浙江大学-中移在线联合创新实验室资助项目(CMOS01HT20180623)
文摘
为了调查机器学习相关主题分布和发展趋势,从在线问答网站Stack Overflow上,利用过滤标签,从4 178多万帖子中提取出60 028个与机器学习相关的问题帖.通过分析问题帖,统计各个机器学习平台的讨论量,发现Scikit-learn、TensorFlow、Keras是前3位频繁被讨论的机器学习平台,占总讨论量的58%.为了进一步分析机器学习相关讨论主题,进行潜在狄利克雷分布(LDA)主题模型训练,提出自适应LDA中的主题数渐进搜索方法,采用主题一致性系数评估输出结果,获得主题最佳数量,从而发现9个讨论主题,分属3个类别:代码相关、模型相关、理论相关.基于主题中问题帖的浏览数、评论数,分析不同主题的流行度和回答困难程度.
关键词
实证研究
机器学习
STACK
OVERFLOW
潜在狄利克雷分布(LDA)
主题一致性
Keywords
empirical research
machine learning
Stack Overflow
latent Dirichlet allocation (LDA)
topic coherence
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于ETL的金融数据集成过程模型
苌程
李善平
《计算机工程与设计》
CSCD
北大核心
2010
5
下载PDF
职称材料
2
Stack Overflow上机器学习相关问题的大规模实证研究
万志远
陶嘉恒
梁家坤
才振功
苌程
乔林
周巧妮
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2019
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部