-
题名一种基于中文分词和数据聚合的餐饮行为特征挖掘方法
被引量:10
- 1
-
-
作者
刘为怀
才华
何东杰
-
机构
中国银联电子支付研究院
-
出处
《软件产业与工程》
2015年第4期47-51,56,共6页
-
文摘
针持卡人使用银行卡进行日常交易时,通过商户类别码(MCC)可以判断交易商户是否为餐饮商户,但是无法进一步细分交易商户所属菜系。为了分析持卡人餐饮行为特征,提出了一种银联数据与外部数据相结合的数据聚合方法。选择百度地图餐饮数据作为外部数据,对不同菜系的餐馆名进行中文分词、清洗,形成区分不同菜系的关键词组。以银联大数据平台为基础,百度数据与银联数据通过Map Reduce技术进行聚合。百度菜系的关键词组对银联餐饮商户进行菜系划分,带有菜系标签的银联餐饮商户数据与银联持卡人日常交易数据进行聚合,挖掘出持卡人餐饮行为特征。
-
关键词
大数据
中文分词
数据挖掘
数据聚合
餐饮行为特征
-
Keywords
Big Data
Chinese Segmentation
Data Mining
Data Aggregation
Restaurant Behavior Characteristics
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名持卡人餐饮标签的设计和实现
- 2
-
-
作者
刘为怀
才华
-
机构
中国银联电子支付研究院
-
出处
《软件产业与工程》
2015年第5期19-22,46,共5页
-
文摘
针对银联餐饮商户无法进行菜系划分的问题,引入外部餐饮数据,首先利用结巴分词对外部餐饮数据进行分词,然后对分词后的外部餐饮数据进行清洗,形成餐饮商户不同菜系的划分标准,补充了银联餐饮商户的菜系划分数据,以餐饮商户不同菜系的划分数据为基础,与银联持卡人日常餐饮消费数据相结合,形成含有菜系划分的持卡人餐饮标签基础数据,以持卡人餐饮标签基础数据作为源数据,设计持卡人餐饮标签,实现每个持卡人打上不同的餐饮标签。
-
关键词
餐饮标签
菜系
分词
青睐口味
-
Keywords
Restaurant Label, Cuisine, Segmentation, Favor taste
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名开源许可证及其检测工具研究
被引量:3
- 3
-
-
作者
何东杰
宋昊
王琪
匡翔宇
刘为怀
蒋丹妮
-
机构
中国银联电子支付研究院电子商务与电子支付国家工程实验室
复旦大学计算机科学技术学院
-
出处
《计算机应用与软件》
北大核心
2018年第6期28-35,53,共9页
-
基金
上海市科委项目(16DZ1100200)
复旦-银联合作项目"中国银联2016年云计算基础数据研究"支持
-
文摘
开源许可证的不合理使用为企业留下了许多法律隐患,但主流的检测工具仅仅只能检测开源软件中的许可证名称、数量等,并不能给出风险分析。针对这些问题,对开源许可证进行了广泛研究,提出商业化风险、许可证兼容风险、专利侵权风险、产权归属风险、商标使用风险、服务提供风险等方面的法律风险,设计并实现了开源许可证兼容性和合法性检测系统。该系统能够从许可证版权信息、许可证详细信息、许可证兼容问题、许可证法律风险四个方面给出风险分析,为开源软件的合法使用提供了重要的参考依据。
-
关键词
开源
许可证
合法性
兼容性
-
Keywords
Open source
Licenses
Legality Compatibility
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名金融行业开源软件漏洞风险评估框架研究
被引量:1
- 4
-
-
作者
何东杰
匡翔宇
王琪
刘为怀
蒋丹妮
杨洁
-
机构
中国银联电子商务与电子支付国家工程实验室
复旦大学计算机科学技术学院
-
出处
《计算机应用与软件》
北大核心
2018年第9期113-118,137,共7页
-
基金
上海市科委项目(16DZ1100200)
复旦银联合作项目"中国银联2016年云计算基础数据研究"支持
-
文摘
在开源软件获得广泛使用的背景下,金融企业对于开源软件仍持有保守态度,主要原因在于对开源软件安全性的担忧。开源软件经常会有漏洞曝光,为了准确评估漏洞带来的风险,需要建立准确、客观、可操作的开源软件漏洞风险的评估框架。提出建立评估模型,并给出具体的实施方案。提出带有校验功能的信息获取方案和单漏洞风险评估攻击图算法。以两个CVE漏洞为例,验证了漏洞风险评估框架的可行性。
-
关键词
开源软件
信息安全
软件评测
-
Keywords
Open source software
Information security
Software evaluation
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-