期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于XGBoost模型的电商商品品名识别算法研究
被引量:
6
1
作者
李晓峰
马静
+1 位作者
李驰
朱恒民
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2019年第7期34-41,共8页
【目的】针对淘宝商品上架自动类目识别需求,在电子商务领域中提出商品品名识别问题。【方法】通过合作方获取的大量商品交易数据,构建电商商品描述数据集,并对数据集人工标注;使用基于XGBoost模型的有监督机器学习算法,对电商商品描述...
【目的】针对淘宝商品上架自动类目识别需求,在电子商务领域中提出商品品名识别问题。【方法】通过合作方获取的大量商品交易数据,构建电商商品描述数据集,并对数据集人工标注;使用基于XGBoost模型的有监督机器学习算法,对电商商品描述短文本进行品名识别研究。【结果】实验结果表明,该算法对最终20059条数据集上的816种商品的识别准确率为85%,召回率为87%。【局限】商品种类不够完善,语料库中的商品种类和描述数量可进一步丰富。【结论】本研究在电子商务领域中尝试使用机器学习算法解决商品品名识别问题。实验证明本算法是合理的、有效的,具有实际应用价值。
展开更多
关键词
电子商务
商品描述
品名识别
XGBoost
特征抽取
原文传递
题名
基于XGBoost模型的电商商品品名识别算法研究
被引量:
6
1
作者
李晓峰
马静
李驰
朱恒民
机构
南京航空航天大学经济与管理学院
阿里巴巴浙江菜鸟供应链管理有限公司
南京邮电大学经济与管理学院
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2019年第7期34-41,共8页
基金
国家自然科学基金面上项目“基于演化本体的网络舆情自适应话题跟踪方法研究”(项目编号:71373123)
国家自然科学基金项目“基于主路径网络的舆情传播态势预测与干预研究——以社会化媒体中舆情为对象”(项目编号:71874088)的研究成果之一
中央高校基本科研业务费专项:前瞻性发展策略研究资助项目“基于大数据技术的跨境电商政府管理范式研究”(项目编号:NW2018004)
文摘
【目的】针对淘宝商品上架自动类目识别需求,在电子商务领域中提出商品品名识别问题。【方法】通过合作方获取的大量商品交易数据,构建电商商品描述数据集,并对数据集人工标注;使用基于XGBoost模型的有监督机器学习算法,对电商商品描述短文本进行品名识别研究。【结果】实验结果表明,该算法对最终20059条数据集上的816种商品的识别准确率为85%,召回率为87%。【局限】商品种类不够完善,语料库中的商品种类和描述数量可进一步丰富。【结论】本研究在电子商务领域中尝试使用机器学习算法解决商品品名识别问题。实验证明本算法是合理的、有效的,具有实际应用价值。
关键词
电子商务
商品描述
品名识别
XGBoost
特征抽取
Keywords
E-Commerce
Product Description
Product Name Recognition
XGBoost
Feature Extraction
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
G35 [文化科学—情报学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于XGBoost模型的电商商品品名识别算法研究
李晓峰
马静
李驰
朱恒民
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2019
6
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部