期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于K-means的专利文本聚类分析
被引量:
8
1
作者
齐丽花
张妮妮
秦晓梅
《电脑知识与技术》
2018年第8期206-207,214,共3页
为分析隐含在专利数据中不易直接统计得出的信息,将数据挖掘技术应用到专利信息的分析中。本文选取经典的聚类算法对专利的文本信息进行聚类分析。主要针对专利的标题、摘要等文本进行聚类,首先将专利的文本信息进行预处理,再利用TF-ID...
为分析隐含在专利数据中不易直接统计得出的信息,将数据挖掘技术应用到专利信息的分析中。本文选取经典的聚类算法对专利的文本信息进行聚类分析。主要针对专利的标题、摘要等文本进行聚类,首先将专利的文本信息进行预处理,再利用TF-IDF权值计算法将专利文本信息向量化,然后采用K-means算法对向量化的数据进行聚类分析。最后选取钢铁产业链中最具创新性环节节能减排主题的部分国内外专利数据,采用Python语言进行编程验证,对聚类结果进行阐述。
展开更多
关键词
专利文本聚类
数据挖掘
K-MEANS
PYTHON
钢铁行业
下载PDF
职称材料
题名
基于K-means的专利文本聚类分析
被引量:
8
1
作者
齐丽花
张妮妮
秦晓梅
机构
河北工程大学
出处
《电脑知识与技术》
2018年第8期206-207,214,共3页
文摘
为分析隐含在专利数据中不易直接统计得出的信息,将数据挖掘技术应用到专利信息的分析中。本文选取经典的聚类算法对专利的文本信息进行聚类分析。主要针对专利的标题、摘要等文本进行聚类,首先将专利的文本信息进行预处理,再利用TF-IDF权值计算法将专利文本信息向量化,然后采用K-means算法对向量化的数据进行聚类分析。最后选取钢铁产业链中最具创新性环节节能减排主题的部分国内外专利数据,采用Python语言进行编程验证,对聚类结果进行阐述。
关键词
专利文本聚类
数据挖掘
K-MEANS
PYTHON
钢铁行业
Keywords
Patent text clustering
Data mining
K-means
Python
iron and steel industry
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于K-means的专利文本聚类分析
齐丽花
张妮妮
秦晓梅
《电脑知识与技术》
2018
8
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部