期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于K-means的专利文本聚类分析 被引量:8
1
作者 齐丽花 张妮妮 秦晓梅 《电脑知识与技术》 2018年第8期206-207,214,共3页
为分析隐含在专利数据中不易直接统计得出的信息,将数据挖掘技术应用到专利信息的分析中。本文选取经典的聚类算法对专利的文本信息进行聚类分析。主要针对专利的标题、摘要等文本进行聚类,首先将专利的文本信息进行预处理,再利用TF-ID... 为分析隐含在专利数据中不易直接统计得出的信息,将数据挖掘技术应用到专利信息的分析中。本文选取经典的聚类算法对专利的文本信息进行聚类分析。主要针对专利的标题、摘要等文本进行聚类,首先将专利的文本信息进行预处理,再利用TF-IDF权值计算法将专利文本信息向量化,然后采用K-means算法对向量化的数据进行聚类分析。最后选取钢铁产业链中最具创新性环节节能减排主题的部分国内外专利数据,采用Python语言进行编程验证,对聚类结果进行阐述。 展开更多
关键词 专利文本聚类 数据挖掘 K-MEANS PYTHON 钢铁行业
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部