-
题名基于GitHub的ICT相关领域发展趋势的分析
- 1
-
-
作者
李鲲程
祖子月
费军旗
-
机构
中国信息通信研究院数据研究中心
-
出处
《信息通信技术与政策》
2021年第4期65-70,共6页
-
文摘
一定规模的用户对某类项目的关注度是评价该类项目所属行业发展趋势的重要参数之一,是行业发展趋势研究的数据基础。针对当前研究对象数据源获取的局限性问题,设计并实现了一个数据获取与分析系统。该系统可以根据关键词获取GitHub上指定行业的项目数据,以项目数量、关键项目的星标数量、复刻数量和提问数量为依据对项目数量和关注度的变化进行多维度分析,利用百度ECharts实现数据可视化,为研究行业发展的整体趋势提供参考。
-
关键词
GitHub
数据获取
PYTHON
REST
API
Echarts
-
Keywords
GitHub
data acquisition
Python
REST API
Echarts
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名基于关键词进行文本分类的研究与应用
被引量:1
- 2
-
-
作者
李鲲程
费军旗
祖子月
-
机构
中国信息通信研究院数据研究中心
-
出处
《通信管理与技术》
2020年第6期47-50,共4页
-
文摘
文本分类是自然语言处理(NLP)领域比较常见的应用场景。经过分类的语料便于用户进行更有针对性地进行数据分析。传统的文本分类通常基于机器学习,其效果受学习集数据的量和准确度的影响很大。本文通过建立分类关键词表的方法,结合词频统计、设置阈值和梯度参数等技术手段,实现对没有学习集或少量学习集的语料进行分类。
-
关键词
NLP
文本分类
词频统计
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-