期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于GitHub的ICT相关领域发展趋势的分析
1
作者 李鲲程 祖子月 费军旗 《信息通信技术与政策》 2021年第4期65-70,共6页
一定规模的用户对某类项目的关注度是评价该类项目所属行业发展趋势的重要参数之一,是行业发展趋势研究的数据基础。针对当前研究对象数据源获取的局限性问题,设计并实现了一个数据获取与分析系统。该系统可以根据关键词获取GitHub上指... 一定规模的用户对某类项目的关注度是评价该类项目所属行业发展趋势的重要参数之一,是行业发展趋势研究的数据基础。针对当前研究对象数据源获取的局限性问题,设计并实现了一个数据获取与分析系统。该系统可以根据关键词获取GitHub上指定行业的项目数据,以项目数量、关键项目的星标数量、复刻数量和提问数量为依据对项目数量和关注度的变化进行多维度分析,利用百度ECharts实现数据可视化,为研究行业发展的整体趋势提供参考。 展开更多
关键词 GitHub 数据获取 PYTHON REST API Echarts
下载PDF
基于关键词进行文本分类的研究与应用 被引量:1
2
作者 李鲲程 费军旗 祖子月 《通信管理与技术》 2020年第6期47-50,共4页
文本分类是自然语言处理(NLP)领域比较常见的应用场景。经过分类的语料便于用户进行更有针对性地进行数据分析。传统的文本分类通常基于机器学习,其效果受学习集数据的量和准确度的影响很大。本文通过建立分类关键词表的方法,结合词频... 文本分类是自然语言处理(NLP)领域比较常见的应用场景。经过分类的语料便于用户进行更有针对性地进行数据分析。传统的文本分类通常基于机器学习,其效果受学习集数据的量和准确度的影响很大。本文通过建立分类关键词表的方法,结合词频统计、设置阈值和梯度参数等技术手段,实现对没有学习集或少量学习集的语料进行分类。 展开更多
关键词 NLP 文本分类 词频统计
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部