期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于改进TF-PDF算法的地震微博热门主题词提取研究 被引量:8
1
作者 苏晓慧 张晓东 +2 位作者 胡春蕾 邹再超 邱晓康 《地理与地理信息科学》 CSCD 北大核心 2018年第4期90-95,共6页
随着网络通讯技术的发展和社交媒体工具的普及,越来越多的公众在微博平台发布、传播地震相关信息,而如何从这些信息中获取有用信息并为开展地震应急工作提供方向性的指导,成为研究的重点及难点。该文提出一种改进的TF-PDF算法,通过发布... 随着网络通讯技术的发展和社交媒体工具的普及,越来越多的公众在微博平台发布、传播地震相关信息,而如何从这些信息中获取有用信息并为开展地震应急工作提供方向性的指导,成为研究的重点及难点。该文提出一种改进的TF-PDF算法,通过发布微博的博主影响力以及微博的关注度确定地震主题特征项的权重。首先利用ICTCLAS分词系统对地震微博信息进行分词,然后在微博分词后的词库中依据权重对候选主题词进行排序,从而获得地震信息的热门主题词,并以芦山地震和云南彝良地震的微博信息为例,对传统TF-PDF算法和改进后的TFPDF算法进行了对比。结果表明,利用传统TF-PDF方法发现的地震热门主题词多为位置信息,而改进后的方法可以更有效地发现公众在震时的感受,可为灾害救援提供及时的信息与支持。 展开更多
关键词 地震热门主题 信息提取 微博抓取 微博影响力 TF-PDF
下载PDF
基于Web of Science的大气科学热门主题的论文数量趋势分析
2
作者 许惠青 程爽 《科技情报开发与经济》 2010年第4期140-142,共3页
以Web of Science(WS)网络数据库为数据源基础,查询和统计了1989—2008年间WS收录的气象学和大气科学类别中主题词,得出了近20年来大气科学领域中出现频率高的热门主题词,以及这些主题词的论文数量的变化趋势。
关键词 大气科学 热门主题 WEB of SCIENCE 变化趋势
下载PDF
基于CBOW-LDA主题模型的Stack Overflow编程网站热点主题发现研究 被引量:4
3
作者 张景 朱国宾 《计算机科学》 CSCD 北大核心 2018年第4期208-214,共7页
Stack Overflow是一个热门的国外编程问答网站,通过对该网站编程提问帖的问题文本进行文本语义挖掘,能获析用户关注的编程热点。由于研究对象所代表的短文本信息具有高维性及分布不均的特点,易导致主题获取不明晰。文中提出一种基于LDA(... Stack Overflow是一个热门的国外编程问答网站,通过对该网站编程提问帖的问题文本进行文本语义挖掘,能获析用户关注的编程热点。由于研究对象所代表的短文本信息具有高维性及分布不均的特点,易导致主题获取不明晰。文中提出一种基于LDA(Latent Dirichlet Allocation)主题模型的CBOW-LDA建模方法,该方法对目标语料进行相似词聚类后再完成主题建模,能有效降低文本输入维度,使主题分布更明确。采集Stack Overflow网站上2010-2015年的问题帖数据集POST,并对其进行实验,同等主题数下采用文本建模中衡量模型性能的评价指标困惑度(Perplexity)来度量算法在不同数据集容量维度下的性能。结果表明,与现有的基于词频权重的词量化主题建模TFLDA方法相比,CBOW-LDA方法的困惑度更低,在实验语料下的困惑度降低约4.87%,证明了所提算法的性能更好。采用CBOW-LDA方法对Stack Overflow进行热点挖掘,同时使用TF-LDA方法进行对比实验,建立手工标注的标准评测集对两种方法获取的热门主题和热搜词汇进行查全率、查准率及F1值的判定,结果证实CBOW-LDA表现更佳,其热点挖掘效果较好。由实验结果可知,Java为该编程网站提问帖中最热门的主题,而C和Javascript则为该网站用户提问中被提及得最频繁的词汇。 展开更多
关键词 STACK OVERFLOW LDA-CBOW语言模型 主题发现 热门主题 困惑度
下载PDF
基于R语言的区域技术创新政策量化分析 被引量:29
4
作者 张永安 马昱 《情报杂志》 CSSCI 北大核心 2017年第3期113-118,共6页
[目的/意义]如何快速的掌握区域技术创新政策的主题变迁以及演变规律,是政策研究的热点问题。政策文本是政策的核心要素,对其进行深度的内容挖掘对政策的制定具有重要的意义。[方法/过程]基于主题模型的新视角,在采集国家、北京市、中... [目的/意义]如何快速的掌握区域技术创新政策的主题变迁以及演变规律,是政策研究的热点问题。政策文本是政策的核心要素,对其进行深度的内容挖掘对政策的制定具有重要的意义。[方法/过程]基于主题模型的新视角,在采集国家、北京市、中关村园区的2007~2015年出台的技术创新政策的基础上,利用R语言对政策文本进行主题挖掘,并对词汇高频词、热门主题和主题变迁趋势等进行综合分析。[结果/结论]国家层级技术创新政策主要集中在基金管理、技术创新和改革发展机制上,北京市层级政策集中在创新产业发展、融资和资金管理上,中关村园区层级政策主要集中在银行信贷、金融服务和基地建设上。研究所得数据为区域技术创新政策法规体系的制定提出完善建议,为政策制定和出台提供数据支持。 展开更多
关键词 R语言 主题模型 热门主题 主题变迁 技术创新政策 政策量化
下载PDF
基于知识图谱的国际学习科学研究 被引量:1
5
作者 邓国民 张丽萍 《现代教育技术》 CSSCI 北大核心 2018年第7期11-17,共7页
文章使用CiteSpace软件,对Web of Science核心数据库中收录的2352条学习科学研究文献数据进行了知识图谱分析,发现目前国际学习科学研究的热门主题主要集中于教师&学生、学习过程、学习内容、认知心理、技术环境、学习结果和学习科... 文章使用CiteSpace软件,对Web of Science核心数据库中收录的2352条学习科学研究文献数据进行了知识图谱分析,发现目前国际学习科学研究的热门主题主要集中于教师&学生、学习过程、学习内容、认知心理、技术环境、学习结果和学习科学等七个维度,并呈现了这七个维度的主要研究成果。此外,文章还探讨了国际学习科学研究的发展趋势及其对中国教育改革与发展的启示,以期为促进信息化环境下学习理论的建构、应用和研究等提供参考。 展开更多
关键词 学习科学 知识图谱 核心素养 教育信息化2.0 热门主题
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部