期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
三甲胺气体检测技术的研究进展 被引量:2
1
作者 刘仕阳 《化工技术与开发》 CAS 2010年第4期31-33,共3页
对近年来出现的三甲胺(TMA)气体的检测方法及各种传感器的原理做了详细的介绍,并对其应用前景进行了展望。
关键词 三甲胺 检测 传感器
下载PDF
多源数据环境下公共文化服务机构年报的数据抽取研究 被引量:6
2
作者 刘仕阳 王威威 化柏林 《图书馆杂志》 CSSCI 北大核心 2020年第12期52-60,共9页
一方面公共文化服务机构数据资源丰富却难以集成,另一方面公共文化领域缺少宏观的管理数据。年报文档中包含着场馆信息、活动数据和业务数据等丰富的数据,而且年报的数据质量相对较高,是公共文化服务领域一种重要的数据来源。如何从年... 一方面公共文化服务机构数据资源丰富却难以集成,另一方面公共文化领域缺少宏观的管理数据。年报文档中包含着场馆信息、活动数据和业务数据等丰富的数据,而且年报的数据质量相对较高,是公共文化服务领域一种重要的数据来源。如何从年报文档中抽取数据并进行有效集成,成为多源数据环境下的一项重要研究内容。编写爬虫程序下载年报文档,判定PDF文件格式、总结年报的文本结构和特定数据项的上下文特征,通过正则表达式对各类年报数据建立模板进行匹配并抽取。本文针对数据位于段落标题中的数据、有明显数字特征的数据和有固定统一格式的大事记等不同类型的数据项设计了3套模板,取得较好的匹配和抽取效果。 展开更多
关键词 图书馆 文化馆 年报 数据抽取 公共文化
下载PDF
基于LDA的公共文化主题提取与演化分析 被引量:2
3
作者 刘仕阳 化柏林 《图书情报研究》 2021年第2期28-37,共10页
[目的/意义]当前公共文化活动丰富多彩、各种新举措层出不穷,如何快速全面地了解公共文化发展的各类模式、最新动态,成为公共文化领域需要解决的一个问题。[方法/过程]采用scrapy爬虫获取各省级图书馆、文化馆官网所发布的活动资讯和新... [目的/意义]当前公共文化活动丰富多彩、各种新举措层出不穷,如何快速全面地了解公共文化发展的各类模式、最新动态,成为公共文化领域需要解决的一个问题。[方法/过程]采用scrapy爬虫获取各省级图书馆、文化馆官网所发布的活动资讯和新闻报道文本,经过预处理后对文本进行分词并使用TF-IDF算法提取关键词,结合LDA主题模型进行主题建模并分类。根据主题分类结果对所有文档进行主题标注,从时间和空间维度对文档主题进行统计分析和可视化展示。[结果/结论]从时间上看,个别主题近年来逐渐成为热点,相关新闻活动数量迅速增长;从省域分布角度来看,各省所反映的主题具有较强的差异性。 展开更多
关键词 公共文化服务 TF-IDF LDA主题模型 主题演化 官网信息
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部