-
题名三甲胺气体检测技术的研究进展
被引量:2
- 1
-
-
作者
刘仕阳
-
机构
天津工业大学环境科学与化学工程学院
-
出处
《化工技术与开发》
CAS
2010年第4期31-33,共3页
-
文摘
对近年来出现的三甲胺(TMA)气体的检测方法及各种传感器的原理做了详细的介绍,并对其应用前景进行了展望。
-
关键词
三甲胺
检测
传感器
-
Keywords
trimethylamine
detection
sensor
-
分类号
O659.36
[理学—分析化学]
-
-
题名多源数据环境下公共文化服务机构年报的数据抽取研究
被引量:6
- 2
-
-
作者
刘仕阳
王威威
化柏林
-
机构
北京大学信息管理系
-
出处
《图书馆杂志》
CSSCI
北大核心
2020年第12期52-60,共9页
-
文摘
一方面公共文化服务机构数据资源丰富却难以集成,另一方面公共文化领域缺少宏观的管理数据。年报文档中包含着场馆信息、活动数据和业务数据等丰富的数据,而且年报的数据质量相对较高,是公共文化服务领域一种重要的数据来源。如何从年报文档中抽取数据并进行有效集成,成为多源数据环境下的一项重要研究内容。编写爬虫程序下载年报文档,判定PDF文件格式、总结年报的文本结构和特定数据项的上下文特征,通过正则表达式对各类年报数据建立模板进行匹配并抽取。本文针对数据位于段落标题中的数据、有明显数字特征的数据和有固定统一格式的大事记等不同类型的数据项设计了3套模板,取得较好的匹配和抽取效果。
-
关键词
图书馆
文化馆
年报
数据抽取
公共文化
-
Keywords
Library
Cultural center
Annual reports
Data extraction
Public culture
-
分类号
G252
[文化科学—图书馆学]
-
-
题名基于LDA的公共文化主题提取与演化分析
被引量:2
- 3
-
-
作者
刘仕阳
化柏林
-
机构
中山大学信息管理学院
北京大学信息管理系
公共文化服务大数据应用文化和旅游部重点实验室
-
出处
《图书情报研究》
2021年第2期28-37,共10页
-
基金
文化和旅游部重点实验室项目“公共文化智慧化模式聚类与动态展示系统研究”(项目编号:2020008)阶段研究成果之一。
-
文摘
[目的/意义]当前公共文化活动丰富多彩、各种新举措层出不穷,如何快速全面地了解公共文化发展的各类模式、最新动态,成为公共文化领域需要解决的一个问题。[方法/过程]采用scrapy爬虫获取各省级图书馆、文化馆官网所发布的活动资讯和新闻报道文本,经过预处理后对文本进行分词并使用TF-IDF算法提取关键词,结合LDA主题模型进行主题建模并分类。根据主题分类结果对所有文档进行主题标注,从时间和空间维度对文档主题进行统计分析和可视化展示。[结果/结论]从时间上看,个别主题近年来逐渐成为热点,相关新闻活动数量迅速增长;从省域分布角度来看,各省所反映的主题具有较强的差异性。
-
关键词
公共文化服务
TF-IDF
LDA主题模型
主题演化
官网信息
-
Keywords
public cultural service
TF-IDF
LDA model
theme evolution
official web
-
分类号
G250
[文化科学—图书馆学]
-