-
题名基于程度词典优化的中文科技规划文本分析
- 1
-
-
作者
郑新曼
董瑜
-
机构
中国科学院文献情报中心
中国科学院大学经济与管理学院信息资源管理系
-
出处
《现代情报》
2023年第9期74-84,共11页
-
基金
中国科学院文献情报能力建设专项“科技知识服务大数据基础”(项目编号:Y9290002)。
-
文摘
[目的/意义]明晰政策意图是当前政策文本量化分析的重要目标。结合基于中文政策文本词汇语义强度差异构建的程度词典的政策文本量化分析,具备高效识别政策意图的潜力。然而,现有程度词典存在词语数量少、权重设计单一、缺乏应用场景的问题,有必要开展进一步的优化与应用研究,以深化中文政策文本语义挖掘以及政策研究实践。[方法/过程]参考已有程度词典构建方法,使用不同类型的政策文本语料进行程度词数量的扩展,利用专家调查法进行程度词权重的优化,以近20年我国综合性科技规划文本为例,使用优化后的程度词典进行科技政策文本重要内容的识别与分析。[结果/结论]优化得到的分级程度词典具有信度和效度。使用程度词典分析科技政策时,可结合科技政策文本特有的体系结构,从多个层面细致地梳理政策的主要关注点及其发展演变,还可根据实际需求选择合适的分析粒度,开展问题导向型的中文政策研究或实践。
-
关键词
科技规划
文本挖掘
程度词典
政策量化分析
-
Keywords
science technology and innovation plan
text mining
degree lexicon
quantitative analysis of policy
-
分类号
G203
[文化科学—传播学]
-