政府公开信息自动标引的设计与实现被引量：2

Design and Implementation of Automatic Indexing of Government Public Information

下载PDF

导出

摘要目前政府信息公开主要依据《中华人民共和国政府信息公开条例》,但站在用户视角,需要根据不同的使用场景进行适配,因此对公文进行自动化标引具有重要意义。本文基于自然语言处理技术,通过词频、词性和词义的实验和分析,提炼公文标题中的范式,对国务院1969—2018年的4 388条公文进行自动化标引。其中以地域关键词和行业关键词为例进行标引,标引后提炼相关关键词可以供相关渠道进行搜索和二次加工。本文主要处理标题的标引,尚未对全文进行标引。 At present,government information disclosure is mainly based on the“Regulations on the Openness of Government Information of the People’s Republic of China”,but from the perspective of users,it needs to be adapted according to different usage scenarios.Therefore,it is of great significance to automate indexing of official documents.Based on natural language processing technology,this paper refines the paradigm in the official document title through the experiment and analysis of word frequency,part of speech and word meaning,and automatically indexes 4 388 official documents of the State Council from 1969 to 2018.In the case of regional keywords and industry keywords as an example,the relevant keywords can be searched and secondary processed after indexing.This article mainly deals with the indexing of the title,and the full text has not been indexed.

作者江华丽曹祺陈刚 JIANG HuaLi;CAO Qi;CHEN Gang(School of Cyber Science and Engineering,Wuhan University,Wuhan 430072,China;Greysh Group Co.,Ltd.,Beijing 100080,China)

机构地区武汉大学国家网络安全学院灰觋集团有限公司

出处《数字图书馆论坛》 CSSCI 2019年第1期43-49,共7页 Digital Library Forum

关键词政府信息公开文本挖掘自动化标引 Government Information Disclosure Text Mining Automated Indexing

分类号 G350 [文化科学—情报学]

引文网络
相关文献

参考文献10

1程大荣.从《国务院公报》看“意见”处理的规范化[J].档案学通讯,2015(1):35-38. 被引量：4
2李盛.《中华人民共和国政府信息公开条例》的制定背景、主要内容及目录编制[J].电子政务,2008(5):21-26. 被引量：7
3中华人民共和国政府信息公开条例[J].中华人民共和国国务院公报,2007(15):15-18. 被引量：2
4潘松.国务院公报中成语的运用[J].宿州学院学报,2011,26(1):54-57. 被引量：1
5吴洁明,赵文丽.新闻出版行业标准碎片化标引的研究与实现[J].计算机工程与设计,2017,38(8):2281-2286. 被引量：4
6王志刚.政府理念和经济增长:基于文本挖掘[J].经济社会体制比较,2016(6):5-6. 被引量：3
7贾君枝,闫晓美,武晓宇.政府信息公开的自动标引的设计与实现[J].情报理论与实践,2012,35(2):109-113. 被引量：4
8张新民,罗卫东.我国政府信息公开工作中的技术问题探析[J].图书情报工作,2008,52(8):58-61. 被引量：11
9朱晓峰,崔露方,陆敬筠.国内外政府信息公开研究的脉络、流派与趋势——基于WOS与CNKI期刊论文的计量与可视化[J].现代情报,2016,36(10):141-148. 被引量：17
10邓雪琳.改革开放以来中国政府职能转变的测量--基于国务院政府工作报告(1978-2015)的文本分析[J].中国行政管理,2015(8):30-36. 被引量：76

二级参考文献91

1薛澜,李宇环.走向国家治理现代化的政府职能转变:系统思维与改革取向[J].政治学研究,2014(5):61-70. 被引量：183
2李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量：92
3曹树金,司徒俊峰,马利霞.论政府信息资源的元数据标准[J].情报学报,2004,23(6):715-722. 被引量：26
4杨芳,杨振山.基于语义网技术的主题词自动标引[J].计算机工程与设计,2005,26(10):2837-2839. 被引量：4
5江东.以门户网站为支撑全面推进政府信息公开[J].信息化建设,2006(1):44-45. 被引量：1
6田苗苗,许建潮,汪津,丁桂英.基于遗传算法的Web信息自动标引研究[J].吉林大学学报（信息科学版）,2006,24(5):542-547. 被引量：6
7张承伟,赖洪波,乌丽娟.政府信息资源元数据及其标准化的研究[J].计算机应用研究,2006,23(12):51-53. 被引量：6
8安忻.“意见”文种使用中相关问题之我见[J].档案学通讯,2007(1):44-47. 被引量：4
9王芳.我国电子政务元数据的构建及其基于Web服务的共享实现[J].情报学报,2007,26(1):125-133. 被引量：19
10e-Government Metadata Standard Version 3.1. [2008-04-03]. http://www.govtalk.gov.uk/documents/eGMS%20version%203-1. doc.

共引文献118

1顾洁,高雨薇.协同治理视角下网络舆情治理主体信息传播特征分析——以“爱奇艺倒奶视频事件”为例[J].中国新闻传播研究,2022(5):50-66. 被引量：2
2刘河庆,梁玉成.政策内容再生产的影响机制——基于涉农政策文本的研究[J].社会学研究,2021(1):115-136. 被引量：40
3王珊,徐昱.基于政策文本的中医药产业问题研究[J].绥化学院学报,2023,43(3):19-21.
4焦静.图情档视角下政府信息公开研究综述[J].图书馆学研究（应用版）,2010(6):10-14. 被引量：4
5魏云波,张新民.我国政府信息公开目录建设的现状、问题与发展思路[J].图书馆建设,2008(12):2-4. 被引量：7
6张新民,祁斌刚.政府信息公开目录体系分类系统研究[J].图书馆建设,2008(12):15-20. 被引量：10
7张新民.对我国政府信息公开目录体系及其分类系统的几点思考[J].电子政务,2009(5):78-84. 被引量：7
8孙杨,张新民.统一建模语言在我国政府信息公开系统建设中的应用探析[J].电子政务,2009(8):102-105.
9黄建友.政府信息公开制度的法理探析[J].人文杂志,2009(5):177-180. 被引量：1
10李晓焰.试析政府网站在政府信息公开中存在的技术问题[J].电子政务,2009(9):99-101. 被引量：2

同被引文献95

1孙迪.科技文献标引问题探析——以国家图书馆为例[J].图书馆建设,2020,0(1):101-108. 被引量：3
2赵衍,张永娟,陈成材,陈恒.一种提高计算机自动赋词标引准确性的综合方法——基于创新型CBA数据库的实证分析[J].情报杂志,2012,31(5):185-191. 被引量：5
3熊回香,薛姣,李青维,夏佩.视频信息的对象关联交叉检索研究[J].图书情报工作,2011,55(S2):295-299. 被引量：1
4聂鑫.我国书目信息标准化工作发展述略[J].情报科学,2004,22(8):982-984. 被引量：3
5丁芹.基于格式语义格的自动标引和词相似度计算[J].情报理论与实践,2004,27(4):363-366. 被引量：6
6李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量：92
7谭金波,李艺,杨晓江.文本自动分类的测评研究进展[J].现代图书情报技术,2005(5):46-49. 被引量：13
8白振田,侯汉清.基于向量空间的行业自动分类系统应用[J].情报科学,2005,23(6):940-944. 被引量：4
9孟祥增,刘彤彦.一种基于内容的图像自动分类方法[J].情报杂志,2005,24(9):14-15. 被引量：4
10侯汉清,薛春香.用于中文信息自动分类的《中图法》知识库的构建[J].中国图书馆学报,2005,31(5):82-86. 被引量：25

引证文献2

1彭贤哲,郑建明,李佳新,石进.目录学思想在数据结构化过程的传承与应用[J].图书情报知识,2024,41(1):80-91.
2史雅莉,贺红钰.2003—2023年我国自动标引研究及实践进展[J].情报探索,2024(4):120-127.

1包楚晗,贾丹萍,何琳,马晓雯,艾毓茜.中文科技论文图表摘要设计研究——以图书情报领域为例[J].数据分析与知识发现,2017,1(10):21-31. 被引量：2
2胡媛,虞佳玲,艾文华.基于用户视角的健康信息服务平台质量评价研究[J].中国健康教育,2018,34(10):912-915. 被引量：6
3李雄伟,俞楠泽,黄久佐,王晓军,赵茹,白明,龙笑.自体脂肪移植成活率及严重并发症文献回顾[J].中国美容整形外科杂志,2018,29(11):689-692. 被引量：8
4华婷.公文标题拟制错例评析[J].应用写作,2018,0(12):10-12. 被引量：1
5杜玉忠,黄业草,何慧萍,范秀红,卢文涛,蔡永铭,蔡巧.基于百度指数和ARDL模型的广东省清远市2013-2017年手足口病发病数分析[J].预防医学情报杂志,2018,34(11):1388-1391. 被引量：5
6刘昊.微信朋友圈语言的特点[J].新闻传播,2018(21):12-13. 被引量：2
7张震.论大数据环境下的政府信息公开[J].中国国际财经（中英文版）,2018,0(14):59-60.
8李楠.“三需要”正确适用分析[J].当代旅游（下旬刊）,2018,0(7):00202-00202.
9谢君.从用户视角看国内语文词典收录字母词的类型选择[J].辽宁师范大学学报（社会科学版）,2019,42(1):117-123.
10新闻出版政府信息公开实施办法[J].中国期刊年鉴,2016,15(1):494-496.

数字图书馆论坛

2019年第1期

浏览历史

内容加载中请稍等...

政府公开信息自动标引的设计与实现被引量：2

参考文献10

二级参考文献91

共引文献118

同被引文献95

引证文献2

相关作者

相关机构

相关主题

浏览历史

政府公开信息自动标引的设计与实现 被引量：2

参考文献10

二级参考文献91

共引文献118

同被引文献95

引证文献2

相关作者

相关机构

相关主题

浏览历史

政府公开信息自动标引的设计与实现被引量：2