-
题名2003—2023年我国自动标引研究及实践进展
被引量:1
- 1
-
-
作者
史雅莉
贺红钰
-
机构
湖北大学历史文化学院
-
出处
《情报探索》
2024年第4期120-127,共8页
-
基金
教育部人文社会科学青年基金项目“我国科学数据引用标准化的实现路径研究”(项目编号:20YJC870007)
湖北省教育厅人文社会科学一般项目“数据驱动下的科学数据引用标准化成熟度研究”(项目编号:202011001301005)成果之一。
-
文摘
[目的/意义]对2003年以来我国自动标引的研发现状进行总结并预测未来发展动向,以期为文献自动标引实践的发展提供借鉴和参考。[方法/过程]通过文献调研和相关案例回顾,系统梳理2003—2023年我国文献自动标引的系统研发及典型应用,具体从自动主题标引和自动分类标引两方面展开。[结果/结论]自动标引发展面临不少现实问题,今后自动标引研究及实践应聚焦于技术上重点突破中文自动分词的语言分析问题、研究和探索更高效的语料库智能学习机制、集成化开发多媒体信息自动标引方法、多方联动构建文献自动标引效果的评价体系与监测机制。
-
关键词
自动主题标引
自动分类标引
标引技术
人工智能
-
Keywords
automatic subject indexing
automatic classification indexing
indexing technology
artificial intelligence
-
分类号
G250
[文化科学—图书馆学]
-
-
题名基于经济学原理的经济文献分类标引研究
- 2
-
-
作者
葛英
蒋鸿标
-
机构
广东海洋大学图书馆
-
出处
《情报探索》
2024年第9期111-117,共7页
-
基金
国家自然科学基金项目子课题“基于科学文献聚类原理的分类法改造研究”(项目编号:72274042)
广东海洋大学人文社会科学研究项目“海洋文化分类研究”(项目编号:030301322305)成果之一。
-
文摘
[目的/意义]分析《中国图书馆分类法》(第5版)“F经济”类目存在的体系结构不合理、编码不规范、注释不当等问题,以期为《中图法》的改版提供参考。[方法/过程]依据经济学由理论经济学和应用经济学构成的原理,并根据《中图法》“从总到分,从一般到具体”的编制原则,按照经济学理论与方法论、国民经济学(应用经济学)、产业经济学(部门经济学)、劳动经济学、商品经济学的结构对“F经济”类目作了科学分类。[结果/结论]提高了经济类目设置的科学性、逻辑性和实用性。
-
关键词
经济学原理
分类标引规则
《中图法》
-
Keywords
economic principle
classification indexing rule
Chinese Library Classification
-
分类号
F0
[经济管理—政治经济学]
G254.11
[文化科学—图书馆学]
-
-
题名基于分类标引原理的宗教文化类目探讨
- 3
-
-
作者
蒋鸿标
杨雪莹
-
机构
广东海洋大学图书馆
-
出处
《新世纪图书馆》
CSSCI
2024年第6期68-73,共6页
-
基金
国家自然科学基金项目子课题“基于科学文献聚类原理的分类法改造研究”(项目编号:72274042)
广东海洋大学人文社会科学研究项目“海洋文化分类研究”(项目编号:030301322305)成果之一。
-
文摘
调查《中图法》第5版“B9宗教”类目存在的体系结构缺乏逻辑、类号编制不规范以及国家图书馆和中国知网学术期刊库宗教文化分类标引混乱等问题,以期为《中图法》的改版提供参考。根据宗教的组成要素,按照类目之间的逻辑关系,将佛教、基督教、伊斯兰教(三大宗教)、其他宗教和术数作为宗教的主标目,将宗教哲学、宗教教义、宗教体制等共性问题作为宗教“理论与方法论”的内容,以期为各类宗教的仿分提供便利;将术数的具体内容设置为专类复分表,以期为各国术数提供仿分便利。通过对“B9宗教”类目的改进,增强了类目的伸缩性,节省了分类法的篇幅。
-
关键词
宗教文化
类目体系
分类标引
《中国图书馆分类法》
-
Keywords
Religion Culture
Category system
Classification indexing
Chinese Library Classification
-
分类号
G254.11
[文化科学—图书馆学]
-
-
题名中文文献地理元素标引的实践与思考
- 4
-
-
作者
兰艳花
-
机构
福建省图书馆
-
出处
《图书馆研究》
2024年第2期67-75,共9页
-
文摘
提高书目数据质量,规范文献主题标引,是中文文献信息组织与资源建设的基础环节。编目实践中有关中文文献地理主题的标引工作失序。地理学严密而系统的学科体系为精准揭示和深度标引地理元素提供了较为广阔的视角。结合对主题词表的分析研判以及对主题标引工作经验的提炼总结,明确地理标引的客观性、专指性、简洁性及实用性4项标引原则,结构化地理标引的基本步骤,规范化地理标引的常规做法。最后,从优化标引系统与编目工具、完善地理分类主题的逻辑体系、提升编目标引工作的管理效度等方面提出改进标引工作的措施。
-
关键词
地理元素
主题标引
中文文献
CNMARK
-
Keywords
geography element
subject indexing
Chinese literature
CNMARK
-
分类号
G254
[文化科学—图书馆学]
-
-
题名满足多层级和专精深信息需求的客家文献分类与标引
- 5
-
-
作者
刘菊霞
-
机构
嘉应学院图书馆
-
出处
《嘉应学院学报》
2024年第2期19-23,共5页
-
基金
2020年广东省普通高校人文社会科学省市共建重点研究基地嘉应学院客家研究院招标课题“晚清客家知识分子所藏海外文献及其对梅州的影响——以丁日昌、黄遵宪、丘逢甲为考察中心”(20KYKT07)
2022年梅州市哲学社会科学规划项目“构筑基础教育文献信息服务体系”(mzsklx2022060)。
-
文摘
文章阐述了科学编制并严格遵循客家文献的分编细则,深度标引和全方位揭示客家文献的必要性和基本途径:采用多种方式对客家文献进行分类,对所有的题名字段进行标引,详实著录附注项,深度标引规范主题词,全面添加专指性强的非控主题词,对地名主题进行规范控制。通过最大限度提高客家文献的“可辨识度”,提升查全率、查准率以及满足率与利用率,为客家地区的社会经济文化发展提供信息支撑。
-
关键词
客家文献
地方文献
分编细则
分类标引
文献著录
-
Keywords
Hakka literature
local literature
detailed rules for classification
classification indexing
document description
-
分类号
G254
[文化科学—图书馆学]
-
-
题名基于语义层级细粒度的海量文献标引研究
被引量:1
- 6
-
-
作者
罗宏宇
刘伟
-
机构
中国科学技术信息研究所
-
出处
《情报理论与实践》
CSSCI
北大核心
2024年第5期194-203,193,共11页
-
文摘
[目的/意义]信息资源爆炸式增长使科技文献知识的组织趋于自动化,文献自动标引是组织构建科技文献数字资源的基础和关键。针对目前科技文献自动标引语义粒度不够精准以及难以适应大规模海量文献标引的问题,提出了基于语义层级细粒度的自动标引方法。[方法/过程]在传统知识组织自动标引方法的基础上,对知识组织工具中的语义资源进行深入挖掘,借助知识组织中概念间的语义层级结构对概念信息进行语义扩展,并设计基于语义层级细粒度的概念遴选方法以解决传统方法标引效率过低的问题,从而实现对大规模文献的概念高效标引。[结果/结论]实验结果表明,文章所提出的方法较好地实现了概念表示效果,有效降低了不相关概念在标引结果中出现的几率,并且在提高了标引结果文献相关性的同时大大减少了标引所需的时间,实现了知识组织工具在自动标引领域更深层次的利用,为科技文献数字资源的挖掘计算提供有价值的参考和支持。
-
关键词
自动标引
语义层级
语义扩展
语义关系
词向量
-
Keywords
automatic indexing
semantic hierarchy
semantic extension
semantic relationship
word vector
-
分类号
G353.1
[文化科学—情报学]
-
-
题名大语言模型在分类标引工作中的应用探索
- 7
-
-
作者
姜鹏
任龑
朱蓓琳
-
机构
上海图书馆
-
出处
《农业图书情报学报》
2024年第5期32-42,共11页
-
基金
上海图书馆“2151工程”项目“AIGC服务辅助文献标引的适用性评价”。
-
文摘
[目的 /意义]文献分类标引是图书馆等信息机构基础工作之一,目前有限的人工难以类分数量庞大的文献。大语言模型以优异的自然语言理解和处理能力,被用于完成诸如文本生成、自动摘要、文本分类等相关自然语言任务,能够与文献标引全过程相结合,有助于缓解分类标引压力。[方法 /过程]结合《全国报刊索引》长期工作实践,从减轻标引人员阅读压力、大语言模型直接用于分类以及和自动标引模型相结合为切口,探索如何将大语言模型引入分类标引工作环节,以提高标引效率。[结果 /结论]通过一系列对比测试和分析,设计Prompt辅助主题分类模型以及ACBKSY自动标引模型。Prompt辅助主题分类模型标引人员快速了解文献重点,减少阅读压力。ACBKSY模型整体分类准确率提高了2.16%,非拒绝准确率提高了3.77%。在此基础上优化实际标引工作流程,目前此流程已在R、F大类文献标引中投入使用,经优化后的工作流程可以提高标引效率1.1~1.4倍。
-
关键词
分类标引
大语言模型
文心一言
GPT-4
-
Keywords
automatic indexing
large language model(LLM)
ERNIE bot
GPT-4
-
分类号
G250.7
[文化科学—图书馆学]
-
-
题名关键词标引的规范化
- 8
-
-
作者
本刊编辑部
-
机构
不详
-
出处
《中国微侵袭神经外科杂志》
CAS
2024年第7期430-430,共1页
-
文摘
关键词指论文中最能反映主题信息的特征词汇或词组、短语。我国国家标准规定,对论文的标引使用“关键词”一词,关键词中包括主题词和(或)副主题词以及少数自由词。生物医学领域使用频繁、而且又被使用者认可的主题词,约有15000个。
-
关键词
关键词标引
主题词
自由词
国家标准
规范化
主题信息
生物医学领域
-
分类号
G254.23
[文化科学—图书馆学]
-
-
题名关于关键词的标引
- 9
-
-
作者
本刊编辑部
-
机构
不详
-
出处
《实用肿瘤学杂志》
CAS
2024年第3期178-178,共1页
-
文摘
论文中需标注3~5个关键词,请务必使用美国国立医学图书馆编辑的最新版《Index Me-dicus》医学主题词表(MeSH)内所列出的词,也可以通过上网查检索词。如MeSH上尚无相应的主题词,处理办法:(1)选用直接相关的几个主题词进行组配;(2)选用约定俗成的词组或已被本研究领域广泛认同的自由词。
-
关键词
医学主题词表
检索词
关键词的标引
自由词
主题词
美国国立医学图书馆
约定俗成
-
分类号
G254.23
[文化科学—图书馆学]
-
-
题名《上海护理》关于关键词标引的要求
- 10
-
-
-
出处
《上海护理》
2024年第6期57-57,共1页
-
文摘
我刊发表的所有文章需标引3~8个关键词,关键词之间应用“;”隔开。论著、调查研究、专题策划等栏目还需提供对应的英文关键词,且每个英文关键词的首字母应大写。关键词应结合论文进行主题分析,尽可能从题名、摘要、层次标题和正文的重要段落中抽出与主题概念一致的词和词组。
-
关键词
专题策划
主题分析
关键词标引
层次标题
英文关键词
主题概念
上海护理
重要段落
-
分类号
G254.23
[文化科学—图书馆学]
-
-
题名关键词标引的规范化
- 11
-
-
作者
本刊编辑部
-
机构
不详
-
出处
《中国微侵袭神经外科杂志》
CAS
2024年第4期231-231,共1页
-
文摘
关键词指论文中最能反映主题信息的特征词汇或词组、短语。我国国家标准规定,对论文的标引使用“关键词”一词,关键词中包括主题词和(或)副主题词以及少数自由词。生物医学领域使用频繁、而且又被使用者认可的主题词,约有15000个;每年最新版美国国立图书馆编辑的《Index Medicus》中医学主题词表(MeSH)内所列的词均有所增删。
-
关键词
国立图书馆
医学主题词表
关键词标引
主题词
自由词
主题信息
规范化
国家标准
-
分类号
G254.23
[文化科学—图书馆学]
-
-
题名关于中文关键词的标引
- 12
-
-
作者
《临床外科杂志》编辑部
-
机构
不详
-
出处
《临床外科杂志》
2024年第10期1021-1021,共1页
-
文摘
《临床外科杂志》要求论著类文章需标引2~5个中文关键词:。请使用中国医学科学院医学信息研究所的《中文医学主题词表》(CmeSH)所列的词,或登录万方医学网:http://med.wanfangdata.com.cn/Mesh/Mesh.aspx查找。如果查不到相应的中文关键词:,处理方法有:(1)可选用直接相关的几个主题词进行组配。(2)可根据树状结构表选用最直接的上位主题词。(3)必要时,可采用习用的自由词并排列于最后。每个英文中文关键词:第一个字母大写,各词汇之间空2个字。
-
关键词
中国医学科学院
论著类文章
标引
自由词
MESH
万方医学网
-
分类号
G254.23
[文化科学—图书馆学]
-
-
题名《上海护理》关于关键词标引的要求
- 13
-
-
-
出处
《上海护理》
2024年第11期69-69,共1页
-
文摘
我刊发表的所有文章需标引3~8个关键词,关键词之间应用“;”隔开。论著、调查研究、专题策划等栏目还需提供对应的英文关键词,且每个英文关键词的首字母应大写。关键词应结合论文进行主题分析,尽可能从题名、摘要、层次标题和正文的重要段落中抽出与主题概念一致的词和词组。关键词选取应参照中国医学科学院医学信息研究所发布的《中文医学主题词表》,或直接登录万方医学网(http://old.med.wanfangdata.com.cn/Mesh/Index.aspx)进行MeSH检索,其他类术语也可登录全国科学技术名词审定委员会主办的“术语在线”网页或手机端平台检索查询。必要时,可采用习用的自由词作为关键词并排列在最后。
-
关键词
专题策划
检索查询
中国医学科学院
关键词标引
主题分析
主题概念
自由词
层次标题
-
分类号
G254.23
[文化科学—图书馆学]
-
-
题名《上海护理》关于关键词标引的要求
- 14
-
-
-
出处
《上海护理》
2024年第8期73-73,共1页
-
文摘
我刊发表的所有文章需标引3~8个关键词,关键词之间应用“;”隔开。论著、调查研究、专题策划等栏目还需提供对应的英文关键词,且每个英文关键词的首字母应大写。关键词应结合论文进行主题分析,尽可能从题名、摘要、层次标题和正文的重要段落中抽出与主题概念一致的词和词组。关键词选取应参照中国医学科学院医学信息研究所发布的《中文医学主题词表》,或直接登录万方医学网(http://old.med.wanfangdata.com.cn/Mesh/Index.aspx)进行MeSH检索,其他类术语也可登录全国科学技术名词审定委员会主办的“术语在线”网页或手机端平台检索查询。必要时,可采用习用的自由词作为关键词并排列在最后。
-
关键词
专题策划
检索查询
中国医学科学院
关键词标引
主题分析
主题概念
自由词
层次标题
-
分类号
G254.23
[文化科学—图书馆学]
-
-
题名关于关键词的标引
- 15
-
-
作者
《临床外科杂志》编辑部
-
机构
不详
-
出处
《临床外科杂志》
2024年第7期756-756,共1页
-
文摘
《临床外科杂志》要求论著类文章需标引2~5个关键词。请使用中国医学科学院医学信息研究所的《中文医学主题词表》(CmeSH)所列的词,或登录万方医学网:http://med.wanfangdata.com.cn/Mesh/Mesh.aspx查找。如果查不到相应的关键词,处理方法有:(1)可选用直接相关的几个主题词进行组配。
-
关键词
论著类文章
中国医学科学院
关键词的标引
MESH
主题词
万方医学网
-
分类号
G254.23
[文化科学—图书馆学]
-
-
题名《上海护理》关于关键词标引的要求
- 16
-
-
-
出处
《上海护理》
2024年第5期10-10,共1页
-
文摘
我刊发表的所有文章需标引3~8个关键词,关键词之间应用“;”隔开。论著、调查研究、专题策划等栏目还需提供对应的英文关键词,且每个英文关键词的首字母应大写。关键词应结合论文进行主题分析,尽可能从题名、摘要、层次标题和正文的重要段落中抽出与主题概念一致的词和词组。关键词选取应参照中国医学科学院医学信息研究所发布的《中文医学主题词表》。
-
关键词
专题策划
中国医学科学院
关键词标引
主题分析
英文关键词
层次标题
主题概念
上海护理
-
分类号
G254.23
[文化科学—图书馆学]
-
-
题名关键词标引的规范化
- 17
-
-
作者
本刊编辑部
-
机构
不详
-
出处
《中国微侵袭神经外科杂志》
CAS
2024年第6期351-351,共1页
-
文摘
关键词指论文中最能反映主题信息的特征词汇或词组、短语。我国国家标准规定,对论文的标引使用“关键词”一词,关键词中包括主题词和(或)副主题词以及少数自由词。生物医学领域使用频繁、而且又被使用者认可的主题词,约有15000个;每年最新版美国国立图书馆编辑的《Index Medicus》中医学主题词表(MeSH)内所列的词均有所增删。标引关键词的主要工具书为《医药学名词与主题词(MeSH)对应表》(中国医学科学院医学信息研究所)。若主题词表尚无相应的词,则通常采取选用上位词、同义词,或采用组配等办法。
-
关键词
国立图书馆
医学主题词表
中国医学科学院
上位词
关键词标引
自由词
副主题词
主题信息
-
分类号
G254.23
[文化科学—图书馆学]
-
-
题名关键词标引的规范化
- 18
-
-
作者
本刊编辑部
-
机构
不详
-
出处
《中国微侵袭神经外科杂志》
CAS
2024年第5期273-273,共1页
-
文摘
关键词指论文中最能反映主题信息的特征词汇或词组、短语。我国国家标准规定,对论文的标引使用“关键词”一词,关键词中包括主题词和(或)副主题词以及少数自由词。生物医学领域使用频繁、而且又被使用者认可的主题词,约有15000个;每年最新版美国国立图书馆编辑的《Index Medicus》中医学主题词表(MeSH)内所列的词均有所增删。标引关键词的主要工具书为《医药学名词与主题词(MeSH)对应表》(中国医学科学院医学信息研究所)。
-
关键词
国立图书馆
医学主题词表
中国医学科学院
关键词标引
主题词
自由词
主题信息
规范化
-
分类号
G254.23
[文化科学—图书馆学]
-
-
题名基于专利数据的电力标引信息挖掘技术研究
- 19
-
-
作者
周长江
蔡榕
祝和明
王存超
郭晏
-
机构
国网江苏省电力有限公司
-
出处
《自动化技术与应用》
2024年第4期118-121,共4页
-
基金
国网江苏省电力有限公司科技项目(J2019139)。
-
文摘
为了提高专利数据挖掘的准确性和可靠性,针对基于专利数据的电力标引信息挖掘技术进行研究。以SIPO专利数据库为数据源,生成专利数据序列。根据词嵌入模型设计Word2Vec,获取电力专利数据关联信息。根据数据关联融合结果,通过支持向量机分别训练相应子分类器,高效融合各子分类器,构建总分类模型完成分类决策,根据最终决策获取电力专利数据标引信息挖掘结果。实验结果表明,提出的挖掘与其他挖掘法相比查准率和查全率更高,具有可靠性。
-
关键词
专利数据
电力标引信息
关联融合
数据序列
-
Keywords
patent data
electric power indexing information
association fusion
data sequence
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名关键词标引的规范化
- 20
-
-
作者
本刊编辑部
-
机构
不详
-
出处
《中国微侵袭神经外科杂志》
CAS
2024年第8期484-484,共1页
-
文摘
关键词指论文中最能反映主题信息的特征词汇或词组、短语。我国国家标准规定,对论文的标引使用“关键词”一词,关键词中包括主题词和(或)副主题词以及少数自由词。生物医学领域使用频繁、而且又被使用者认可的主题词,约有15000个;每年最新版美国国立图书馆编辑的《Index Medicus》中医学主题词表(MeSH)内所列的词均有所增删。标引关键词的主要工具书为《医药学名词与主题词(MeSH)对应表》(中国医学科学院医学信息研究所)。
-
关键词
国立图书馆
医学主题词表
中国医学科学院
关键词标引
主题词
自由词
主题信息
规范化
-
分类号
G254.23
[文化科学—图书馆学]
-