期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
Automatic Classification of Swedish Metadata Using Dewey Decimal Classification:A Comparison of Approaches
1
作者 Koraljka Golub Johan Hagelback Anders Ardo 《Journal of Data and Information Science》 CSCD 2020年第1期18-38,共21页
Purpose:With more and more digital collections of various information resources becoming available,also increasing is the challenge of assigning subject index terms and classes from quality knowledge organization syst... Purpose:With more and more digital collections of various information resources becoming available,also increasing is the challenge of assigning subject index terms and classes from quality knowledge organization systems.While the ultimate purpose is to understand the value of automatically produced Dewey Decimal Classification(DDC)classes for Swedish digital collections,the paper aims to evaluate the performance of six machine learning algorithms as well as a string-matching algorithm based on characteristics of DDC.Design/methodology/approach:State-of-the-art machine learning algorithms require at least 1,000 training examples per class.The complete data set at the time of research involved 143,838 records which had to be reduced to top three hierarchical levels of DDC in order to provide sufficient training data(totaling 802 classes in the training and testing sample,out of 14,413 classes at all levels).Findings:Evaluation shows that Support Vector Machine with linear kernel outperforms other machine learning algorithms as well as the string-matching algorithm on average;the string-matching algorithm outperforms machine learning for specific classes when characteristics of DDC are most suitable for the task.Word embeddings combined with different types of neural networks(simple linear network,standard neural network,1 D convolutional neural network,and recurrent neural network)produced worse results than Support Vector Machine,but reach close results,with the benefit of a smaller representation size.Impact of features in machine learning shows that using keywords or combining titles and keywords gives better results than using only titles as input.Stemming only marginally improves the results.Removed stop-words reduced accuracy in most cases,while removing less frequent words increased it marginally.The greatest impact is produced by the number of training examples:81.90%accuracy on the training set is achieved when at least 1,000 records per class are available in the training set,and 66.13%when too few records(often less than A Comparison of Approaches100 per class)on which to train are available—and these hold only for top 3 hierarchical levels(803 instead of 14,413 classes).Research limitations:Having to reduce the number of hierarchical levels to top three levels of DDC because of the lack of training data for all classes,skews the results so that they work in experimental conditions but barely for end users in operational retrieval systems.Practical implications:In conclusion,for operative information retrieval systems applying purely automatic DDC does not work,either using machine learning(because of the lack of training data for the large number of DDC classes)or using string-matching algorithm(because DDC characteristics perform well for automatic classification only in a small number of classes).Over time,more training examples may become available,and DDC may be enriched with synonyms in order to enhance accuracy of automatic classification which may also benefit information retrieval performance based on DDC.In order for quality information services to reach the objective of highest possible precision and recall,automatic classification should never be implemented on its own;instead,machine-aided indexing that combines the efficiency of automatic suggestions with quality of human decisions at the final stage should be the way for the future.Originality/value:The study explored machine learning on a large classification system of over 14,000 classes which is used in operational information retrieval systems.Due to lack of sufficient training data across the entire set of classes,an approach complementing machine learning,that of string matching,was applied.This combination should be explored further since it provides the potential for real-life applications with large target classification systems. 展开更多
关键词 LIBRIS dewey decimal classification Automatic classification Machine learning Support Vector Machine Multinomial Naive Bayes Simple linear network Standard neural network 1D convolutional neural network Recurrent neural network Word embeddings String matching
下载PDF
DDC关联数据实现研究 被引量:12
2
作者 贾君枝 赵洁 《中国图书馆学报》 CSSCI 北大核心 2014年第4期76-82,共7页
分类法作为规范的知识组织工具,实现其关联数据化,对书目数据的开放和网络知识组织体系的构建具有重要意义。《杜威十进分类法》是图书情报领域使用最为广泛的分类法,现已将其类目以关联数据的形式发布。本文基于Dewey.info平台,以DDC... 分类法作为规范的知识组织工具,实现其关联数据化,对书目数据的开放和网络知识组织体系的构建具有重要意义。《杜威十进分类法》是图书情报领域使用最为广泛的分类法,现已将其类目以关联数据的形式发布。本文基于Dewey.info平台,以DDC关联数据为例,通过对DDC关联数据发展脉络的梳理和技术构成的分析,从授权模型确定、实体对象的明确、URI命名、SKOS模型化、RDF表示五个方面解析DDC关联数据的具体实现。以此为我国《中图法》及其它分类法的关联数据化提供一定的参考。 展开更多
关键词 ddc 关联数据 dewey INFO 分类法
下载PDF
DDC(21版)与《中图法》(第4版)医学复分表的比较研究
3
作者 刘华 《中华医学图书情报杂志》 CAS 2004年第5期4-6,共3页
从类目体系结构、类目设置、类目注释、设置方法等方面对DDC(2 1版 )和《中图法》(第 4版 )的医学复分表进行了分析与比较 ,并借鉴DDC(2 1版 )医学复分表 ,提出了《中图法》(第 4版 )的医学复分表的改进意见和具体方案。
关键词 杜威十进分类法 ddc 《中图法》 医学复分表
下载PDF
基于关联书目数据的DDC与LCC类号映射实现 被引量:1
4
作者 贾君枝 陈瑞 《图书情报知识》 CSSCI 北大核心 2019年第2期81-91,共11页
[目的/意义]以关联书目数据为研究对象,利用标引的关联书目数据的特点构建分类号的自动映射模型,为分类法的映射方法提供借鉴。[研究设计/方法]对国内外分类表互操作实现方法分析的基础上,以《杜威十进分类法》和《美国国会图书馆分类... [目的/意义]以关联书目数据为研究对象,利用标引的关联书目数据的特点构建分类号的自动映射模型,为分类法的映射方法提供借鉴。[研究设计/方法]对国内外分类表互操作实现方法分析的基础上,以《杜威十进分类法》和《美国国会图书馆分类法》标引的关联书目数据为例,分析关联书目数据的特点和实现映射的可行性,建立关联书目数据的属性信息、内容信息、链接信息的综合匹配规则,通过等同书目的识别建立书目下类号的一对一映射。[结论/发现]通过实验检验,利用关联书目数据可以建立一定可靠性的类号映射关系。在未来的研究中,还应进一步地探索更完善的匹配规则。[创新/价值]提出基于开放的关联书目数据来构建不同分类法类号自动映射模型,并可为其他分类体系的自动映射提供参考。 展开更多
关键词 杜威十进分类法 美国国会分类法 关联书目数据 等同映射 映射规则
下载PDF
A comparison of mapping strategies from DDC to CLC 被引量:1
5
作者 Fang LI Yihua ZHANG 《Chinese Journal of Library and Information Science》 2012年第3期47-61,共15页
Purpose: This study aims to discuss the strategies for mapping from Dewey Decimal Classification(DDC) numbers to Chinese Library Classification(CLC) numbers based on co-occurrence mapping while minimizing manual inter... Purpose: This study aims to discuss the strategies for mapping from Dewey Decimal Classification(DDC) numbers to Chinese Library Classification(CLC) numbers based on co-occurrence mapping while minimizing manual intervention.Design/methodology/approach: Several statistical tables were created based on frequency counts of the mapping relations with samples of USMARC records,which contain both DDC and CLC numbers. A manual table was created through direct mapping. In order to find reasonable mapping strategies,the mapping results were compared from three aspects including the sample size,the choice between one-to-one and one-to-multiple mapping relations,and the role of a manual mapping table.Findings: Larger sample size provides more DDC numbers in the mapping table. The statistical table including one-to-multiple DDC-CLC relations provides a higher ratio of correct matches than that including only one-to-one relations. The manual mapping table cannot produce a better result than the statistical tables. Therefore,we should make full use of statistical mapping tables and avoid the time-consuming manual mapping as much as possible.Research limitations: All the sample sizes were small. We did not consider DDC editions in our study. One-to-multiple DDC-CLC relations in the records were collected in the mapping table,but how to select one appropriate CLC number in the matching process needs to be further studied.Practical implications: The ratio of correct matches based on the statistical mapping table came up to about 90% by CLC top-level classes and 76% by the second-level classes in our study. The statistical mapping table will be improved to realize the automatic classification of e-resources and shorten the cataloging cycle significantly.Originality/value: The mapping results were investigated from different aspects in order to find suitable mapping strategies from DDC to CLC while minimizing manual intervention.The findings have facilitated the establishment of DDC-CLC mapping system for practical applications. 展开更多
关键词 dewey decimal classification(ddc) Chinese Library classification(CLC) Co-occurrence mapping Mapping strategies
下载PDF
学科领域本体建设的一个实证研究--兼论杜威分类法与中图分类法的再次比较 被引量:6
6
作者 黄金霞 宋文 +1 位作者 刘峥 景丽 《图书馆杂志》 CSSCI 北大核心 2010年第7期21-25,共5页
中国科学院国家科学图书馆专业领域知识环境建设,采用本体的知识组织方法,其中的学科领域本体利用分类法进行改造。对22版杜威法和第四版中图法进行基于网络知识组织需要的比较后,依据杜威法重视与学科同步发展等的特点,选用杜威法(四... 中国科学院国家科学图书馆专业领域知识环境建设,采用本体的知识组织方法,其中的学科领域本体利用分类法进行改造。对22版杜威法和第四版中图法进行基于网络知识组织需要的比较后,依据杜威法重视与学科同步发展等的特点,选用杜威法(四级类目)构建学科领域本体,以学科树的方式向用户显示学科领域所关联的信息资源。 展开更多
关键词 专业领域知识环境(SKE) 知识组织体系 本体 分类法 杜威法 中图法
下载PDF
数字信息资源的自动分类和主题识别——OCLC“蝎子计划”研究 被引量:7
7
作者 薛春香 侯汉清 《图书馆杂志》 CSSCI 北大核心 2005年第1期24-28,共5页
“蝎子计划(Scorpion Project)”是美国 OCLC 利用《杜威十进分类法》电子编辑支持系统(ESS)对数字信息资源进行自动分类和主题识别的一个研究项目。本文简要介绍了该项目的进展情况、实施原理,描述了 Scorpion 对数字信息资源进行自动... “蝎子计划(Scorpion Project)”是美国 OCLC 利用《杜威十进分类法》电子编辑支持系统(ESS)对数字信息资源进行自动分类和主题识别的一个研究项目。本文简要介绍了该项目的进展情况、实施原理,描述了 Scorpion 对数字信息资源进行自动分类和主题识别的具体流程,并将其与我们自行研发的基于《中图法》知识库的中文信息自动标引和自动分类系统进行对比分析,以探讨 Scorpion 对中文信息自动分类和主题识别的借鉴意义。 展开更多
关键词 数字信息资源 自动分类 OCLC 中文信息 《杜威十进分类法》 对数 《中图法》 主题识别 知识库 描述
下载PDF
文献分类法在主题网关互操作中的应用研究 被引量:10
8
作者 曹玲 侯汉清 《图书馆杂志》 CSSCI 北大核心 2004年第11期25-28,7,共5页
随着因特网特别是主题网关的发展,网络检索迫切需要一种能够整合各种异构网关、实现互操作的服务系统。2002年欧盟完成的 Renardus 项目是这方面的成功尝试。文中分析了该项目利用分类法映射技术实现跨库浏览和检索的主要方法,包括通用... 随着因特网特别是主题网关的发展,网络检索迫切需要一种能够整合各种异构网关、实现互操作的服务系统。2002年欧盟完成的 Renardus 项目是这方面的成功尝试。文中分析了该项目利用分类法映射技术实现跨库浏览和检索的主要方法,包括通用分类法的选择、映射过程、映射结果的显示等方面,以及该项目跨库浏览检索系统的主要功能,最后提出了研制《中图法》网络版、实现《中图法》与其他中外分类法的映射转换以及利用《中图法》构建统一的网络检索平台等建议。 展开更多
关键词 文献分类法 主题网关 互操作 《杜威十进分类法》 《中国图书馆分类法》
下载PDF
简述杜威十进分类法的历史、现状和发展 被引量:4
9
作者 高雯雯 田秀芳 丘东江 《图书馆工作与研究》 CSSCI 北大核心 2013年第6期70-73,共4页
《杜威十进分类法》(Dewey Decimal Classification,DDC)是当今世界上影响最大,用户最多的图书馆分类法。文章叙述了杜威十进分类法的发展历史和现状,同时对该分类法的完整印刷本第23版、精编印刷本第15版和网络版以及该分类法的修订和... 《杜威十进分类法》(Dewey Decimal Classification,DDC)是当今世界上影响最大,用户最多的图书馆分类法。文章叙述了杜威十进分类法的发展历史和现状,同时对该分类法的完整印刷本第23版、精编印刷本第15版和网络版以及该分类法的修订和研究现状等进行了梳理和介绍,以期为使用和研究该分类法的用户提供借鉴。 展开更多
关键词 杜威分类法 分类法格式 修订 研究
下载PDF
近代图书分类西方化及其对传统知识体系的重建 被引量:6
10
作者 傅荣贤 《图书馆建设》 CSSCI 北大核心 2014年第11期1-5,共5页
自1917年《仿杜威书目十类法》以迄《中国图书馆分类法》,中国近现代图书分类虽不乏"中国特色",但其本质乃是对以杜威十进分类法(DDC)为代表的近代西方学术分类的皈依。而图书分类的转型,也是知识观念和知识结构的重建,由此... 自1917年《仿杜威书目十类法》以迄《中国图书馆分类法》,中国近现代图书分类虽不乏"中国特色",但其本质乃是对以杜威十进分类法(DDC)为代表的近代西方学术分类的皈依。而图书分类的转型,也是知识观念和知识结构的重建,由此导致的对图书分类学和广义知识学的双重改变,堪称纯驳互见、得失相参,值得仔细分析。 展开更多
关键词 图书分类 知识体系 杜威十进分类法
下载PDF
《杜威十进分类法》理学类目设置探析 被引量:1
11
作者 贾君枝 李艳 《图书馆建设》 CSSCI 北大核心 2012年第11期29-32,共4页
《杜威十进分类法》的理学类目划分遵循学科发展的时间顺序,强调实用性;类目设置简略,侧重从主题角度集中相关文献;类目灵活性强,并具有丰富的注释;类目名称惯用描述性词语和名词组合,统一规范性较强。以上特点使《杜威十进分类法》在... 《杜威十进分类法》的理学类目划分遵循学科发展的时间顺序,强调实用性;类目设置简略,侧重从主题角度集中相关文献;类目灵活性强,并具有丰富的注释;类目名称惯用描述性词语和名词组合,统一规范性较强。以上特点使《杜威十进分类法》在系统性和实用性之间找到了较好的平衡点,类目的动态与灵活性能适应学科发展及类目扩充的需要。 展开更多
关键词 《杜威十进分类法》 理学类目 类目设置
下载PDF
民国时期清华图书馆分类法变迁考略 被引量:1
12
作者 董琳 何玉 《大学图书馆学报》 CSSCI 北大核心 2017年第5期117-123,85,共8页
20世纪上半叶,中国图书馆受杜威十进制分类法的影响,在图书分类领域新说不断、百家争鸣。清华图书馆几次富有成效的新分类法的创立也都与杜威十进制分类法密切相关,经历了从登录号到新书-旧书分类法,到十进制法补编,再到八大类法的发展... 20世纪上半叶,中国图书馆受杜威十进制分类法的影响,在图书分类领域新说不断、百家争鸣。清华图书馆几次富有成效的新分类法的创立也都与杜威十进制分类法密切相关,经历了从登录号到新书-旧书分类法,到十进制法补编,再到八大类法的发展过程。以民国时期清华图书馆十进制分类法为研究对象,基于研究分类法变革的现实意义,理清了新法创立及废弃的脉络、时间、思想精髓,探讨了分类法变革的契机和原因。论证将清华图书馆从事分类编目的开始时间从1923年提前至1916年。找到了与"补杜法"代表作《杜威书目十进法补编》(已遗失)分类思想最接近的论文《编制中文书籍目录的几个方法》。 展开更多
关键词 杜威十进制分类法 清华图书馆 民国
下载PDF
新版《中图法》与《杜威法》法律类的比较 被引量:1
13
作者 何灵巧 陆宗城 《图书馆论坛》 CSSCI 北大核心 2004年第5期136-139,共4页
从六个方面对《中图法》第四版法律类的第二分类体系和《杜威法》第二十一版的法律类作了比较 ,找出它们的差别和各自的优劣 ,并着重对该第二分类体系的修订提出初步意见 ,还希望《杜威法》
关键词 《中国图书馆分类法》 《杜威法》 法律类 简表 类目体系 复分表
下载PDF
杜定友图书分类思想中的“常”与“变” 被引量:2
14
作者 朱晓梅 《国家图书馆学刊》 CSSCI 北大核心 2015年第1期100-105,共6页
杜氏图书分类思想经历了科学主义、三民主义和马列主义三个重要时期。尽管"主义"随时代在变,但"科学"精神却贯穿图书分类学术的始终,其图书分类思想的发展史也是一部"主义"与"科学"的变奏史。... 杜氏图书分类思想经历了科学主义、三民主义和马列主义三个重要时期。尽管"主义"随时代在变,但"科学"精神却贯穿图书分类学术的始终,其图书分类思想的发展史也是一部"主义"与"科学"的变奏史。因追求"统一"而寻求"主义"引领,因坚持"标准"而不离"科学原则"。虽然呼唤"主义"的指导,但"主义"指导是有条件的,"主义"必须以"科学"为前提。对待杜氏图书学术思想的这种演变,应该有一种辩证的历史态度。 展开更多
关键词 杜定友 图书分类 科学主义 三民主义 马列主义 杜威十进分类法
下载PDF
《杜威十进分类法》与《中图法》中的宗教学类目体系的比较研究 被引量:1
15
作者 董印红 《晋图学刊》 2004年第2期52-53,64,共3页
从类目的范围和类目设置两个角度,对《杜威十进分类法》第21版和《中国图书馆图书分类法》第4版宗教学类目体系进行了比较研究,分析了两者之间的差异及各自的特色。
关键词 《杜威十进分类法》 《中国图书馆分类法》 宗教学 类目体系
下载PDF
中国和美国著名医学类表类目体系的比较研究
16
作者 刘华 《中华医学图书情报杂志》 CAS 2004年第6期6-10,共5页
从类目范围和类目设置 2个方面 ,对《杜威十进分类法》(DDC)第 2 1版医学类表、美国《国立医学图书馆分类法》(NLMC)和《中国图书馆分类法》(简称《中图法》)第 4版医学类表的类目体系进行了比较分析 ,总结它们各自的特色和差异 ,以期... 从类目范围和类目设置 2个方面 ,对《杜威十进分类法》(DDC)第 2 1版医学类表、美国《国立医学图书馆分类法》(NLMC)和《中国图书馆分类法》(简称《中图法》)第 4版医学类表的类目体系进行了比较分析 ,总结它们各自的特色和差异 ,以期对《中图法》医学类表的修订提供一定的参考。 展开更多
关键词 杜威十进制分类法 美国国立医学图书馆分类法 中国图书馆分类法 医学专业分类表
下载PDF
20世纪上半叶教育学科在中国图书分类法中的变迁
17
作者 张小丽 《北京社会科学》 CSSCI 北大核心 2022年第5期96-106,共11页
考究教育学科在各时期图书分类体系中的变迁,可以从类别知识的角度折射教育学科的中国问题。西学东渐之际,以《西学书目表》为代表的书目将新学分为“学”“政”两部。“教育”一词流行后,取代了“学制”“学校”成为图书分类法中“政... 考究教育学科在各时期图书分类体系中的变迁,可以从类别知识的角度折射教育学科的中国问题。西学东渐之际,以《西学书目表》为代表的书目将新学分为“学”“政”两部。“教育”一词流行后,取代了“学制”“学校”成为图书分类法中“政”的一个类目。随着新式图书馆的建立,作为西学的教育学科通过图书分类在调整期的中国知识系统中扎根。20世纪20年代,“杜威十进分类法”中的“370教育”类目成为中国教育学科图书分类的主要依据。然以此为摹本的教育学科的图书分类细目与中国传统格格不入。这种图书分类法塑造了教育学科知识偏向制度、实践的西学形象;分类法中“教育”与“教育学”概念混用则反映了教育学科性质未定、内容庞杂的现实。 展开更多
关键词 20世纪上半叶 教育学 教育学科 图书分类法 杜威十进分类法
下载PDF
《中国图书馆分类法》第5版医学类表性能测评——兼与《杜威十进分类法》第22版医学类表比较
18
作者 顾颖 《中国索引》 2012年第2期35-41,共7页
本文统计了《中国图书馆分类法》第5版和《杜威十进分类法》第22版中医学类表中的相关数据,从类目结构、类目数量、类目质量几个方面,利用类号长度、类目包容度、参照度、清晰度等多个性能指标,对两表进行定性定量测评;并根据统计... 本文统计了《中国图书馆分类法》第5版和《杜威十进分类法》第22版中医学类表中的相关数据,从类目结构、类目数量、类目质量几个方面,利用类号长度、类目包容度、参照度、清晰度等多个性能指标,对两表进行定性定量测评;并根据统计结果提出《中图法》今后借鉴《杜威法》修订医学类表的一些建议。 展开更多
关键词 《中国图书馆分类法》《杜威十进分类法》医学分类表分类法评价定量测评
下载PDF
新兴跨学科领域在主要分类法中如何设类——以女性研究为例
19
作者 刘菡 《图书馆杂志》 CSSCI 北大核心 2021年第10期34-39,共6页
文章以女性研究为对象,查阅其在《美国国会图书馆分类法》(简称LCC)、《杜威十进分类法》(简称DDC)、《通用十进分类法》(简称UDC)、《中国图书馆分类法》(简称《中图法》)四部图书分类法中的设类。在此基础上,进行比较研究,评析不同分... 文章以女性研究为对象,查阅其在《美国国会图书馆分类法》(简称LCC)、《杜威十进分类法》(简称DDC)、《通用十进分类法》(简称UDC)、《中国图书馆分类法》(简称《中图法》)四部图书分类法中的设类。在此基础上,进行比较研究,评析不同分类体系对这一新兴跨学科领域的应对情况。最后结合女性研究的跨学科性和《中图法》的现状提出启示:建立《中图法》常规修订机制,增进对新兴跨学科领域内容的组织与服务,关注类目修订中的社会文化关联。 展开更多
关键词 跨学科领域 女性研究 《美国国会图书馆分类法》 《杜威十进分类法》 《通用十进分类法》 《中国图书馆分类法》
下载PDF
化学工业领域DDC与CLC类目映射关系分析 被引量:6
20
作者 杨眉 范慧慧 +1 位作者 李芳 张轶华 《图书情报工作》 CSSCI 北大核心 2012年第17期93-97,共5页
采用直接映射和同现映射相结合的方法,针对DDC23和CLC5的化学工业领域类目展开研究。将类目划分为两大类别五种类型,提出不同类型类目匹配时应遵循的基本规则;按照类目类型和级别进行统计分析,点面结合地考察DDC与CLC逻辑体系趋同和存... 采用直接映射和同现映射相结合的方法,针对DDC23和CLC5的化学工业领域类目展开研究。将类目划分为两大类别五种类型,提出不同类型类目匹配时应遵循的基本规则;按照类目类型和级别进行统计分析,点面结合地考察DDC与CLC逻辑体系趋同和存异的变化趋势;提出映射时存在的问题及解决方案。通过类目映射关系的研究与分析,为图书情报机构的工作人员、化学工业领域的信息组织者和科研人员提供参考。 展开更多
关键词 互操作 映射 杜威十进分类法 中国图书馆分类法
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部