期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
13
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
在人工智能时代贡献文献情报领域的智慧和方案
被引量:
31
1
作者
张智雄
《农业图书情报学报》
2023年第1期4-28,共25页
随着ChatGPT的爆火和AIGC的发展,新一代人工智能技术引发了人们关于数字内容生产方式、行业变革的畅想和讨论,同时也引发了信息资源管理学人拥抱技术变革之外的更多思考。基于此我刊从信息资源管理学科建设和事业发展的高度出发,邀请6...
随着ChatGPT的爆火和AIGC的发展,新一代人工智能技术引发了人们关于数字内容生产方式、行业变革的畅想和讨论,同时也引发了信息资源管理学人拥抱技术变革之外的更多思考。基于此我刊从信息资源管理学科建设和事业发展的高度出发,邀请6位专家开展相关研讨。(1)AIGC与文献情报领域:人工智能技术飞速发展的本质在于数据资源不断丰富和质量提升带来的知识获取能力提升。文献情报领域应充分认识自身价值和作用,积极发挥自身数据资源优势,有效利用知识组织管理专长,主动融入当前AI技术的研发大潮,积极贡献智慧和方案。(2)AIGC的颠覆性变革:ChatGPT的出现为图书情报界带来了颠覆性挑战,学科应积极推进人工智能时代的变革抓住机遇,围绕知识生产、资源发现、知识关联、科研伦理探索新的生长点。发挥我国集约化政策和举国体制优势,推进信息服务向知识服务内容生成服务的转型,释放全社会知识生产力。(3)AIGC与文化遗产资源:ChatGPT开创了模型主导内容生产的时代,同时AIGC对文化遗产资源智慧化加工路径和智慧化服务模式也产生了深远影响。未来我们应在AIGC中赋予人类的公序良俗等普适的价值理性,并积极迎接和推动文化遗产领域的范式变革。(4)AIGC与古籍智能信息处理研究:ChatGPT在推进古籍智能信息处理研究、促进文化传播与文明传承方面发挥积极作用的同时,也带来了文化价值与国家安全、内容安全与信息治理、信息素养与人文教育等方面的挑战。展望未来我们应在提供高质量大规模的典籍精加工数据等方面努力,以构建科学、全面和体系化的信息安全与数字伦理体系。(5)AIGC与智能工具变革:分析AIGC技术发展中大数据、大模型、大算力的三要素,以及数据量的大而全、数据分析的细粒度化、语义关联的多源多模态语义融合、信息服务的人机融合和智能交互的四向发展。指出AIGC将在生产革新、自动生成和生态培育3方面带来内容生产范式变革;同时,也会在技术垄断和霸权、网络信息安全、技术融合等方面带来挑战。(6)AIGC与图书馆:分析ChatGPT模型拓展、数据增强和模型融合的核心技术创新态势基础上,论证了图书馆应用ChatGPT的必要性和危机性。此外,基于智能管理系统、检索系统、推荐系统、问答系统、搜索引擎5方面出发,提出了ChatGPT在图书馆融合和发挥作用的创新方向建议。
展开更多
关键词
AIGC
ChatGPT
知识组织
文化遗产
古籍智能信息处理
图书馆
数字伦理
下载PDF
职称材料
计算人文下的古籍引书研究及全文本知识库的构建
被引量:
1
2
作者
刘浏
齐月
+2 位作者
刘雏菲
李文祺
王东波
《情报学报》
CSCD
北大核心
2023年第12期1498-1512,共15页
古籍引书是古籍计算人文研究的重要内容,是探寻传统文化传承脉络的重要方式。本文阐述了计算人文下古籍引书研究的内涵,描述了该研究视角下目录典籍、经学注疏、史书及诗词歌赋四类对象的引书和引典现象的异同,并以此为出发点,探讨了古...
古籍引书是古籍计算人文研究的重要内容,是探寻传统文化传承脉络的重要方式。本文阐述了计算人文下古籍引书研究的内涵,描述了该研究视角下目录典籍、经学注疏、史书及诗词歌赋四类对象的引书和引典现象的异同,并以此为出发点,探讨了古籍引书全文本知识库构建的技术现状。本文围绕知识表示、知识标注、知识补全与消歧,描述了古籍引书全文本知识构建的框架流程,并就目录典籍、经学注疏、史书及诗词歌赋四类对象进行了引书知识库的构建尝试,分析了古籍引书知识库的应用前景。
展开更多
关键词
古籍引书
计算人文
数字人文
古文信息处理
知识库
下载PDF
职称材料
农业古籍断句标点模式研究
被引量:
27
3
作者
黄建年
侯汉清
《中文信息学报》
CSCD
北大核心
2008年第4期31-38,共8页
农业古籍的整理已经引起了众多学者和专家的注意,但是,对于农业古籍的自动断句、标点模式的研究仍付之阙如。本研究探索并总结出部分农业古籍断句、标点识别模式。首先采用句法特征词断句法、同义语标志词法进行初步断句;进而利用反义...
农业古籍的整理已经引起了众多学者和专家的注意,但是,对于农业古籍的自动断句、标点模式的研究仍付之阙如。本研究探索并总结出部分农业古籍断句、标点识别模式。首先采用句法特征词断句法、同义语标志词法进行初步断句;进而利用反义复合词、引书标志、时序、数量词、重叠字词、动名结构及比较句法进一步对子句进行断句、标点;最后使用农业用语和禁用模式表进一步提高断句、标点后农业古籍的可读性和准确性。经测试表明,断句、标点的平均准确率分别达到48%和35%,证明本方法具有一定的正确性和可行性。
展开更多
关键词
计算机应用
中文信息处理
农业古籍
古农书
古籍整理
断句
标点
模式匹配
下载PDF
职称材料
古籍自动校勘的研究和实现
被引量:
15
4
作者
常娥
侯汉清
曹玲
《中文信息学报》
CSCD
北大核心
2007年第2期83-88,共6页
古籍自动校勘是指利用计算机自动发现并标记出古籍不同版本之间的文字差异,并提供各种校勘辅助工具帮助专家勘误。本文讨论了古籍自动校勘的意义,接着详细阐述了古籍自动校勘系统的总体设计及其实现,包括选题和资料收集、自动校勘的对...
古籍自动校勘是指利用计算机自动发现并标记出古籍不同版本之间的文字差异,并提供各种校勘辅助工具帮助专家勘误。本文讨论了古籍自动校勘的意义,接着详细阐述了古籍自动校勘系统的总体设计及其实现,包括选题和资料收集、自动校勘的对象和方法,最深入讨论了古代官名表、人名表、地名表等自动校勘辅助工具的建设问题。最后,设计了实验检查校勘系统的效果。实验结果表明,本系统的召回率和精确率分别达到了92.3%、95.2%。
展开更多
关键词
计算机应用
中文信息处理
古籍整理
自动校勘
校勘辅助工具
下载PDF
职称材料
数字人文视野下的古汉语实体歧义研究
被引量:
9
5
作者
刘浏
王东波
+1 位作者
黄水清
苏新宁
《图书与情报》
CSSCI
北大核心
2020年第5期115-124,共10页
实体知识的自动识别是古文智能处理的重要内容,也是古文数字人文研究的技术支撑。以实体知识为基础的数字人文研究若不考虑古籍中普遍存在的实体歧义,将难以得到准确可靠的数据和结论。文章以《春秋经传引得》为文本语料,考察了语料中...
实体知识的自动识别是古文智能处理的重要内容,也是古文数字人文研究的技术支撑。以实体知识为基础的数字人文研究若不考虑古籍中普遍存在的实体歧义,将难以得到准确可靠的数据和结论。文章以《春秋经传引得》为文本语料,考察了语料中同名异指和异名同指两大类人名实体歧义,根据古文实体歧义消解的特殊性,提出两类歧义的消解方法和思路。研究基于实体语境和时间知识,构建了消歧规则并以先秦古汉语为实例进行了验证。上述方法在其他古汉语语料中的适用性值得进一步探究,基于消歧后的语料,文章呈现了先秦人物的基本全貌,表明了本研究的价值所在。
展开更多
关键词
古文信息处理
实体歧义
古文智能处理
古文数字人文
下载PDF
职称材料
机器学习视角的人工智能研究回顾及对图书情报学的影响
被引量:
15
6
作者
刘浏
王东波
黄水清
《图书与情报》
CSSCI
北大核心
2017年第6期84-95,共12页
人工智能是近年来异常火热的话题,其对世界的影响和改变已经随处可见,这其中机器学习尤其是深度学习发挥着至关重要的作用。文章梳理了人工智能的发展脉络,阐述了机器学习在人工智能中所处的地位,对机器学习中重要和常见的模型和算法进...
人工智能是近年来异常火热的话题,其对世界的影响和改变已经随处可见,这其中机器学习尤其是深度学习发挥着至关重要的作用。文章梳理了人工智能的发展脉络,阐述了机器学习在人工智能中所处的地位,对机器学习中重要和常见的模型和算法进行了简要介绍,其中包括近年最为重要的深度学习。人工智能的热潮对于图书情报来说是一个极佳的发展契机,文章也从多个角度分析了机器学习对图书情报学科产生的影响,展望了两者充分结合的发展前景和未来趋势,并以古文信息处理为例进一步阐述了机器学习方法在图书情报学研究中发挥的作用。
展开更多
关键词
人工智能
机器学习
深度学习
图书馆学
情报学
古文信息处理
下载PDF
职称材料
本真与还原--古籍善本的数字化处理研究
被引量:
4
7
作者
毕翔
唐存琛
《高校图书馆工作》
CSSCI
2018年第6期47-50,55,共5页
古籍善本具有较高的文化价值和较为显著的经济价值,多保存在文人雅士、图书馆、博物馆中,基本按照文物级别进行收藏。因而在使用过程中存在查阅手续办理复杂、使用过程较为繁复,对善本几经使用后的维护费用昂贵等问题。这也造成了古籍...
古籍善本具有较高的文化价值和较为显著的经济价值,多保存在文人雅士、图书馆、博物馆中,基本按照文物级别进行收藏。因而在使用过程中存在查阅手续办理复杂、使用过程较为繁复,对善本几经使用后的维护费用昂贵等问题。这也造成了古籍善本成为了"一代孤本",很难被后人查阅和使用,大大降低了其存在的价值,甚至降低了古籍善本产生期的时代价值。文章着力研究对古籍善本的数字化处理方法,利用多种技术手段改变对古籍善本的影像存档、快速查阅方式,提供便捷,提升了古籍善本的文化价值,又大大降低其维护成本,增加数字化处理效率。
展开更多
关键词
古籍善本
数字化处理
信息还原
下载PDF
职称材料
古籍信息处理回顾与展望
被引量:
9
8
作者
刘忠宝
赵文娟
《大学图书馆学报》
CSSCI
北大核心
2021年第6期38-47,共10页
随着大数据时代的到来,古籍信息处理迎来前所未有的发展良机。此文从技术方法及其演进角度,对古籍数据挖掘、古籍信息系统构建、古籍信息服务等方面进行回顾和总结,并对未来的研究趋势进行展望。研究表明,越来越多的研究人员开始关注该...
随着大数据时代的到来,古籍信息处理迎来前所未有的发展良机。此文从技术方法及其演进角度,对古籍数据挖掘、古籍信息系统构建、古籍信息服务等方面进行回顾和总结,并对未来的研究趋势进行展望。研究表明,越来越多的研究人员开始关注该领域并产生不少研究成果,但仍然面临一系列未解难题,如古籍数据挖掘能力不强、古籍信息系统构建效率低下、古籍信息服务水平尚有差距。未来研究应从古籍数字资源共享体系、高性能古籍信息处理模型、古籍信息服务评价等方面展开。此次梳理和展望有助于研究人员全面了解古籍信息处理现状,方便古籍信息资源的研究与利用;有助于推动古籍信息处理多学科融合与国际化合作。
展开更多
关键词
古籍信息处理
古籍数据挖掘
古籍信息系统构建
古籍信息服务
下载PDF
职称材料
古汉语大语言模型的构建及应用研究
9
作者
李绅
胡韧奋
王立军
《语言战略研究》
2024年第5期22-33,共12页
通用大语言模型在古汉语语言信息处理任务上的效果往往不够理想,因此,我们从领域知识学习需求出发,针对古汉语信息处理任务“低资源”“富知识”的特点,从头构建了专门适用于古代汉语理解与生成的大语言模型“AI太炎”。通过合理的模型...
通用大语言模型在古汉语语言信息处理任务上的效果往往不够理想,因此,我们从领域知识学习需求出发,针对古汉语信息处理任务“低资源”“富知识”的特点,从头构建了专门适用于古代汉语理解与生成的大语言模型“AI太炎”。通过合理的模型设计、数据处理、基座训练及微调,仅使用1.8B参数量即可取得较好效果。该模型具有较强的古典文献释读能力,支持句读标点、典故识别、词义解释及文白翻译等多种具有挑战性的文言文理解任务,兼容简体字和繁体字文本。实验显示,与大型通用模型和其他领域模型相比,“AI太炎”在多项古汉语信息处理关键任务上表现出明显优势,且达到了接近或超过人类基线的水平。此外,在辅助古籍整理、辞书编纂和语言研究等方面,该模型也表现出了很大的应用潜力。
展开更多
关键词
大语言模型
古汉语信息处理
人工智能
下载PDF
职称材料
古文信息处理研究的现状及趋势
被引量:
31
10
作者
黄水清
王东波
《图书情报工作》
CSSCI
北大核心
2017年第12期43-49,共7页
[目的 /意义]随着古文数字化、智能处理和相关人文计算研究的迅速发展,对这一领域的整体研究状况进行梳理,不仅有助于从以往的研究当中总结相应的规律,而且在一定程度上有益于后续探究的展开。[方法/过程]厘定古文信息处理的概念,分析...
[目的 /意义]随着古文数字化、智能处理和相关人文计算研究的迅速发展,对这一领域的整体研究状况进行梳理,不仅有助于从以往的研究当中总结相应的规律,而且在一定程度上有益于后续探究的展开。[方法/过程]厘定古文信息处理的概念,分析古文信息处理的研究现状,给出古文信息处理研究的整体概貌。同时,在统计分析的基础上,对古文数字化、智能处理和人文计算这3个方面的研究内容进行总结、回顾和研究趋势的展望。[结果/结论]在古文信息处理研究中,古文数字化所取得的成就最大,古文智能处理在词汇级的探究上取得了一定的成效,而对于人文计算来说,与古文相关的研究则才刚刚起步。
展开更多
关键词
古文数字化
数字人文
信息智能处理
人文计算
古文信息处理
原文传递
基于中文信息处理的古籍整理研究评述
被引量:
8
11
作者
赵阳
顾磊
《图书情报工作》
CSSCI
北大核心
2010年第3期116-119,63,共5页
随着计算机技术的飞速发展,基于中文信息处理的古籍整理已成为近年来的研究热点,并且取得一些可喜的成绩。在搜集整理当前研究与应用成果的基础上,从古籍的自动录入、自动断句、自动编纂以及自动翻译等方面对基于中文信息处理技术的古...
随着计算机技术的飞速发展,基于中文信息处理的古籍整理已成为近年来的研究热点,并且取得一些可喜的成绩。在搜集整理当前研究与应用成果的基础上,从古籍的自动录入、自动断句、自动编纂以及自动翻译等方面对基于中文信息处理技术的古籍整理的研究现状进行概述,同时分别探讨这几个方面仍然存在的问题,并展望其今后的研究工作。
展开更多
关键词
古籍整理
中文信息处理
古籍研究
原文传递
古籍智能整理研究现状及存在的问题
被引量:
4
12
作者
顾磊
赵阳
《图书馆学研究》
CSSCI
2016年第9期54-58,共5页
随着古籍数字化技术的深入发展,古籍智能整理渐渐成为众多研究者的研究目标,近年来已经取得了一些成绩。文章提出一个新的分层的古籍智能整理系统,该系统是一个具有基础层和应用层的两层系统,然后在搜集整理当前研究成果的基础上,分别从...
随着古籍数字化技术的深入发展,古籍智能整理渐渐成为众多研究者的研究目标,近年来已经取得了一些成绩。文章提出一个新的分层的古籍智能整理系统,该系统是一个具有基础层和应用层的两层系统,然后在搜集整理当前研究成果的基础上,分别从5个重要的方面对古籍智能整理关键技术的研究现状进行概述,并且探讨了当前研究现状中存在的问题。
展开更多
关键词
古籍智能整理
古籍数字化
分层系统
中文信息处理技术
原文传递
面向多领域先秦典籍的分词词性一体化自动标注模型构建
被引量:
21
13
作者
张琪
江川
+4 位作者
纪有书
冯敏萱
李斌
许超
刘浏
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2021年第3期2-11,共10页
【目的】探究基于深度学习方法的古籍分词词性一体化标注技术,构建覆盖多领域古籍的自动标注模型。【方法】采用涵盖"经史子集"的25部先秦典籍作为训练语料,在未加入任何人工特征的前提下,基于BERT构建了先秦典籍分词词性一...
【目的】探究基于深度学习方法的古籍分词词性一体化标注技术,构建覆盖多领域古籍的自动标注模型。【方法】采用涵盖"经史子集"的25部先秦典籍作为训练语料,在未加入任何人工特征的前提下,基于BERT构建了先秦典籍分词词性一体化标注模型。最终将模型应用于《史记》,并对《史记》中构成事件的4种基本词类(人名、地名、时间词、动词)进行整体统计与个例分析。【结果】在语料涵盖历史、政论等多种领域且体裁多样的条件下,所构建的先秦典籍分词词性一体化标注模型在开放测试中分词准确率达到95.98%,词性标注准确率达到88.97%。在《史记》上的应用进一步证明了模型的稳定性和实用性。【局限】通过绘制词类标注混淆热力图分析模型错标类型,发现因词类分布样本不均衡、部分词类句法特征相似、兼类等所造成的词性误标有待进一步解决。【结论】将深度学习模型BERT应用于古汉语分词与词性标注,所构建的分词词性一体化标注模型适用于史籍、诗歌、典章制度等多领域的先秦典籍。
展开更多
关键词
数字人文
先秦典籍
古籍智能处理技术
分词
词性标注
深度学习
原文传递
题名
在人工智能时代贡献文献情报领域的智慧和方案
被引量:
31
1
作者
张智雄
机构
中国科学院文献情报中心
中国科学院大学经济与管理学院信息资源管理系
国家新闻出版署学术期刊新型出版与知识服务重点实验室
出处
《农业图书情报学报》
2023年第1期4-28,共25页
基金
国家重点研发计划项目“科技文献内容深度挖掘及智能分析关键技术和软件”(2022YFF0711900)。
文摘
随着ChatGPT的爆火和AIGC的发展,新一代人工智能技术引发了人们关于数字内容生产方式、行业变革的畅想和讨论,同时也引发了信息资源管理学人拥抱技术变革之外的更多思考。基于此我刊从信息资源管理学科建设和事业发展的高度出发,邀请6位专家开展相关研讨。(1)AIGC与文献情报领域:人工智能技术飞速发展的本质在于数据资源不断丰富和质量提升带来的知识获取能力提升。文献情报领域应充分认识自身价值和作用,积极发挥自身数据资源优势,有效利用知识组织管理专长,主动融入当前AI技术的研发大潮,积极贡献智慧和方案。(2)AIGC的颠覆性变革:ChatGPT的出现为图书情报界带来了颠覆性挑战,学科应积极推进人工智能时代的变革抓住机遇,围绕知识生产、资源发现、知识关联、科研伦理探索新的生长点。发挥我国集约化政策和举国体制优势,推进信息服务向知识服务内容生成服务的转型,释放全社会知识生产力。(3)AIGC与文化遗产资源:ChatGPT开创了模型主导内容生产的时代,同时AIGC对文化遗产资源智慧化加工路径和智慧化服务模式也产生了深远影响。未来我们应在AIGC中赋予人类的公序良俗等普适的价值理性,并积极迎接和推动文化遗产领域的范式变革。(4)AIGC与古籍智能信息处理研究:ChatGPT在推进古籍智能信息处理研究、促进文化传播与文明传承方面发挥积极作用的同时,也带来了文化价值与国家安全、内容安全与信息治理、信息素养与人文教育等方面的挑战。展望未来我们应在提供高质量大规模的典籍精加工数据等方面努力,以构建科学、全面和体系化的信息安全与数字伦理体系。(5)AIGC与智能工具变革:分析AIGC技术发展中大数据、大模型、大算力的三要素,以及数据量的大而全、数据分析的细粒度化、语义关联的多源多模态语义融合、信息服务的人机融合和智能交互的四向发展。指出AIGC将在生产革新、自动生成和生态培育3方面带来内容生产范式变革;同时,也会在技术垄断和霸权、网络信息安全、技术融合等方面带来挑战。(6)AIGC与图书馆:分析ChatGPT模型拓展、数据增强和模型融合的核心技术创新态势基础上,论证了图书馆应用ChatGPT的必要性和危机性。此外,基于智能管理系统、检索系统、推荐系统、问答系统、搜索引擎5方面出发,提出了ChatGPT在图书馆融合和发挥作用的创新方向建议。
关键词
AIGC
ChatGPT
知识组织
文化遗产
古籍智能信息处理
图书馆
数字伦理
Keywords
AIGC
ChatGPT
knowledge organization
cultural heritage
intelligent information processing of ancient books
library
digital ethics
分类号
G255.1 [文化科学—图书馆学]
下载PDF
职称材料
题名
计算人文下的古籍引书研究及全文本知识库的构建
被引量:
1
2
作者
刘浏
齐月
刘雏菲
李文祺
王东波
机构
南京农业大学信息管理学院
出处
《情报学报》
CSCD
北大核心
2023年第12期1498-1512,共15页
基金
国家自然科学基金青年科学基金项目“基于深度学习的典籍引书知识图谱构建及应用研究”(72004095)
国家社会科学基金重大项目“中国古代典籍跨语言知识库构建及应用研究”(21&ZD331)。
文摘
古籍引书是古籍计算人文研究的重要内容,是探寻传统文化传承脉络的重要方式。本文阐述了计算人文下古籍引书研究的内涵,描述了该研究视角下目录典籍、经学注疏、史书及诗词歌赋四类对象的引书和引典现象的异同,并以此为出发点,探讨了古籍引书全文本知识库构建的技术现状。本文围绕知识表示、知识标注、知识补全与消歧,描述了古籍引书全文本知识构建的框架流程,并就目录典籍、经学注疏、史书及诗词歌赋四类对象进行了引书知识库的构建尝试,分析了古籍引书知识库的应用前景。
关键词
古籍引书
计算人文
数字人文
古文信息处理
知识库
Keywords
ancient
book citation
computational humanities
digital humanities
ancient
Chinese
information
processing
knowledge base
分类号
G255.1 [文化科学—图书馆学]
G250.7 [文化科学—图书馆学]
下载PDF
职称材料
题名
农业古籍断句标点模式研究
被引量:
27
3
作者
黄建年
侯汉清
机构
南京农业大学人文与社会科学学院
出处
《中文信息学报》
CSCD
北大核心
2008年第4期31-38,共8页
基金
国家社科基金资助项目(08ATQ002)
文摘
农业古籍的整理已经引起了众多学者和专家的注意,但是,对于农业古籍的自动断句、标点模式的研究仍付之阙如。本研究探索并总结出部分农业古籍断句、标点识别模式。首先采用句法特征词断句法、同义语标志词法进行初步断句;进而利用反义复合词、引书标志、时序、数量词、重叠字词、动名结构及比较句法进一步对子句进行断句、标点;最后使用农业用语和禁用模式表进一步提高断句、标点后农业古籍的可读性和准确性。经测试表明,断句、标点的平均准确率分别达到48%和35%,证明本方法具有一定的正确性和可行性。
关键词
计算机应用
中文信息处理
农业古籍
古农书
古籍整理
断句
标点
模式匹配
Keywords
computer application
Chinese
information
processing
ancient
books
on agriculture
agricultural treatises
of
ancient
China
collation
of
ancient
books
sentence segmentation
punctuation
pattern match
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
古籍自动校勘的研究和实现
被引量:
15
4
作者
常娥
侯汉清
曹玲
机构
南京农业大学人文社会科学学院
出处
《中文信息学报》
CSCD
北大核心
2007年第2期83-88,共6页
基金
科技部国家科技基础性工作专项资金项目(2002DEB30090)
文摘
古籍自动校勘是指利用计算机自动发现并标记出古籍不同版本之间的文字差异,并提供各种校勘辅助工具帮助专家勘误。本文讨论了古籍自动校勘的意义,接着详细阐述了古籍自动校勘系统的总体设计及其实现,包括选题和资料收集、自动校勘的对象和方法,最深入讨论了古代官名表、人名表、地名表等自动校勘辅助工具的建设问题。最后,设计了实验检查校勘系统的效果。实验结果表明,本系统的召回率和精确率分别达到了92.3%、95.2%。
关键词
计算机应用
中文信息处理
古籍整理
自动校勘
校勘辅助工具
Keywords
computer application
Chinese
information
processing
ancient
book collation and studies
automatic version comparison and analysis
assisted tools
of
automatic version comparison and analysis
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
数字人文视野下的古汉语实体歧义研究
被引量:
9
5
作者
刘浏
王东波
黄水清
苏新宁
机构
南京农业大学信息管理学院
江苏省数据工程与知识服务重点实验室(南京大学)
南京大学信息管理学院
出处
《图书与情报》
CSSCI
北大核心
2020年第5期115-124,共10页
基金
国家社科基金重大项目“基于《汉学引得丛刊》的典籍知识库构建及人文计算研究”(项目编号:15ZDB127)
国家自科基金面上项目“基于典籍引得的句法级汉英平行语料库构建及人文计算研究”(项目编号:71673143)
江苏省社科基金青年项目“人文计算视角下的先秦人物知识获取及分析研究”(项目编号:19TQC003)研究成果之一。
文摘
实体知识的自动识别是古文智能处理的重要内容,也是古文数字人文研究的技术支撑。以实体知识为基础的数字人文研究若不考虑古籍中普遍存在的实体歧义,将难以得到准确可靠的数据和结论。文章以《春秋经传引得》为文本语料,考察了语料中同名异指和异名同指两大类人名实体歧义,根据古文实体歧义消解的特殊性,提出两类歧义的消解方法和思路。研究基于实体语境和时间知识,构建了消歧规则并以先秦古汉语为实例进行了验证。上述方法在其他古汉语语料中的适用性值得进一步探究,基于消歧后的语料,文章呈现了先秦人物的基本全貌,表明了本研究的价值所在。
关键词
古文信息处理
实体歧义
古文智能处理
古文数字人文
Keywords
ancient
Chinese
information
processing
entity ambiguity
intelligent
processing
ancient
Chinese digital humanities
分类号
TP393.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
机器学习视角的人工智能研究回顾及对图书情报学的影响
被引量:
15
6
作者
刘浏
王东波
黄水清
机构
南京农业大学领域知识关联研究中心
江苏省数据工程与知识服务重点实验室(南京大学)
南京大学信息管理学院
南京农业大学信息科学技术学院
出处
《图书与情报》
CSSCI
北大核心
2017年第6期84-95,共12页
基金
国家社会科学基金重大项目"基于<汉学引得丛刊>的典籍知识库构建及人文计算研究"(项目编号:15ZDB127)
南京农业大学人文社会科学基金项目"基于<汉学引得丛刊>的典籍知识库构建及人文计算研究"(项目编号:SKPT2016001)研究成果之一
文摘
人工智能是近年来异常火热的话题,其对世界的影响和改变已经随处可见,这其中机器学习尤其是深度学习发挥着至关重要的作用。文章梳理了人工智能的发展脉络,阐述了机器学习在人工智能中所处的地位,对机器学习中重要和常见的模型和算法进行了简要介绍,其中包括近年最为重要的深度学习。人工智能的热潮对于图书情报来说是一个极佳的发展契机,文章也从多个角度分析了机器学习对图书情报学科产生的影响,展望了两者充分结合的发展前景和未来趋势,并以古文信息处理为例进一步阐述了机器学习方法在图书情报学研究中发挥的作用。
关键词
人工智能
机器学习
深度学习
图书馆学
情报学
古文信息处理
Keywords
artificial intelligence
machine learning
deep learning
science
of
library
science
of
information
information
processing
of
ancient
Chinese
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
G250 [文化科学—图书馆学]
下载PDF
职称材料
题名
本真与还原--古籍善本的数字化处理研究
被引量:
4
7
作者
毕翔
唐存琛
机构
武汉大学
出处
《高校图书馆工作》
CSSCI
2018年第6期47-50,55,共5页
文摘
古籍善本具有较高的文化价值和较为显著的经济价值,多保存在文人雅士、图书馆、博物馆中,基本按照文物级别进行收藏。因而在使用过程中存在查阅手续办理复杂、使用过程较为繁复,对善本几经使用后的维护费用昂贵等问题。这也造成了古籍善本成为了"一代孤本",很难被后人查阅和使用,大大降低了其存在的价值,甚至降低了古籍善本产生期的时代价值。文章着力研究对古籍善本的数字化处理方法,利用多种技术手段改变对古籍善本的影像存档、快速查阅方式,提供便捷,提升了古籍善本的文化价值,又大大降低其维护成本,增加数字化处理效率。
关键词
古籍善本
数字化处理
信息还原
Keywords
ancient
rare
books
Digital
processing
information
recovery
分类号
G250.7 [文化科学—图书馆学]
下载PDF
职称材料
题名
古籍信息处理回顾与展望
被引量:
9
8
作者
刘忠宝
赵文娟
机构
北京语言大学语言智能研究院
北京语言大学图书馆
出处
《大学图书馆学报》
CSSCI
北大核心
2021年第6期38-47,共10页
基金
国家社会科学基金一般项目“大数据环境下面向图书馆资源的跨媒体知识服务研究”(编号:19BTQ012)的研究成果之一。
文摘
随着大数据时代的到来,古籍信息处理迎来前所未有的发展良机。此文从技术方法及其演进角度,对古籍数据挖掘、古籍信息系统构建、古籍信息服务等方面进行回顾和总结,并对未来的研究趋势进行展望。研究表明,越来越多的研究人员开始关注该领域并产生不少研究成果,但仍然面临一系列未解难题,如古籍数据挖掘能力不强、古籍信息系统构建效率低下、古籍信息服务水平尚有差距。未来研究应从古籍数字资源共享体系、高性能古籍信息处理模型、古籍信息服务评价等方面展开。此次梳理和展望有助于研究人员全面了解古籍信息处理现状,方便古籍信息资源的研究与利用;有助于推动古籍信息处理多学科融合与国际化合作。
关键词
古籍信息处理
古籍数据挖掘
古籍信息系统构建
古籍信息服务
Keywords
ancient
Book
information
processing
Data Mining
of
ancient
Book
information
System Construction
of
ancient
Book
information
Service
of
ancient
Book
分类号
G256 [文化科学—图书馆学]
下载PDF
职称材料
题名
古汉语大语言模型的构建及应用研究
9
作者
李绅
胡韧奋
王立军
机构
北京师范大学文学院
出处
《语言战略研究》
2024年第5期22-33,共12页
基金
国家语委重大项目“古籍整理智能化关键技术研究”(ZDA145-9)
国家社科基金重大招标项目“基于历代训释资源库的中国阐释学理论体系构建与实践”(22&ZD257)。
文摘
通用大语言模型在古汉语语言信息处理任务上的效果往往不够理想,因此,我们从领域知识学习需求出发,针对古汉语信息处理任务“低资源”“富知识”的特点,从头构建了专门适用于古代汉语理解与生成的大语言模型“AI太炎”。通过合理的模型设计、数据处理、基座训练及微调,仅使用1.8B参数量即可取得较好效果。该模型具有较强的古典文献释读能力,支持句读标点、典故识别、词义解释及文白翻译等多种具有挑战性的文言文理解任务,兼容简体字和繁体字文本。实验显示,与大型通用模型和其他领域模型相比,“AI太炎”在多项古汉语信息处理关键任务上表现出明显优势,且达到了接近或超过人类基线的水平。此外,在辅助古籍整理、辞书编纂和语言研究等方面,该模型也表现出了很大的应用潜力。
关键词
大语言模型
古汉语信息处理
人工智能
Keywords
large language model
information
processing
of
ancient
Chinese
artifi cial intelligence
分类号
H002 [语言文字—语言学]
下载PDF
职称材料
题名
古文信息处理研究的现状及趋势
被引量:
31
10
作者
黄水清
王东波
机构
南京农业大学信息科学技术学院
南京农业大学领域知识关联研究中心
出处
《图书情报工作》
CSSCI
北大核心
2017年第12期43-49,共7页
基金
国家社会科学基金重大项目"基于<汉学引得丛刊>的典籍知识库构建及人文计算研究"(项目编号:15ZDB127)
南京农业大学人文社会科学基金项目"基于<汉学引得丛刊>的典籍知识库构建及人文计算研究"(项目编号:SKPT2016001)研究成果之一
文摘
[目的 /意义]随着古文数字化、智能处理和相关人文计算研究的迅速发展,对这一领域的整体研究状况进行梳理,不仅有助于从以往的研究当中总结相应的规律,而且在一定程度上有益于后续探究的展开。[方法/过程]厘定古文信息处理的概念,分析古文信息处理的研究现状,给出古文信息处理研究的整体概貌。同时,在统计分析的基础上,对古文数字化、智能处理和人文计算这3个方面的研究内容进行总结、回顾和研究趋势的展望。[结果/结论]在古文信息处理研究中,古文数字化所取得的成就最大,古文智能处理在词汇级的探究上取得了一定的成效,而对于人文计算来说,与古文相关的研究则才刚刚起步。
关键词
古文数字化
数字人文
信息智能处理
人文计算
古文信息处理
Keywords
ancient
Chinese character digitization digital humanities
intelligent
processing
humanities computing
ancient
Chinese character
information
processing
分类号
G255.1 [文化科学—图书馆学]
原文传递
题名
基于中文信息处理的古籍整理研究评述
被引量:
8
11
作者
赵阳
顾磊
机构
南京林业大学人文社会科学学院
清华大学计算机科学与技术系
出处
《图书情报工作》
CSSCI
北大核心
2010年第3期116-119,63,共5页
文摘
随着计算机技术的飞速发展,基于中文信息处理的古籍整理已成为近年来的研究热点,并且取得一些可喜的成绩。在搜集整理当前研究与应用成果的基础上,从古籍的自动录入、自动断句、自动编纂以及自动翻译等方面对基于中文信息处理技术的古籍整理的研究现状进行概述,同时分别探讨这几个方面仍然存在的问题,并展望其今后的研究工作。
关键词
古籍整理
中文信息处理
古籍研究
Keywords
collation
of
ancient
books
Chinese
information
processing
studies
of
ancient
books
分类号
G255.1 [文化科学—图书馆学]
原文传递
题名
古籍智能整理研究现状及存在的问题
被引量:
4
12
作者
顾磊
赵阳
机构
南京邮电大学计算机学院
南京林业大学人文社会科学学院
出处
《图书馆学研究》
CSSCI
2016年第9期54-58,共5页
基金
教育部人文社会科学研究青年基金项目"基于中文信息处理技术的古籍整理研究"(项目编号:12YJC870008)
江苏省社科研究文化精品课题"基于文字图像分析技术的珍贵古籍数字化方法的研究"(项目编号:12SWC-030)的研究成果之一
文摘
随着古籍数字化技术的深入发展,古籍智能整理渐渐成为众多研究者的研究目标,近年来已经取得了一些成绩。文章提出一个新的分层的古籍智能整理系统,该系统是一个具有基础层和应用层的两层系统,然后在搜集整理当前研究成果的基础上,分别从5个重要的方面对古籍智能整理关键技术的研究现状进行概述,并且探讨了当前研究现状中存在的问题。
关键词
古籍智能整理
古籍数字化
分层系统
中文信息处理技术
Keywords
intelligent
collation
of
ancient
books
digitization
of
ancient
books
hierarchical system Chinese
information
processing
technology
分类号
G255.1 [文化科学—图书馆学]
原文传递
题名
面向多领域先秦典籍的分词词性一体化自动标注模型构建
被引量:
21
13
作者
张琪
江川
纪有书
冯敏萱
李斌
许超
刘浏
机构
南京大学信息管理学院
南京农业大学信息管理学院
南京师范大学文学院
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2021年第3期2-11,共10页
基金
国家自然科学基金面上项目(项目编号:71673143)
国家社会科学基金重大项目(项目编号:15ZDB127)的研究成果之一。
文摘
【目的】探究基于深度学习方法的古籍分词词性一体化标注技术,构建覆盖多领域古籍的自动标注模型。【方法】采用涵盖"经史子集"的25部先秦典籍作为训练语料,在未加入任何人工特征的前提下,基于BERT构建了先秦典籍分词词性一体化标注模型。最终将模型应用于《史记》,并对《史记》中构成事件的4种基本词类(人名、地名、时间词、动词)进行整体统计与个例分析。【结果】在语料涵盖历史、政论等多种领域且体裁多样的条件下,所构建的先秦典籍分词词性一体化标注模型在开放测试中分词准确率达到95.98%,词性标注准确率达到88.97%。在《史记》上的应用进一步证明了模型的稳定性和实用性。【局限】通过绘制词类标注混淆热力图分析模型错标类型,发现因词类分布样本不均衡、部分词类句法特征相似、兼类等所造成的词性误标有待进一步解决。【结论】将深度学习模型BERT应用于古汉语分词与词性标注,所构建的分词词性一体化标注模型适用于史籍、诗歌、典章制度等多领域的先秦典籍。
关键词
数字人文
先秦典籍
古籍智能处理技术
分词
词性标注
深度学习
Keywords
Digital Humanities
Pre-Qin Literature
ancient
books
intelligent
processing
Word Segmentation
Part-
of
-Speech Tagging
Deep Learning
分类号
G353 [文化科学—情报学]
TP393 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
在人工智能时代贡献文献情报领域的智慧和方案
张智雄
《农业图书情报学报》
2023
31
下载PDF
职称材料
2
计算人文下的古籍引书研究及全文本知识库的构建
刘浏
齐月
刘雏菲
李文祺
王东波
《情报学报》
CSCD
北大核心
2023
1
下载PDF
职称材料
3
农业古籍断句标点模式研究
黄建年
侯汉清
《中文信息学报》
CSCD
北大核心
2008
27
下载PDF
职称材料
4
古籍自动校勘的研究和实现
常娥
侯汉清
曹玲
《中文信息学报》
CSCD
北大核心
2007
15
下载PDF
职称材料
5
数字人文视野下的古汉语实体歧义研究
刘浏
王东波
黄水清
苏新宁
《图书与情报》
CSSCI
北大核心
2020
9
下载PDF
职称材料
6
机器学习视角的人工智能研究回顾及对图书情报学的影响
刘浏
王东波
黄水清
《图书与情报》
CSSCI
北大核心
2017
15
下载PDF
职称材料
7
本真与还原--古籍善本的数字化处理研究
毕翔
唐存琛
《高校图书馆工作》
CSSCI
2018
4
下载PDF
职称材料
8
古籍信息处理回顾与展望
刘忠宝
赵文娟
《大学图书馆学报》
CSSCI
北大核心
2021
9
下载PDF
职称材料
9
古汉语大语言模型的构建及应用研究
李绅
胡韧奋
王立军
《语言战略研究》
2024
下载PDF
职称材料
10
古文信息处理研究的现状及趋势
黄水清
王东波
《图书情报工作》
CSSCI
北大核心
2017
31
原文传递
11
基于中文信息处理的古籍整理研究评述
赵阳
顾磊
《图书情报工作》
CSSCI
北大核心
2010
8
原文传递
12
古籍智能整理研究现状及存在的问题
顾磊
赵阳
《图书馆学研究》
CSSCI
2016
4
原文传递
13
面向多领域先秦典籍的分词词性一体化自动标注模型构建
张琪
江川
纪有书
冯敏萱
李斌
许超
刘浏
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2021
21
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部