期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
在人工智能时代贡献文献情报领域的智慧和方案 被引量:31
1
作者 张智雄 《农业图书情报学报》 2023年第1期4-28,共25页
随着ChatGPT的爆火和AIGC的发展,新一代人工智能技术引发了人们关于数字内容生产方式、行业变革的畅想和讨论,同时也引发了信息资源管理学人拥抱技术变革之外的更多思考。基于此我刊从信息资源管理学科建设和事业发展的高度出发,邀请6... 随着ChatGPT的爆火和AIGC的发展,新一代人工智能技术引发了人们关于数字内容生产方式、行业变革的畅想和讨论,同时也引发了信息资源管理学人拥抱技术变革之外的更多思考。基于此我刊从信息资源管理学科建设和事业发展的高度出发,邀请6位专家开展相关研讨。(1)AIGC与文献情报领域:人工智能技术飞速发展的本质在于数据资源不断丰富和质量提升带来的知识获取能力提升。文献情报领域应充分认识自身价值和作用,积极发挥自身数据资源优势,有效利用知识组织管理专长,主动融入当前AI技术的研发大潮,积极贡献智慧和方案。(2)AIGC的颠覆性变革:ChatGPT的出现为图书情报界带来了颠覆性挑战,学科应积极推进人工智能时代的变革抓住机遇,围绕知识生产、资源发现、知识关联、科研伦理探索新的生长点。发挥我国集约化政策和举国体制优势,推进信息服务向知识服务内容生成服务的转型,释放全社会知识生产力。(3)AIGC与文化遗产资源:ChatGPT开创了模型主导内容生产的时代,同时AIGC对文化遗产资源智慧化加工路径和智慧化服务模式也产生了深远影响。未来我们应在AIGC中赋予人类的公序良俗等普适的价值理性,并积极迎接和推动文化遗产领域的范式变革。(4)AIGC与古籍智能信息处理研究:ChatGPT在推进古籍智能信息处理研究、促进文化传播与文明传承方面发挥积极作用的同时,也带来了文化价值与国家安全、内容安全与信息治理、信息素养与人文教育等方面的挑战。展望未来我们应在提供高质量大规模的典籍精加工数据等方面努力,以构建科学、全面和体系化的信息安全与数字伦理体系。(5)AIGC与智能工具变革:分析AIGC技术发展中大数据、大模型、大算力的三要素,以及数据量的大而全、数据分析的细粒度化、语义关联的多源多模态语义融合、信息服务的人机融合和智能交互的四向发展。指出AIGC将在生产革新、自动生成和生态培育3方面带来内容生产范式变革;同时,也会在技术垄断和霸权、网络信息安全、技术融合等方面带来挑战。(6)AIGC与图书馆:分析ChatGPT模型拓展、数据增强和模型融合的核心技术创新态势基础上,论证了图书馆应用ChatGPT的必要性和危机性。此外,基于智能管理系统、检索系统、推荐系统、问答系统、搜索引擎5方面出发,提出了ChatGPT在图书馆融合和发挥作用的创新方向建议。 展开更多
关键词 AIGC ChatGPT 知识组织 文化遗产 古籍智能信息处理 图书馆 数字伦理
下载PDF
计算人文下的古籍引书研究及全文本知识库的构建 被引量:1
2
作者 刘浏 齐月 +2 位作者 刘雏菲 李文祺 王东波 《情报学报》 CSCD 北大核心 2023年第12期1498-1512,共15页
古籍引书是古籍计算人文研究的重要内容,是探寻传统文化传承脉络的重要方式。本文阐述了计算人文下古籍引书研究的内涵,描述了该研究视角下目录典籍、经学注疏、史书及诗词歌赋四类对象的引书和引典现象的异同,并以此为出发点,探讨了古... 古籍引书是古籍计算人文研究的重要内容,是探寻传统文化传承脉络的重要方式。本文阐述了计算人文下古籍引书研究的内涵,描述了该研究视角下目录典籍、经学注疏、史书及诗词歌赋四类对象的引书和引典现象的异同,并以此为出发点,探讨了古籍引书全文本知识库构建的技术现状。本文围绕知识表示、知识标注、知识补全与消歧,描述了古籍引书全文本知识构建的框架流程,并就目录典籍、经学注疏、史书及诗词歌赋四类对象进行了引书知识库的构建尝试,分析了古籍引书知识库的应用前景。 展开更多
关键词 古籍引书 计算人文 数字人文 古文信息处理 知识库
下载PDF
农业古籍断句标点模式研究 被引量:27
3
作者 黄建年 侯汉清 《中文信息学报》 CSCD 北大核心 2008年第4期31-38,共8页
农业古籍的整理已经引起了众多学者和专家的注意,但是,对于农业古籍的自动断句、标点模式的研究仍付之阙如。本研究探索并总结出部分农业古籍断句、标点识别模式。首先采用句法特征词断句法、同义语标志词法进行初步断句;进而利用反义... 农业古籍的整理已经引起了众多学者和专家的注意,但是,对于农业古籍的自动断句、标点模式的研究仍付之阙如。本研究探索并总结出部分农业古籍断句、标点识别模式。首先采用句法特征词断句法、同义语标志词法进行初步断句;进而利用反义复合词、引书标志、时序、数量词、重叠字词、动名结构及比较句法进一步对子句进行断句、标点;最后使用农业用语和禁用模式表进一步提高断句、标点后农业古籍的可读性和准确性。经测试表明,断句、标点的平均准确率分别达到48%和35%,证明本方法具有一定的正确性和可行性。 展开更多
关键词 计算机应用 中文信息处理 农业古籍 古农书 古籍整理 断句 标点 模式匹配
下载PDF
古籍自动校勘的研究和实现 被引量:15
4
作者 常娥 侯汉清 曹玲 《中文信息学报》 CSCD 北大核心 2007年第2期83-88,共6页
古籍自动校勘是指利用计算机自动发现并标记出古籍不同版本之间的文字差异,并提供各种校勘辅助工具帮助专家勘误。本文讨论了古籍自动校勘的意义,接着详细阐述了古籍自动校勘系统的总体设计及其实现,包括选题和资料收集、自动校勘的对... 古籍自动校勘是指利用计算机自动发现并标记出古籍不同版本之间的文字差异,并提供各种校勘辅助工具帮助专家勘误。本文讨论了古籍自动校勘的意义,接着详细阐述了古籍自动校勘系统的总体设计及其实现,包括选题和资料收集、自动校勘的对象和方法,最深入讨论了古代官名表、人名表、地名表等自动校勘辅助工具的建设问题。最后,设计了实验检查校勘系统的效果。实验结果表明,本系统的召回率和精确率分别达到了92.3%、95.2%。 展开更多
关键词 计算机应用 中文信息处理 古籍整理 自动校勘 校勘辅助工具
下载PDF
数字人文视野下的古汉语实体歧义研究 被引量:9
5
作者 刘浏 王东波 +1 位作者 黄水清 苏新宁 《图书与情报》 CSSCI 北大核心 2020年第5期115-124,共10页
实体知识的自动识别是古文智能处理的重要内容,也是古文数字人文研究的技术支撑。以实体知识为基础的数字人文研究若不考虑古籍中普遍存在的实体歧义,将难以得到准确可靠的数据和结论。文章以《春秋经传引得》为文本语料,考察了语料中... 实体知识的自动识别是古文智能处理的重要内容,也是古文数字人文研究的技术支撑。以实体知识为基础的数字人文研究若不考虑古籍中普遍存在的实体歧义,将难以得到准确可靠的数据和结论。文章以《春秋经传引得》为文本语料,考察了语料中同名异指和异名同指两大类人名实体歧义,根据古文实体歧义消解的特殊性,提出两类歧义的消解方法和思路。研究基于实体语境和时间知识,构建了消歧规则并以先秦古汉语为实例进行了验证。上述方法在其他古汉语语料中的适用性值得进一步探究,基于消歧后的语料,文章呈现了先秦人物的基本全貌,表明了本研究的价值所在。 展开更多
关键词 古文信息处理 实体歧义 古文智能处理 古文数字人文
下载PDF
机器学习视角的人工智能研究回顾及对图书情报学的影响 被引量:15
6
作者 刘浏 王东波 黄水清 《图书与情报》 CSSCI 北大核心 2017年第6期84-95,共12页
人工智能是近年来异常火热的话题,其对世界的影响和改变已经随处可见,这其中机器学习尤其是深度学习发挥着至关重要的作用。文章梳理了人工智能的发展脉络,阐述了机器学习在人工智能中所处的地位,对机器学习中重要和常见的模型和算法进... 人工智能是近年来异常火热的话题,其对世界的影响和改变已经随处可见,这其中机器学习尤其是深度学习发挥着至关重要的作用。文章梳理了人工智能的发展脉络,阐述了机器学习在人工智能中所处的地位,对机器学习中重要和常见的模型和算法进行了简要介绍,其中包括近年最为重要的深度学习。人工智能的热潮对于图书情报来说是一个极佳的发展契机,文章也从多个角度分析了机器学习对图书情报学科产生的影响,展望了两者充分结合的发展前景和未来趋势,并以古文信息处理为例进一步阐述了机器学习方法在图书情报学研究中发挥的作用。 展开更多
关键词 人工智能 机器学习 深度学习 图书馆学 情报学 古文信息处理
下载PDF
本真与还原--古籍善本的数字化处理研究 被引量:4
7
作者 毕翔 唐存琛 《高校图书馆工作》 CSSCI 2018年第6期47-50,55,共5页
古籍善本具有较高的文化价值和较为显著的经济价值,多保存在文人雅士、图书馆、博物馆中,基本按照文物级别进行收藏。因而在使用过程中存在查阅手续办理复杂、使用过程较为繁复,对善本几经使用后的维护费用昂贵等问题。这也造成了古籍... 古籍善本具有较高的文化价值和较为显著的经济价值,多保存在文人雅士、图书馆、博物馆中,基本按照文物级别进行收藏。因而在使用过程中存在查阅手续办理复杂、使用过程较为繁复,对善本几经使用后的维护费用昂贵等问题。这也造成了古籍善本成为了"一代孤本",很难被后人查阅和使用,大大降低了其存在的价值,甚至降低了古籍善本产生期的时代价值。文章着力研究对古籍善本的数字化处理方法,利用多种技术手段改变对古籍善本的影像存档、快速查阅方式,提供便捷,提升了古籍善本的文化价值,又大大降低其维护成本,增加数字化处理效率。 展开更多
关键词 古籍善本 数字化处理 信息还原
下载PDF
古籍信息处理回顾与展望 被引量:9
8
作者 刘忠宝 赵文娟 《大学图书馆学报》 CSSCI 北大核心 2021年第6期38-47,共10页
随着大数据时代的到来,古籍信息处理迎来前所未有的发展良机。此文从技术方法及其演进角度,对古籍数据挖掘、古籍信息系统构建、古籍信息服务等方面进行回顾和总结,并对未来的研究趋势进行展望。研究表明,越来越多的研究人员开始关注该... 随着大数据时代的到来,古籍信息处理迎来前所未有的发展良机。此文从技术方法及其演进角度,对古籍数据挖掘、古籍信息系统构建、古籍信息服务等方面进行回顾和总结,并对未来的研究趋势进行展望。研究表明,越来越多的研究人员开始关注该领域并产生不少研究成果,但仍然面临一系列未解难题,如古籍数据挖掘能力不强、古籍信息系统构建效率低下、古籍信息服务水平尚有差距。未来研究应从古籍数字资源共享体系、高性能古籍信息处理模型、古籍信息服务评价等方面展开。此次梳理和展望有助于研究人员全面了解古籍信息处理现状,方便古籍信息资源的研究与利用;有助于推动古籍信息处理多学科融合与国际化合作。 展开更多
关键词 古籍信息处理 古籍数据挖掘 古籍信息系统构建 古籍信息服务
下载PDF
古汉语大语言模型的构建及应用研究
9
作者 李绅 胡韧奋 王立军 《语言战略研究》 2024年第5期22-33,共12页
通用大语言模型在古汉语语言信息处理任务上的效果往往不够理想,因此,我们从领域知识学习需求出发,针对古汉语信息处理任务“低资源”“富知识”的特点,从头构建了专门适用于古代汉语理解与生成的大语言模型“AI太炎”。通过合理的模型... 通用大语言模型在古汉语语言信息处理任务上的效果往往不够理想,因此,我们从领域知识学习需求出发,针对古汉语信息处理任务“低资源”“富知识”的特点,从头构建了专门适用于古代汉语理解与生成的大语言模型“AI太炎”。通过合理的模型设计、数据处理、基座训练及微调,仅使用1.8B参数量即可取得较好效果。该模型具有较强的古典文献释读能力,支持句读标点、典故识别、词义解释及文白翻译等多种具有挑战性的文言文理解任务,兼容简体字和繁体字文本。实验显示,与大型通用模型和其他领域模型相比,“AI太炎”在多项古汉语信息处理关键任务上表现出明显优势,且达到了接近或超过人类基线的水平。此外,在辅助古籍整理、辞书编纂和语言研究等方面,该模型也表现出了很大的应用潜力。 展开更多
关键词 大语言模型 古汉语信息处理 人工智能
下载PDF
古文信息处理研究的现状及趋势 被引量:31
10
作者 黄水清 王东波 《图书情报工作》 CSSCI 北大核心 2017年第12期43-49,共7页
[目的 /意义]随着古文数字化、智能处理和相关人文计算研究的迅速发展,对这一领域的整体研究状况进行梳理,不仅有助于从以往的研究当中总结相应的规律,而且在一定程度上有益于后续探究的展开。[方法/过程]厘定古文信息处理的概念,分析... [目的 /意义]随着古文数字化、智能处理和相关人文计算研究的迅速发展,对这一领域的整体研究状况进行梳理,不仅有助于从以往的研究当中总结相应的规律,而且在一定程度上有益于后续探究的展开。[方法/过程]厘定古文信息处理的概念,分析古文信息处理的研究现状,给出古文信息处理研究的整体概貌。同时,在统计分析的基础上,对古文数字化、智能处理和人文计算这3个方面的研究内容进行总结、回顾和研究趋势的展望。[结果/结论]在古文信息处理研究中,古文数字化所取得的成就最大,古文智能处理在词汇级的探究上取得了一定的成效,而对于人文计算来说,与古文相关的研究则才刚刚起步。 展开更多
关键词 古文数字化 数字人文 信息智能处理 人文计算 古文信息处理
原文传递
基于中文信息处理的古籍整理研究评述 被引量:8
11
作者 赵阳 顾磊 《图书情报工作》 CSSCI 北大核心 2010年第3期116-119,63,共5页
随着计算机技术的飞速发展,基于中文信息处理的古籍整理已成为近年来的研究热点,并且取得一些可喜的成绩。在搜集整理当前研究与应用成果的基础上,从古籍的自动录入、自动断句、自动编纂以及自动翻译等方面对基于中文信息处理技术的古... 随着计算机技术的飞速发展,基于中文信息处理的古籍整理已成为近年来的研究热点,并且取得一些可喜的成绩。在搜集整理当前研究与应用成果的基础上,从古籍的自动录入、自动断句、自动编纂以及自动翻译等方面对基于中文信息处理技术的古籍整理的研究现状进行概述,同时分别探讨这几个方面仍然存在的问题,并展望其今后的研究工作。 展开更多
关键词 古籍整理 中文信息处理 古籍研究
原文传递
古籍智能整理研究现状及存在的问题 被引量:4
12
作者 顾磊 赵阳 《图书馆学研究》 CSSCI 2016年第9期54-58,共5页
随着古籍数字化技术的深入发展,古籍智能整理渐渐成为众多研究者的研究目标,近年来已经取得了一些成绩。文章提出一个新的分层的古籍智能整理系统,该系统是一个具有基础层和应用层的两层系统,然后在搜集整理当前研究成果的基础上,分别从... 随着古籍数字化技术的深入发展,古籍智能整理渐渐成为众多研究者的研究目标,近年来已经取得了一些成绩。文章提出一个新的分层的古籍智能整理系统,该系统是一个具有基础层和应用层的两层系统,然后在搜集整理当前研究成果的基础上,分别从5个重要的方面对古籍智能整理关键技术的研究现状进行概述,并且探讨了当前研究现状中存在的问题。 展开更多
关键词 古籍智能整理 古籍数字化 分层系统 中文信息处理技术
原文传递
面向多领域先秦典籍的分词词性一体化自动标注模型构建 被引量:21
13
作者 张琪 江川 +4 位作者 纪有书 冯敏萱 李斌 许超 刘浏 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第3期2-11,共10页
【目的】探究基于深度学习方法的古籍分词词性一体化标注技术,构建覆盖多领域古籍的自动标注模型。【方法】采用涵盖"经史子集"的25部先秦典籍作为训练语料,在未加入任何人工特征的前提下,基于BERT构建了先秦典籍分词词性一... 【目的】探究基于深度学习方法的古籍分词词性一体化标注技术,构建覆盖多领域古籍的自动标注模型。【方法】采用涵盖"经史子集"的25部先秦典籍作为训练语料,在未加入任何人工特征的前提下,基于BERT构建了先秦典籍分词词性一体化标注模型。最终将模型应用于《史记》,并对《史记》中构成事件的4种基本词类(人名、地名、时间词、动词)进行整体统计与个例分析。【结果】在语料涵盖历史、政论等多种领域且体裁多样的条件下,所构建的先秦典籍分词词性一体化标注模型在开放测试中分词准确率达到95.98%,词性标注准确率达到88.97%。在《史记》上的应用进一步证明了模型的稳定性和实用性。【局限】通过绘制词类标注混淆热力图分析模型错标类型,发现因词类分布样本不均衡、部分词类句法特征相似、兼类等所造成的词性误标有待进一步解决。【结论】将深度学习模型BERT应用于古汉语分词与词性标注,所构建的分词词性一体化标注模型适用于史籍、诗歌、典章制度等多领域的先秦典籍。 展开更多
关键词 数字人文 先秦典籍 古籍智能处理技术 分词 词性标注 深度学习
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部