期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
计算人文视域下的《史记》三家注引书知识标注与计量分析初探
1
作者 齐月 刘雏菲 +3 位作者 李文祺 孟凯 王东波 刘浏 《大学图书馆学报》 CSSCI 北大核心 2024年第5期64-77,共14页
基于古籍文本知识挖掘和知识库构建、围绕数据分析与可视化呈现等视角展开的计算人文探索,已逐渐成为古籍保护和研究利用的重要方向。计算人文视域下的古籍引书研究能够为传统研究问题带来新思路与新技术,拓宽古籍研究视角,提供可靠数... 基于古籍文本知识挖掘和知识库构建、围绕数据分析与可视化呈现等视角展开的计算人文探索,已逐渐成为古籍保护和研究利用的重要方向。计算人文视域下的古籍引书研究能够为传统研究问题带来新思路与新技术,拓宽古籍研究视角,提供可靠数据支撑。本文以人工标注结合深度学习的方法,对《史记》三家注中的引书知识进行了标注研究,随后分别从分类视角和三家注对比的视角出发统计并呈现了引书和引用作者的分布规律。本研究以《史记》三家注为例,形成了一套完整的古籍引书知识标注技术流程和框架,并将统计计量和可视化分析方法引入了古籍引书研究,对于推动和完善《史记》研究和古籍引书研究均具有参考价值。 展开更多
关键词 计算人文 数字人文 古籍引书 《史记》三家注 文本知识挖掘
下载PDF
AIGC助力数字人文研究的实践探索:SikuGPT驱动的古诗词生成研究 被引量:20
2
作者 刘江峰 刘雏菲 +4 位作者 齐月 刘浏 李斌 刘畅 王东波 《情报理论与实践》 CSSCI 北大核心 2023年第5期23-31,共9页
[目的/意义]诗词创作是数字人文领域自然语言生成研究的重要方向,对古诗词遣词造句的版本争议判断、自动诗词问答等具有一定意义,然而当前尚未出现能够自动生成繁体中文古诗词的预训练模型,已有研究着眼于根据使用者需求创作不同风格的... [目的/意义]诗词创作是数字人文领域自然语言生成研究的重要方向,对古诗词遣词造句的版本争议判断、自动诗词问答等具有一定意义,然而当前尚未出现能够自动生成繁体中文古诗词的预训练模型,已有研究着眼于根据使用者需求创作不同风格的简体古诗词。[方法/过程]文章基于CLM使用繁体《四库全书》无标点语料、繁体中文古诗词语料在gpt2-chinese-cluecorpussmall上进行继续预训练构建SikuGPT2、SikuGPT2-poem模型。采用困惑度、BLEU、专家打分、图灵测试等验证模型性能。[结果/结论]实验显示SikuGPT2-poem模型困惑度较低,生成的诗歌BLUE评分较基准模型低0.053左右,在人工打分中较基准模型平均高1.93分。总体而言,文章提出的模型表现优异且通过图灵测试,提出的古汉语生成式系列模型的预训练语料集尚小。模型在古诗生成方面表现较好,但尚不能满足赋、曲等体裁的需要。 展开更多
关键词 四库全书 SikuGPT 预训练语言模型 诗歌生成 数字人文
下载PDF
计算人文下的古籍引书研究及全文本知识库的构建 被引量:7
3
作者 刘浏 齐月 +2 位作者 刘雏菲 李文祺 王东波 《情报学报》 CSSCI CSCD 北大核心 2023年第12期1498-1512,共15页
古籍引书是古籍计算人文研究的重要内容,是探寻传统文化传承脉络的重要方式。本文阐述了计算人文下古籍引书研究的内涵,描述了该研究视角下目录典籍、经学注疏、史书及诗词歌赋四类对象的引书和引典现象的异同,并以此为出发点,探讨了古... 古籍引书是古籍计算人文研究的重要内容,是探寻传统文化传承脉络的重要方式。本文阐述了计算人文下古籍引书研究的内涵,描述了该研究视角下目录典籍、经学注疏、史书及诗词歌赋四类对象的引书和引典现象的异同,并以此为出发点,探讨了古籍引书全文本知识库构建的技术现状。本文围绕知识表示、知识标注、知识补全与消歧,描述了古籍引书全文本知识构建的框架流程,并就目录典籍、经学注疏、史书及诗词歌赋四类对象进行了引书知识库的构建尝试,分析了古籍引书知识库的应用前景。 展开更多
关键词 古籍引书 计算人文 数字人文 古文信息处理 知识库
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部