期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
面向信息处理的《古籍汉字分级字表(7000字)》的研制
1
作者 余雪 冯敏萱 李斌 《辞书研究》 2024年第6期66-80,I0002,共16页
分级字表是文本难度分级的重要基础资源。文章基于大规模古籍文本语料库,在统计构建《古籍汉字通用字表》的基础上,通过挖掘古籍汉字在字形、字音、字义以及应用层面的11个分级计量特征,设计了古籍汉字学习优先级的分级评价体系,将各汉... 分级字表是文本难度分级的重要基础资源。文章基于大规模古籍文本语料库,在统计构建《古籍汉字通用字表》的基础上,通过挖掘古籍汉字在字形、字音、字义以及应用层面的11个分级计量特征,设计了古籍汉字学习优先级的分级评价体系,将各汉字表示为基于计量特征学习优先级的字向量,借助相似度计算,实现了古籍汉字学习优先级别的3级划分,得到《古籍汉字分级字表(7000字)》。该字表包括甲级字1516个、乙级字2421个,丙级字3063个,能够从文字层面为古汉语文本难度分级提供必要的基础字表,有助于古汉语文本分级研究,助力面向辞书编撰的语言文字信息化平台建设,进而为古文读写能力水平测试、古文篇章的自动分级等研究奠定基础。 展开更多
关键词 信息处理 古籍汉字 分级字表 古文文本分级
下载PDF
卷积神经网络在古籍汉字识别中的应用实践 被引量:14
2
作者 郭利敏 葛亮 刘悦如 《图书馆论坛》 CSSCI 北大核心 2019年第10期142-148,共7页
文章尝试将卷积神经网络用于数字人文古籍汉字的元数据加工,将古籍汉字识别问题转换为卷积神经网络的分类问题,在缺乏训练集的情况下通过数据生成技术构建训练集进行模型训练,并用于古籍汉字的识别。通过TensorFlow平台,对773个汉字生成... 文章尝试将卷积神经网络用于数字人文古籍汉字的元数据加工,将古籍汉字识别问题转换为卷积神经网络的分类问题,在缺乏训练集的情况下通过数据生成技术构建训练集进行模型训练,并用于古籍汉字的识别。通过TensorFlow平台,对773个汉字生成约24万个训练样本,网络模型可自行判定不可识别的图片;在提高精确率同时,对这部分数据可直接转由人工识别,系统更为可靠,作为数字人文古籍元数据加工的半自动化工具,旨在提高古籍资源在数字人文应用研究中的效率。 展开更多
关键词 智慧图书馆 人工智能 卷积神经网络 数字人文 古籍汉字识别
下载PDF
融合空间及通道注意网络的古籍汉字图像检索 被引量:1
3
作者 田学东 杨琼 杨芳 《河北大学学报(自然科学版)》 CAS 北大核心 2021年第5期623-632,共10页
古籍汉字图像检索是古籍汉字研究的有效工具.然而,古籍汉字字形复杂、书写风格多变的特点导致传统文字图像检索技术在应用于古籍汉字图像时效果欠佳.针对现有方法在古籍汉字图像特征提取时存在的字形结构细节信息和低层视觉特征提取问题... 古籍汉字图像检索是古籍汉字研究的有效工具.然而,古籍汉字字形复杂、书写风格多变的特点导致传统文字图像检索技术在应用于古籍汉字图像时效果欠佳.针对现有方法在古籍汉字图像特征提取时存在的字形结构细节信息和低层视觉特征提取问题,设计了一种融合空间注意力和通道注意力网络高低层特征的古籍汉字图像检索模型.首先,融合空间注意力的低维特征和通道注意力的高维特征,捕捉古籍汉字空间结构间的依赖关系,提取更丰富的古籍汉字语义特征信息;其次,构建inception残差结构模块,丰富古籍汉字图像特征的感受野,使网络模型更易优化,保留足够的古籍汉字细节信息;最后,运用加权交叉熵损失函数,解决数据集中存在的正负样本不平衡问题,增强检索模型的鲁棒性.在上下、左右、包围和独体结构古籍汉字图像数据集上检索实验的MAP(mean average precision)值分别为77.89%、79.89%、78.21%、80.75%,表明了方法的有效性. 展开更多
关键词 古籍汉字 图像检索 空间注意力 通道注意力 加权交叉熵
下载PDF
基于犹豫模糊特征的古籍汉字图像检索方法 被引量:7
4
作者 田学东 柴彦立 王海彬 《计算机工程》 CAS CSCD 北大核心 2019年第3期217-224,共8页
古籍汉字存在结构复杂、风格多样、字形退化严重等特点,传统的弹性网格特征提取难以达到理想效果。为此,利用犹豫模糊集在多特征、多属性决策方面的优势,提出一种基于犹豫模糊特征的古籍汉字图像检索方法。将古籍汉字图像进行弹性网格划... 古籍汉字存在结构复杂、风格多样、字形退化严重等特点,传统的弹性网格特征提取难以达到理想效果。为此,利用犹豫模糊集在多特征、多属性决策方面的优势,提出一种基于犹豫模糊特征的古籍汉字图像检索方法。将古籍汉字图像进行弹性网格划分,归纳周围网格在距离、位置、长度等方面对当前网格中的笔画像素有影响的评价指标,并进行相应的隶属度计算。利用犹豫模糊距离测度方法对古籍汉字待查询图像与候选古籍汉字图像进行相似度度量,实现对古籍汉字图像的检索。实验结果表明,该方法的古籍汉字图像检索效率较高。 展开更多
关键词 古籍汉字 图像检索 弹性网格特征 犹豫模糊集 相似度
下载PDF
基于犹豫模糊集的古籍汉字图像切分方法 被引量:5
5
作者 齐艳媚 田学东 左丽娜 《科学技术与工程》 北大核心 2019年第30期232-240,共9页
针对古籍文献版面图像切分中存在的过切分和粘连等问题,提出基于犹豫模糊集的古籍汉字图像切分方法。首先,对古籍汉字版面图像进行连通区域搜索,获取版面中的笔画部件,实现古籍汉字的初切分;然后,对过切分汉字进行特征分析,提取过切分... 针对古籍文献版面图像切分中存在的过切分和粘连等问题,提出基于犹豫模糊集的古籍汉字图像切分方法。首先,对古籍汉字版面图像进行连通区域搜索,获取版面中的笔画部件,实现古籍汉字的初切分;然后,对过切分汉字进行特征分析,提取过切分区域的特征,利用犹豫模糊集在处理多属性决策问题方面的优势,通过建立犹豫模糊集来判断过切分区域归属同一古籍汉字的隶属度,并据此进行过切分区域的合并;最后,对存在粘连和重叠的汉字采用分段像素跳跃数突变分析方法进行分割。在28886个古籍汉字上的实验结果显示,可以达到92.3%的切分准确率和85.7%的过切分合并准确率。 展开更多
关键词 古籍汉字图像 切分 犹豫模糊集 连通区域
下载PDF
一种古籍汉字图像的多属性模糊检索模型 被引量:2
6
作者 齐艳媚 田学东 +1 位作者 张充 李亚康 《河北大学学报(自然科学版)》 CAS 北大核心 2020年第6期657-665,共9页
针对古籍汉字结构复杂、风格多变以及字形图像降质所导致传统文字图像检索技术在应用于古籍汉字图像时性能不佳的问题,引入犹豫模糊集理论,提出了一种古籍汉字图像检索模型.首先,设计面向古籍汉字图像的重叠模糊规范化双弹性网格划分,... 针对古籍汉字结构复杂、风格多变以及字形图像降质所导致传统文字图像检索技术在应用于古籍汉字图像时性能不佳的问题,引入犹豫模糊集理论,提出了一种古籍汉字图像检索模型.首先,设计面向古籍汉字图像的重叠模糊规范化双弹性网格划分,通过考察当前网格与其近邻网格间各种字形要素间的几何和统计特征,定义相应的犹豫模糊元素,进而构成古籍汉字查询图像和目标图像的犹豫模糊集合;其次,以犹豫模糊集合的加权距离测度作为古籍汉字查询图像和目标图像的相似性测度,得到古籍汉字图像检索结果的有序输出.本文算法在11574幅古籍汉字图像上的检索查准率和查全率分别为78.9%和76.5%. 展开更多
关键词 古籍汉字图像 图像检索 犹豫模糊集 多属性 加权距离测度
下载PDF
古籍汉字图像的可变形卷积网络检索模型 被引量:2
7
作者 田学东 王志红 左丽娜 《中国科技论文》 CAS 北大核心 2020年第4期461-468,共8页
针对现有图像检索技术应用于古籍汉字图像时效果欠佳的问题,在传统卷积神经网络(convolutional neural networks,CNN)的基础上,引入可变形卷积构建适用于古籍汉字图像的CNN模型。首先,利用该模型对古籍汉字图像数据集进行特征提取;然后... 针对现有图像检索技术应用于古籍汉字图像时效果欠佳的问题,在传统卷积神经网络(convolutional neural networks,CNN)的基础上,引入可变形卷积构建适用于古籍汉字图像的CNN模型。首先,利用该模型对古籍汉字图像数据集进行特征提取;然后,利用主成分分析法对特征进行降维;最后,度量查询图像和候选图像的余弦相似度,排序并返回结果。所提出的检索方法在古籍汉字图像数据集上的平均精度均值达到70.42%,平均检索用时为3.15 s。实验结果表明,该模型能够有效地提取古籍汉字图像的特征,提高了检索方法的准确率,在古籍汉字图像检索领域具有一定优势。 展开更多
关键词 计算机图像处理 古籍汉字图像检索 卷积神经网络 可变形卷积 主成分分析
下载PDF
古籍数据库出版探析——以陕西师范大学出版总社《汉籍数字图书馆》为例 被引量:2
8
作者 屈瑞新 《出版发行研究》 CSSCI 北大核心 2017年第6期37-39,9,共4页
古籍文献以统一、规范、灵活的数据库形式整合出版,打破了散乱慢的旧局,利于学术研究、学习应用。从出版角度看,古籍数据库也是优质内容资源与数字出版形式结合的典范,既有利于古籍文献的保护与传承,也适合持续运营与滚动发展。本文结... 古籍文献以统一、规范、灵活的数据库形式整合出版,打破了散乱慢的旧局,利于学术研究、学习应用。从出版角度看,古籍数据库也是优质内容资源与数字出版形式结合的典范,既有利于古籍文献的保护与传承,也适合持续运营与滚动发展。本文结合《汉籍数字图书馆》探究分析了古籍数据库出版的背景意义、出版运营、比对研究以及存在的问题与发展趋势等。 展开更多
关键词 汉字古籍 数字化 数据库出版 古籍再生保护 出版运营
下载PDF
堪与马可波罗游记比美的佳作——谈古朝鲜人崔溥《漂海录》
9
作者 傅璇琮 《中国图书评论》 CSSCI 北大核心 2003年第3期48-49,共2页
距令500多年前,明弘治元年,公元1488年。朝鲜一位中层官员崔搏(号锦南),于闰正月初因事奉差出外,在海上乘船,不幸遭暴风袭击,偕同船42人……
关键词 古朝鲜人 崔溥 《漂海录》 外国 汉字文化古籍 明代
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部