期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
面向文本数字化的自动纠错方法 被引量:3
1
作者 陈翔 徐平先 张玉志 《计算机应用研究》 CSCD 北大核心 2008年第5期1434-1436,共3页
为了提高文本数字化系统的质量,针对该系统的错误特点,采用频率统计树构建查错模型,结合切分信息进行标点纠错,通过表形码和缓存集给出纠错建议,提出了规则与统计结合的自动纠错方法。实验结果表明,该方法召回率为84.65%,准确率为78.89%... 为了提高文本数字化系统的质量,针对该系统的错误特点,采用频率统计树构建查错模型,结合切分信息进行标点纠错,通过表形码和缓存集给出纠错建议,提出了规则与统计结合的自动纠错方法。实验结果表明,该方法召回率为84.65%,准确率为78.89%,误判率为9.07%,能够满足数字化系统需求。 展开更多
关键词 自动纠错 文本数字化 频率统计树 切分信息 表形码
下载PDF
数字化时代中文课外阅读文本库的构建 被引量:2
2
作者 姜丽萍 杨曦 《中国大学教学》 北大核心 2023年第3期83-88,共6页
课外阅读是学习者提升中文阅读能力的重要途径。当前,适合国际中文学习者阅读的文本素材匮乏,而基于数字化的文本阅读具有来源广泛、内容丰富、使用便利等优势。文章综合分析了将数字化文本用于课外阅读的优势与潜在问题,提出构建数字... 课外阅读是学习者提升中文阅读能力的重要途径。当前,适合国际中文学习者阅读的文本素材匮乏,而基于数字化的文本阅读具有来源广泛、内容丰富、使用便利等优势。文章综合分析了将数字化文本用于课外阅读的优势与潜在问题,提出构建数字化课外阅读文本库的设想,重点讨论了数字化文本库的特征、功能与实现路径,以期为开展中文课外阅读、促进中文学习者阅读能力提升及阅读习惯的养成提供新的思路。 展开更多
关键词 中文阅读 数字化文本 构建 课外阅读
下载PDF
一种基于自组织神经网络的中文文本聚类新方法 被引量:11
3
作者 徐建锁 王正欧 王莉 《情报学报》 CSSCI 北大核心 2003年第6期676-680,共5页
针对传统K-均值等算法在文本聚类中的缺陷,本文提出了一种树形动态自组织映射(TGSOM)神经网络来实现中文文本聚类,克服了传统的K-均值等算法中文本种类需要预先给定的缺点.本文详尽描述了该网络模型的生成算法和算法中扩展因子的作用,... 针对传统K-均值等算法在文本聚类中的缺陷,本文提出了一种树形动态自组织映射(TGSOM)神经网络来实现中文文本聚类,克服了传统的K-均值等算法中文本种类需要预先给定的缺点.本文详尽描述了该网络模型的生成算法和算法中扩展因子的作用,并阐述了中文文本的数字化方法--TF.IDF.IG方法. 展开更多
关键词 中文文本 文本聚类 自组织映射 TGSOM 神经网络 K-均值算法 文本数字化
下载PDF
基于文本数据加工实践谈国家标准GB/T 31219.2-2014修订建议 被引量:3
4
作者 韩新月 《图书馆杂志》 CSSCI 北大核心 2021年第5期21-26,共6页
《图书馆馆藏资源数字化加工规范第2部分:文本资源》(GB/T 31219.2-2014)是规范我国图书馆文本资源数字化加工技术的现行国家标准,存在标准内容覆盖不足、技术指标滞后于实践发展的问题,修订标准应考虑在适用范围、框架结构、数据编码... 《图书馆馆藏资源数字化加工规范第2部分:文本资源》(GB/T 31219.2-2014)是规范我国图书馆文本资源数字化加工技术的现行国家标准,存在标准内容覆盖不足、技术指标滞后于实践发展的问题,修订标准应考虑在适用范围、框架结构、数据编码、数据创建方法、加工流程、质量要求和背景资料方面进行扩展,并遵循稳定性和动态性相统一、科学合理与整体协同相统一、规范性与创造性相统一的修订原则。 展开更多
关键词 国家标准 文本资源数字化 修订
下载PDF
标准数字化在信息系统领域的实践与思考
5
作者 陈福玉 耿翠霞 张勤 《信息技术与标准化》 2024年第8期73-78,92,共7页
为了提升数字化对信息系统领域标准贯彻实施的促进作用,阐述了标准数字化的内涵与现状,分析了标准数字化需求,聚焦标准文本数字化和标准化工作数字化的具体实践,从加强标准基础数据建设、研制标准数字化重点标准、开展标准数字化的智能... 为了提升数字化对信息系统领域标准贯彻实施的促进作用,阐述了标准数字化的内涵与现状,分析了标准数字化需求,聚焦标准文本数字化和标准化工作数字化的具体实践,从加强标准基础数据建设、研制标准数字化重点标准、开展标准数字化的智能应用研究、大力培养标准数字化创新人才等4个方面提出思考建议,为信息系统及相关领域标准数字化转型提供借鉴和参考,助力标准数字化发挥更多效用。 展开更多
关键词 标准数字化 信息系统领域 标准文本数字化 标准化工作数字化
下载PDF
一种数字化英语学习语料库及其应用(上) 被引量:31
6
作者 杨永林 李鸣 《外语电化教学》 CSSCI 北大核心 2004年第6期20-26,共7页
过去的30年间,计算机科学和网络技术的发展,极大地促进了教育技术的研究,产生了一大批同语言技术相关的新型科研成果,有力地促进了外语学科的发展.从目前情况看,以计算机和网络技术为基础的学习系统,相对于其他学科而言,在语言教学领域... 过去的30年间,计算机科学和网络技术的发展,极大地促进了教育技术的研究,产生了一大批同语言技术相关的新型科研成果,有力地促进了外语学科的发展.从目前情况看,以计算机和网络技术为基础的学习系统,相对于其他学科而言,在语言教学领域获得了最为广泛的应用,成为训练各种语言基本技能的有效辅助手段.本文通过心理学、社会学、语言学理论研究,结合对体验英语写作训练系统中学习语料库的研发工作,通过具体的写作教学实例,对其内容和功用做了分析介绍.本项研究共由8个方面的内容组成,各小节的标题分别为:研究背景、问题与对策、临近发展区域的问题、有效信息输入量的问题、过程化写作的问题、社团实践理论的问题、数字化文本处理的问题以及前景展望. 展开更多
关键词 英语写作 语料库建设 信息输入理论 过程化写作 社团实践理论 数字化文本处理
原文传递
一种数字化英语学习语料库及其应用(下) 被引量:21
7
作者 杨永林 李鸣 《外语电化教学》 CSSCI 2005年第1期7-13,共7页
过去的30年间,计算机科学和网络技术的发展,极大地促进了教育技术的研究,产生了一大批同语言技术相关的新型科研成果,有力地促进了外语学科的发展.从目前情况看,以计算机和网络技术为基础的学习系统,相对于其他学科而言,在语言教学领域... 过去的30年间,计算机科学和网络技术的发展,极大地促进了教育技术的研究,产生了一大批同语言技术相关的新型科研成果,有力地促进了外语学科的发展.从目前情况看,以计算机和网络技术为基础的学习系统,相对于其他学科而言,在语言教学领域获得了最为广泛的应用,成为训练各种语言基本技能的有效辅助手段.本文通过心理学、社会学、语言学理论研究,结合对体验英语写作训练系统中学习语料库的研发工作,通过具体的写作教学实例,对其内容和功用做了分析介绍.本项研究共由8个方面的内容组成,各小节的标题分别为:研究背景、问题与对策、临近发展区域的问题、有效信息输入量的问题、过程化写作的问题、社团实践理论的问题、数字化文本处理的问题以及前景展望. 展开更多
关键词 英语写作 语料库建设 信息输入理论 过程化写作 社团实践理论 数字化文本处理
原文传递
浅议如何推进缩微胶片的开发与利用 被引量:1
8
作者 戴翔 《数字与缩微影像》 2021年第1期29-32,共4页
笔者简要论述了缩微胶片开发利用对于文献原件保护,方便后期制作等有着特殊的意义,阐述了缩微胶片开发利用面临的问题,提出了推进缩微胶片开发利用的方案。
关键词 缩微胶片 开发 利用 文本数字化 资源库
下载PDF
谈谈网络出版发展的三个阶段 被引量:1
9
作者 刘炼 《电子出版》 2001年第11期23-25,共3页
出版界对网络出版的讨论已是沸沸扬扬。虽然对于网络出版还没有一个权威的定义,但一般认为网络出版是以国际互联网为载体和流通渠道,出版销售数字出版物的行为,简而言之,就是出版和销售eBook的行为。eBook是以互联网为流通渠道,以数字... 出版界对网络出版的讨论已是沸沸扬扬。虽然对于网络出版还没有一个权威的定义,但一般认为网络出版是以国际互联网为载体和流通渠道,出版销售数字出版物的行为,简而言之,就是出版和销售eBook的行为。eBook是以互联网为流通渠道,以数字化内容为流通介质,以网上支付为主要交换方式的一种崭新的信息载体。 展开更多
关键词 网络出版 发展史 文本图书数字化 电子图书数据库化 电子图书多媒体化
下载PDF
基于移位变换的句子层自然语言信息隐藏算法 被引量:2
10
作者 刘玉玲 孙星明 辛国江 《控制与决策》 EI CSCD 北大核心 2009年第12期1861-1864,共4页
针对现有的句子层自然语言信息隐藏方法存在的问题,提出一种基于句子层移位变换规则的中文自然语言信息隐藏算法.首先利用汉字数学表达式对中文文本信号数字化;然后通过句子的移位变换改变句子词序以嵌入秘密信息.实验结果和分析表明,... 针对现有的句子层自然语言信息隐藏方法存在的问题,提出一种基于句子层移位变换规则的中文自然语言信息隐藏算法.首先利用汉字数学表达式对中文文本信号数字化;然后通过句子的移位变换改变句子词序以嵌入秘密信息.实验结果和分析表明,该算法实现简单、编码容量较大,同时秘密信息隐藏在自然语言文本句子层词序变换中,不改变文本语法、语义和风格,具有较好的隐蔽性. 展开更多
关键词 信息隐藏 自然语言 移位变换 文本数字化
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部