期刊文献+
共找到62篇文章
< 1 2 4 >
每页显示 20 50 100
《论语》“好”“乐”“说”辨析 被引量:1
1
作者 尹世英 《广东技术师范学院学报》 2016年第1期74-81,共8页
"好""乐""说"在《论语》中都是多音多义字,在"愉悦"义上都可以做谓语,在表示"愉悦"义上是同义词,但作为谓语中心词它们的造句能力不尽相同。在现代汉语中,他们的演变结果也不尽相同:... "好""乐""说"在《论语》中都是多音多义字,在"愉悦"义上都可以做谓语,在表示"愉悦"义上是同义词,但作为谓语中心词它们的造句能力不尽相同。在现代汉语中,他们的演变结果也不尽相同:"好"是古今一脉相承,没有变化;"乐"有"音乐"义"yuè"、"快乐"义的"lè"和"像"义的"yào"三个读音;"说"在书写形式上分化为"说"和"悦","说"是"说话",是动词,"悦"是"高兴",是形容词。 展开更多
关键词 多音多义字 四声别义 语法功能 词汇意义
下载PDF
基于图像特征的汉字字形相似度计算
2
作者 王昭 杨婧 杨敏 《山西电子技术》 2024年第2期61-63,共3页
汉字作为一种数量众多,结构复杂的象形文字,其字形的相似度计算对汉语的错别字识别和纠正具有重要意义。将汉字视为图形,通过尺度不变特征变换算法提取汉字的特征点,并利用汉字间特征点的对应关系,提出了一种基于特征点的相似度计算方... 汉字作为一种数量众多,结构复杂的象形文字,其字形的相似度计算对汉语的错别字识别和纠正具有重要意义。将汉字视为图形,通过尺度不变特征变换算法提取汉字的特征点,并利用汉字间特征点的对应关系,提出了一种基于特征点的相似度计算方法。对《通用规范汉字表》的8105个汉字进行了相似度分析,结果表明,该方法和人的认知结果比较一致。 展开更多
关键词 汉字字形 形似字 相似度计算 尺度不变特征变换
下载PDF
面向汉字矢量图形特征的字向量表征方法 被引量:1
3
作者 唐善成 鲁彪 +2 位作者 张雪 张莹 梁少君 《科学技术与工程》 北大核心 2023年第16期6967-6973,共7页
为解决现有中文字向量表征方法中字形特征利用不充分的问题,利用矢量图形的尺度不变性,提出了一种面向汉字矢量图形特征的字向量(scalable vector graphics to vector,SVG2vec)表征方法。预处理阶段将汉字像素图像转化矢量图形,生成字... 为解决现有中文字向量表征方法中字形特征利用不充分的问题,利用矢量图形的尺度不变性,提出了一种面向汉字矢量图形特征的字向量(scalable vector graphics to vector,SVG2vec)表征方法。预处理阶段将汉字像素图像转化矢量图形,生成字形矢量坐标对序列;特征学习阶段采用双向循环神经网络(recurrent neural network,RNN)和自回归混合密度循环神经网络构建矢量图形变分自编码器模型,利用模型学习汉字字形结构特征;向量生成阶段输入字形矢量坐标对序列到编码器,编码器将字形特征映射到概率连续分布空间,得到SVG2vec字向量。与已有字向量在不同层级任务上进行对比实验。结果表明:SVG2vec向量在命名实体识别、中文分词和短文本相似度计算实验中,F1均值比Word2vec、GloVe等未利用字形特征的向量分别提高了1.27、0.4,1.67、0.12,3.28、2.03,比GnM2Vec、CWE等利用字形特征的向量分别提高了1.02、1.07,1.69、1.34,0.04、0.31,SVG2vec能更有效利用汉字字形特征。 展开更多
关键词 汉字字形 矢量图形 字向量 变分自编码器
下载PDF
《雍熙乐府》四字格同素异序词语考察
4
作者 晁孟杰 《现代语文》 2020年第12期46-51,共6页
《雍熙乐府》中的四字格同素异序词语,字序变换方式多样,词中字序的变换在一定程度上影响和改变了词语的结构关系。以《现代汉语词典》(第七版)为参照,考察《雍熙乐府》中四字格同素异序词语在现代汉语中的演变情形。有的至少保留了一... 《雍熙乐府》中的四字格同素异序词语,字序变换方式多样,词中字序的变换在一定程度上影响和改变了词语的结构关系。以《现代汉语词典》(第七版)为参照,考察《雍熙乐府》中四字格同素异序词语在现代汉语中的演变情形。有的至少保留了一个词形,有的固化为成语,有的所有词形都已消亡。在分析四字格同素异序词词形丰富的成因基础上,结合演变现状,分析其词形演变原因。用韵和修辞导致四字格同素异序词词形丰富,声调和时代环境造成了四字格同素异序词的词形演变。 展开更多
关键词 《雍熙府》 四字格 同素异序词
下载PDF
繁体字字形规范的基本理念与当代实践
5
作者 王立军 《语言文字应用》 北大核心 2023年第1期10-18,共9页
《古籍印刷通用字规范字形表》的发布实施,是我国汉字规范工作的又一次重要实践,填补了繁体字字形规范方面的空白,体现了研制者对繁体字字形规范问题的当代思考。繁体字在当今社会文化生活中仍具有重要的应用价值,但在实际应用中存在着... 《古籍印刷通用字规范字形表》的发布实施,是我国汉字规范工作的又一次重要实践,填补了繁体字字形规范方面的空白,体现了研制者对繁体字字形规范问题的当代思考。繁体字在当今社会文化生活中仍具有重要的应用价值,但在实际应用中存在着较多问题,必须加以整理规范。对繁体字进行规范,必须既尊重古籍用字的事实,又立足当代的视角,坚持“优选”的原则,秉持古今沟通及内地与港澳台地区沟通的理念,在科学性和适用性之间寻求最佳的契合点。 展开更多
关键词 繁体字 古籍印刷通用字 汉字规范 《古籍印刷通用字规范字形表》
下载PDF
基础教育汉字字形偏误分析
6
作者 黄利华 《科教导刊》 2023年第24期46-48,共3页
汉字字形偏误是基础教育阶段的学生在语文学习中出现的比较普遍的现象。文章根据汉字构形的特点划分汉字偏误类型,从笔画、部件、整字三个层面讨论基础教育阶段学生的汉字字形偏误。笔画层面,主要有混淆相似的笔画、笔画数目的增加或减... 汉字字形偏误是基础教育阶段的学生在语文学习中出现的比较普遍的现象。文章根据汉字构形的特点划分汉字偏误类型,从笔画、部件、整字三个层面讨论基础教育阶段学生的汉字字形偏误。笔画层面,主要有混淆相似的笔画、笔画数目的增加或减少、笔画误断误连、笔画配合偏误、笔顺不合规范等。部件层面,主要有部件的增加或减少、部件改换、部件组合偏误等。整字层面,主要有形近别字、音近别字、义近别字等。文章通过分析汉字字形偏误的类型,以期对基础汉字教学有一定的帮助。 展开更多
关键词 基础教育 汉字 字形偏误
下载PDF
初唐宫廷写经与日本古辞书
7
作者 池田证寿 贾智(译) 《汉字汉语研究》 2023年第4期79-97,127,128,共21页
本文通过调查初唐宫廷写经中的25个字体,发现初唐宫廷写经的用字规范相比晚唐开成石经呈现出明显的不稳定性。开成石经的字体与其他时代、地区的标准文献的字体存在较大差异。唐代字样书促进了初唐标准字体向开成标准字体过渡。通过考... 本文通过调查初唐宫廷写经中的25个字体,发现初唐宫廷写经的用字规范相比晚唐开成石经呈现出明显的不稳定性。开成石经的字体与其他时代、地区的标准文献的字体存在较大差异。唐代字样书促进了初唐标准字体向开成标准字体过渡。通过考察《新撰字镜》《类聚名义抄》等日本古辞书对唐代字样书的援引情况,两书对同一字体所持的正字观并不相同,这可能反映了字体的历时演变过程。 展开更多
关键词 字体史 初唐宫廷写经 字样书 新撰字镜 类聚名义抄
下载PDF
基于特征加权的汉字点笔画生成研究 被引量:8
8
作者 栗青生 熊晶 +1 位作者 吴琴霞 杨玉星 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期153-160,共8页
针对汉字字形设计和开发的困难,提出基于特征点抽象的汉字字形描述方法和汉字字形生成方法,研究特征点、特征表达式、特征点的权值和权矢量等在汉字字形生成中的应用技术和方法,并以点的生成为例,设计汉字点笔画的生成算法,并进行验证... 针对汉字字形设计和开发的困难,提出基于特征点抽象的汉字字形描述方法和汉字字形生成方法,研究特征点、特征表达式、特征点的权值和权矢量等在汉字字形生成中的应用技术和方法,并以点的生成为例,设计汉字点笔画的生成算法,并进行验证实验。实验结果证明该算法可靠并实用,可切实提高汉字字形设计的效率,为汉字其他笔画的生成提供一种解决方案。 展开更多
关键词 汉字 字形生成 特征权值 权矢量 字体
下载PDF
一种笔段网格汉字字形描述方法 被引量:13
9
作者 林民 宋柔 《计算机研究与发展》 EI CSCD 北大核心 2010年第2期318-327,共10页
现有计算机汉字字形描述方法在特征选取、字形比对计算方面存在缺陷,无法解决输入错字、古籍异体字、拼合字和自动比对字形等问题.面向应用提出一种具有颗粒度适当、无歧义、规范化基元特征,能描述一切可能字形(包括错字、异体字、拼合... 现有计算机汉字字形描述方法在特征选取、字形比对计算方面存在缺陷,无法解决输入错字、古籍异体字、拼合字和自动比对字形等问题.面向应用提出一种具有颗粒度适当、无歧义、规范化基元特征,能描述一切可能字形(包括错字、异体字、拼合字)骨架异同的笔段网格汉字字形描述方法,并基于该描述给出了简单笔画、复合笔画分类及自动提取、结构关系计算等算法.实验表明,该方法可用于支持各种字形的描画输入和字形整体、局部比对计算. 展开更多
关键词 汉字字形 笔段网格 形式化描述 字形比对 笔画
下载PDF
基于OpenType的复杂文本语言处理的研究与实现 被引量:6
10
作者 董治江 吴健 钟义信 《计算机应用研究》 CSCD 北大核心 2004年第10期158-161,共4页
某些书写系统的文字(如蒙古文、维文、藏文等)具有比拉丁文字复杂的特性,当计算机在处理这类文字时,运用传统的字体技术(如TrueType)几乎不可能在显现出规范的书写形式的同时,实现对Unicode标准编码的支持。就这个问题介绍一种基于OpenT... 某些书写系统的文字(如蒙古文、维文、藏文等)具有比拉丁文字复杂的特性,当计算机在处理这类文字时,运用传统的字体技术(如TrueType)几乎不可能在显现出规范的书写形式的同时,实现对Unicode标准编码的支持。就这个问题介绍一种基于OpenType字体的处理模型。事实证明,这是一种可行的方案。 展开更多
关键词 复杂文本 字符 字型 布局引擎 连字
下载PDF
基于语义构件的甲骨文字库自动生成技术研究 被引量:6
11
作者 吴琴霞 栗青生 高峰 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期161-166,共6页
针对甲骨文字形多变、异体字多等特点,通过对甲骨字的构成分析,提出一种基于语义构件的甲骨文字库自动生成方法。该方法以动态描述库为基础,通过算法提取甲骨字的构件特征信息,重组笔元生成语义构件,再给语义构件加上特征描述生成构件... 针对甲骨文字形多变、异体字多等特点,通过对甲骨字的构成分析,提出一种基于语义构件的甲骨文字库自动生成方法。该方法以动态描述库为基础,通过算法提取甲骨字的构件特征信息,重组笔元生成语义构件,再给语义构件加上特征描述生成构件知识库。通过仿射变换重复使用语义构件自动生成任意甲骨字。实验表明,该方法能有效解决甲骨文无字库输入的实现,还可以解决甲骨字编码、构件统计、未释字的考释等。 展开更多
关键词 甲骨文 构件 字形描述 有向笔段 仿射变换
下载PDF
汉字字形计算及其在校对系统中的应用 被引量:5
12
作者 宋柔 林民 葛诗利 《小型微型计算机系统》 CSCD 北大核心 2008年第10期1964-1968,共5页
汉语是一种开放大字符集语言,汉字字形相似度计算是汉语信息处理的一项基础研究,对于汉字识别、计算机辅助的汉语文章校对和汉字教学都有重要作用.本文对现有汉字字形结构描述方法从图形相似角度进行了改进,并给出了一种基于结构描述的... 汉语是一种开放大字符集语言,汉字字形相似度计算是汉语信息处理的一项基础研究,对于汉字识别、计算机辅助的汉语文章校对和汉字教学都有重要作用.本文对现有汉字字形结构描述方法从图形相似角度进行了改进,并给出了一种基于结构描述的字形相似度计算算法,该方法计算相似度无需字形样本实例的学习训练,对于常用字和难于获取书写样本的生僻字的相似度计算,都具有很好的适应性,可满足不断扩大的汉字集合计算相似度的需要.实验表明,采用此法计算得到的GB2312中6763个汉字的相似字表,与人的认知结果吻合度很好,并应用于计算机辅助校对系统中的别字修改提示,显示出较好效果. 展开更多
关键词 汉字字形 结构描述 相似度
下载PDF
汉字的笔段网格字形描述及字形比对算法 被引量:7
13
作者 林民 宋柔 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2009年第9期1298-1306,共9页
由于目前计算机缺乏对汉字字形统一有效的形式化描述和比对计算方法,致使无法描画输入所需的各种可能汉字,也无法利用计算机对字形进行比对分析.提出一种具有颗粒度适当、无歧义、规范化基元,能描述各种可能字形(包括错字、古籍异体字... 由于目前计算机缺乏对汉字字形统一有效的形式化描述和比对计算方法,致使无法描画输入所需的各种可能汉字,也无法利用计算机对字形进行比对分析.提出一种具有颗粒度适当、无歧义、规范化基元,能描述各种可能字形(包括错字、古籍异体字、拼合字)骨架异同的笔段网格汉字字形描述方法;并基于该方法给出了字形比对算法,它能自动提取字形包含的简单笔画和复合笔画,根据字形的不同自适应地选取复合笔画或简单笔画,并以此为单位进行比对;最后将计算两字形最优配对笔画间的向量距离总和作为比对结果.实验结果表明,该方法具有很强的字形描述能力,字形比对算法对结构规范字形的比对准确率较高,可用于支持各种汉字的描画输入及面向字形比对分析的各种应用. 展开更多
关键词 汉字字形 笔段网格 形式化描述 字形比对
下载PDF
一种面向构形计算的汉字字形形式化描述方法 被引量:7
14
作者 林民 宋柔 《中文信息学报》 CSCD 北大核心 2008年第3期115-123,共9页
目前汉字字形描述方法存在的主要问题是缺少能涵盖一切可能汉字的可计算的字形形式化描述体系,从而造成汉字处理应用中的一系列障碍。本文给出了一种汉字网格字形描述方法,实验表明,该方法具有描述一切可能汉字字形(包括错字)骨架的能力... 目前汉字字形描述方法存在的主要问题是缺少能涵盖一切可能汉字的可计算的字形形式化描述体系,从而造成汉字处理应用中的一系列障碍。本文给出了一种汉字网格字形描述方法,实验表明,该方法具有描述一切可能汉字字形(包括错字)骨架的能力,支持不同颗粒度的构字元素、结构关系等字形特征的自动提取和计算,为字形特征的自动分析处理提供了一种有效的手段,从而也为基于字形计算的各种应用建立了可靠的基础。 展开更多
关键词 计算机应用 中文信息处理 汉字字形 形式化描述 网格字形 特征计算
下载PDF
一种新颖的汉字字形相似度计算方法 被引量:5
15
作者 王东 熊世桓 《计算机应用研究》 CSCD 北大核心 2013年第8期2395-2397,共3页
为了利用字形描述技术识别相似汉字,提出了三元组递归表示的汉字字形相似度计算方法。该算法把汉字表示为汉字结构、字首部件和字尾部件三元组,以部件为运算对象,字型结构为运算符,将汉字描述为前缀表达式。通过建立汉字字形相似度计算... 为了利用字形描述技术识别相似汉字,提出了三元组递归表示的汉字字形相似度计算方法。该算法把汉字表示为汉字结构、字首部件和字尾部件三元组,以部件为运算对象,字型结构为运算符,将汉字描述为前缀表达式。通过建立汉字字形相似度计算递归模型,使计算过程被逐层分解为原子部件间的相似性比较,从而更好地降低了计算的复杂性。然后将其用于计算汉字的最佳相似字。实验结果表明,该方法与人的认知结果吻合度很好,算法是有效可行的。 展开更多
关键词 汉字字形 形近字 相似度计算 前缀表达式 三元组
下载PDF
汉字字形形式化描述方法研究 被引量:3
16
作者 林民 宋柔 《计算机科学》 CSCD 北大核心 2007年第11期185-188,共4页
本文分析了目前汉字处理应用中存在的主要问题,归纳出问题的核心是由于缺少能涵盖一切可能汉字的、可计算的字形形式化描述体系,从而造成应用中有一系列障碍。发现了现有字形描述方法共同存在的特征选取缺陷,最后给出了一种可行的汉字... 本文分析了目前汉字处理应用中存在的主要问题,归纳出问题的核心是由于缺少能涵盖一切可能汉字的、可计算的字形形式化描述体系,从而造成应用中有一系列障碍。发现了现有字形描述方法共同存在的特征选取缺陷,最后给出了一种可行的汉字网格字形描述方法,该方法不仅能表示一切可能的汉字字形(包括错字),而且为字形特征异同的自动计算奠定了可靠的基础。 展开更多
关键词 汉字字形 形式化描述 网格字形 特征计算
下载PDF
音形结合的方块苗文输入编码方案研究 被引量:7
17
作者 莫礼平 曾水玲 周恺卿 《计算机科学与探索》 CSCD 2014年第8期1017-1024,共8页
根据方块苗文的造字原理和字形拓扑结构特征,提出了一种由构件汉语拼音的部分字母决定音码,由合体字结构类型决定形码,按照"先音后形"的次序生成编码序列的方块苗文字形输入编码方案,并使用上下文无关文法对方案进行了形式化... 根据方块苗文的造字原理和字形拓扑结构特征,提出了一种由构件汉语拼音的部分字母决定音码,由合体字结构类型决定形码,按照"先音后形"的次序生成编码序列的方块苗文字形输入编码方案,并使用上下文无关文法对方案进行了形式化描述,给出了方块苗文拆分取码的方法。测试实验表明,该方案具有码长短、重码率低的特点,基于该方案的输入法简捷快速、易学易用,能够解决从方块苗文字库中快速调出所需字形的问题。 展开更多
关键词 方块苗文 字形 拓扑结构 输入法 编码方案
下载PDF
结合五笔字形与上下文相关字向量的命名实体识别 被引量:7
18
作者 张栋 王铭涛 陈文亮 《计算机工程》 CAS CSCD 北大核心 2021年第3期94-101,共8页
命名实体识别(NER)作为自然语言处理的重要部分,在信息抽取和知识图谱等任务中得到广泛应用。然而目前中文预训练语言模型通常仅对上下文中的字符进行建模,忽略了中文字符的字形结构。提出2种结合五笔字形的上下文相关字向量表示方法,... 命名实体识别(NER)作为自然语言处理的重要部分,在信息抽取和知识图谱等任务中得到广泛应用。然而目前中文预训练语言模型通常仅对上下文中的字符进行建模,忽略了中文字符的字形结构。提出2种结合五笔字形的上下文相关字向量表示方法,以增强字向量的语义表达能力。第一种方法分别对字符和字形抽取特征并联合建模得到字向量表示,第二种方法将五笔字形作为辅助信息拼接到字向量中,训练一个基于字符和五笔字形的混合语言模型。实验结果表明,所提两种方法可以有效提升中文NER系统的性能,且结合五笔字形的上下文相关字向量表示方法的系统性能优于基于单一字符的语言模型。 展开更多
关键词 语言模型 命名实体识别 五笔字形 上下文相关字向量 无标注语料
下载PDF
基于动态描述库的汉字字形自动生成技术研究 被引量:5
19
作者 吴琴霞 栗青生 《科学技术与工程》 北大核心 2013年第15期4426-4432,共7页
目前汉字字形的生成仍是手工劳动和人工设计,加上汉字数据量巨大截止到现在没有一种合适的字形自动化生成工具可以使用。针对这一难题提出了一种基于字形描述库的汉字字形自动生成的技术。该技术先将汉字字形与字形描述库映射,以字形描... 目前汉字字形的生成仍是手工劳动和人工设计,加上汉字数据量巨大截止到现在没有一种合适的字形自动化生成工具可以使用。针对这一难题提出了一种基于字形描述库的汉字字形自动生成的技术。该技术先将汉字字形与字形描述库映射,以字形描述库为桥梁将汉字字形数据化,然后通过查找字形描述库找到汉字对应的骨架信息,提取笔画骨架。最后通过数据的逆向处理将笔画骨架信息还原为各种汉字字形,形成汉字字形库。 展开更多
关键词 动态描述 描述库 汉字字形 笔画骨架 贝塞尔曲线
下载PDF
一种基于动态描述库的集外汉字输入和显示方法 被引量:2
20
作者 吴琴霞 栗青生 《计算机应用与软件》 CSCD 北大核心 2014年第11期71-74,共4页
提出一种计算机系统字库中没有的集外字输入和显示的方法,以解决汉语言文字信息化发展的需要。该方法首先对一些字形进行矢量描述生成动态描述库,在集外字的输入过程中以动态描述库为桥梁,通过对动态描述库的操作,用户可以按照自己的意... 提出一种计算机系统字库中没有的集外字输入和显示的方法,以解决汉语言文字信息化发展的需要。该方法首先对一些字形进行矢量描述生成动态描述库,在集外字的输入过程中以动态描述库为桥梁,通过对动态描述库的操作,用户可以按照自己的意愿来设计和输出各种汉字,包括古文字、异体字,和错别字以及合体字等。该方法还有效地解决了由于使用轮廓字形描述而存在的字形动态编辑和字形变换的困难。 展开更多
关键词 集外字 态描述库 汉字字形 笔画骨架
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部