期刊文献+
共找到53篇文章
< 1 2 3 >
每页显示 20 50 100
中文短文本自动分类中的汉字特征优化研究 被引量:4
1
作者 王昊 邓三鸿 苏新宁 《情报理论与实践》 CSSCI 北大核心 2015年第6期121-127,共7页
采用含语义的词语或篇幅更长的语言片段作为中文短文本的特征描述存在明显的可操作性问题。文章综合探讨了汉字特征在中文短文本分类计算中的可行性以及影响规律,比较了关键词、词语和汉字的类目区分能力,认为后者的分类效果略低于篇幅... 采用含语义的词语或篇幅更长的语言片段作为中文短文本的特征描述存在明显的可操作性问题。文章综合探讨了汉字特征在中文短文本分类计算中的可行性以及影响规律,比较了关键词、词语和汉字的类目区分能力,认为后者的分类效果略低于篇幅大的语言片段,但其具有可计算性强和文本覆盖率高的优点;基于类现频次和信息增益复合方法对汉字特征进行了筛选,总结了汉字特征数量减少对分类效果的影响规律;分析了不同特征权重设置对汉字特征分类效果的影响及其原因,认为汉字在词语中的位置参数及其频次参数的有效结合可以在一定程度上提高汉字特征的分类效果。 展开更多
关键词 短文本 文本分类 汉字特征 自动分类 优化
下载PDF
一种基于汉字特征和语义的文本数字水印算法 被引量:10
2
作者 辛友强 刘东苏 《计算机应用》 CSCD 北大核心 2007年第B12期134-135,143,共3页
提出了一种基于汉字特征和语义的文本数字水印算法,主要针对语言内容本身,不受文字格式变换的影响。该算法通过计算汉语句子的特征值,进行最小程度的语义及特征变换,嵌入水印。实验证明该算法具有嵌入水印容易,隐蔽性好,实现方便等优点。
关键词 文本数字水印 内容 汉字特征 自然语言处理
下载PDF
手写汉字识别弹性网格Gabor特征提取方法的研究 被引量:11
3
作者 金连文 覃剑钊 《计算机应用研究》 CSCD 北大核心 2004年第12期163-165,共3页
结合弹性网格技术来对手写体汉字提取Gabor特征,并与基于非线性归一化的Gabor特征及传统的方向特征进行了比较研究,实验结果表明:提出的弹性网格Gabor特征优于非线性归一化Gabor特征,识别性能最稳定;弹性网格Gabor特征要明显优于传统的... 结合弹性网格技术来对手写体汉字提取Gabor特征,并与基于非线性归一化的Gabor特征及传统的方向特征进行了比较研究,实验结果表明:提出的弹性网格Gabor特征优于非线性归一化Gabor特征,识别性能最稳定;弹性网格Gabor特征要明显优于传统的方向线数特征;不同的非线性归一化方法及归一化的图像尺寸对特征提取的性能有较大影响。 展开更多
关键词 GABOR滤波器 手写体汉字特征提取 非线性归一化 弹性网格
下载PDF
基于面向对象思想的汉字特征研究 被引量:2
4
作者 程裕强 朱国进 《计算机应用与软件》 CSCD 2011年第2期169-171,188,共4页
从计算机软件理论中的面向对象思想出发,分析汉字的抽象性、封装性、继承性、多态性等性质,提出汉字是一种面向对象的文字,并给出了解决汉字总量无限增长危机的方法。
关键词 面向对象 汉字 汉字特征
下载PDF
汉字特征分析与实验字取样策略 被引量:9
5
作者 郭小朝 《人类工效学》 1999年第3期14-18,共5页
以汉字分析为基础,建议选取6 ~13 画为笔画数取样范围,把1 .0 ~49 .9 次/ 百万、50 .0 ~499 .9次/ 百万字次作为低、高字频实验汉字的字频取样范围,认为成字部件在上、下、左、右4 个位置上的出现频率是整... 以汉字分析为基础,建议选取6 ~13 画为笔画数取样范围,把1 .0 ~49 .9 次/ 百万、50 .0 ~499 .9次/ 百万字次作为低、高字频实验汉字的字频取样范围,认为成字部件在上、下、左、右4 个位置上的出现频率是整字部件识别研究中选择检测部件时的匹配因素之一。2°视角64 ×64 点阵大小黑、宋体汉字图象的大部分频谱能量分布在0 ~8 .0 周/ 度的空间频率范围内,应在此范围内进行模式识别研究,并将图像灰度矩阵间的欧氏距离作为汉字图像相似性度量指标。 展开更多
关键词 汉字特征分析 实验字 取样策略 空间额率范围
下载PDF
一种模糊相关的手写体汉字特征提取方法 被引量:1
6
作者 许舟军 方应谦 《微型电脑应用》 1999年第2期31-33,共3页
本文给出了手写体汉字网格模糊笔划密度特征的提取方法,将模糊数学与统计方法相融合,结合汉字的结构特征与统计特征,准确地提取了汉字的模糊笔划密度特征,且该特征较为稳定。使用该特征进行手写汉字识别的分类实验,结果令人满意。
关键词 模糊数学 笔划元 汉字特征提取 汉字识别
下载PDF
汉字方向分解网格特征的改进 被引量:1
7
作者 郑志洵 杨建刚 《计算机工程》 EI CAS CSCD 北大核心 2006年第12期205-207,217,共4页
在现有的汉字方向分解网格特征基础上,对其分析和改进,提出了一套新的汉字特征方案:首先对原汉字进行轮廓提取,在轮廓汉字上进行有重叠的矩形弹性网格划分,然后对原汉字用边缘检测算子做边缘梯度方向角分解,得到横、竖、撇、捺4个方向... 在现有的汉字方向分解网格特征基础上,对其分析和改进,提出了一套新的汉字特征方案:首先对原汉字进行轮廓提取,在轮廓汉字上进行有重叠的矩形弹性网格划分,然后对原汉字用边缘检测算子做边缘梯度方向角分解,得到横、竖、撇、捺4个方向的子图像,再把网格应用到这4个方向的子图像上,统计每个网格中的黑像素占这个子图像总像素的比例,4个子图像的所有网格的比例值构成的矢量就是汉字的特征。使用不依赖于分类器的特征标准比较了新旧方案,表明新方案优于旧方案。 展开更多
关键词 汉字方向分解网格特征 矩形弹性网格 边缘梯度方向角
下载PDF
关于青年学生对汉字特征的识别——同构异字识别规则初探
8
作者 马谋超 汪培庄 《心理学报》 1981年第3期311-316,共6页
本研究对两对同构异字:“日” 与“曰” 和“由” 与“甲”的变体,作了确认率、自信度和满意度三种测量,一致表明识别和变体之间存在某种心理物理关系。它适合建立模糊集合论的数学模型。其次,表明人们对于同构异字的特征觉察具有动态... 本研究对两对同构异字:“日” 与“曰” 和“由” 与“甲”的变体,作了确认率、自信度和满意度三种测量,一致表明识别和变体之间存在某种心理物理关系。它适合建立模糊集合论的数学模型。其次,表明人们对于同构异字的特征觉察具有动态的性质。此外,在两择一强制选择条件下,数据良好地表征出模糊集合论的余集和模糊熵的特性。 展开更多
关键词 青年学生 识别规则 汉字特征 模糊集 数学模型 模糊熵 心理物理 满意度 异字 选择条件
下载PDF
汉字笔迹特征与职业倾向的相关研究
9
作者 王宇中 袁悦 +2 位作者 尹磊 申权威 朱金福 《广东经济》 2017年第7X期162-165,共4页
目的:为了探讨汉字笔迹特征与职业倾向之间的关系.方法:经过多轮实验确定笔迹采集工具电子签字屏(ESP1020)和汉字抄写材料.由经过培训的笔迹资料采集员从多个地区进行资料采集,获得有效笔迹资料及职业兴趣测评资料467份.采用汉字笔迹特... 目的:为了探讨汉字笔迹特征与职业倾向之间的关系.方法:经过多轮实验确定笔迹采集工具电子签字屏(ESP1020)和汉字抄写材料.由经过培训的笔迹资料采集员从多个地区进行资料采集,获得有效笔迹资料及职业兴趣测评资料467份.采用汉字笔迹特征量化系统(CCQAS5.0)量化被试的38个笔迹特征和4个整体笔迹特征.结果:汉字笔迹特征与不同职业兴趣类型之间存在显著相关(P<0.05,P<0.01).结论:书写平均压力、标题平均字压等35项笔迹特征分别与不同的职业兴趣类型之间存在联系. 展开更多
关键词 汉字笔迹特征 职业倾向 相关分析
下载PDF
从《施氏食狮史》看汉字的特征
10
作者 张辰昀 《湖北第二师范学院学报》 2011年第5期24-26,共3页
1957年8月,赵元任先生在《光明日报》上发表了一篇名为《施氏食狮史》的文章,带给我们汉字拼音化可行性的思考,同时也向我们揭示了汉字的本质特征,展现了汉字音节大于词(语素)的独有本质,从这一特征出发,我们可以判定汉字是以象形为基础... 1957年8月,赵元任先生在《光明日报》上发表了一篇名为《施氏食狮史》的文章,带给我们汉字拼音化可行性的思考,同时也向我们揭示了汉字的本质特征,展现了汉字音节大于词(语素)的独有本质,从这一特征出发,我们可以判定汉字是以象形为基础,带有词切分系统的表音文字。 展开更多
关键词 汉字特征 汉字表音功能 词切分
下载PDF
融入汉字字形特征的中英神经机器翻译模型 被引量:7
11
作者 蔡子龙 熊德意 《中文信息学报》 CSCD 北大核心 2019年第5期75-81,共7页
神经机器翻译技术是目前机器翻译应用中取得效果最好的方法。将外部语言学知识如单词词性、依存句法标签引入神经机器翻译系统以提高翻译性能已经被很多学者证明是一种行之有效的途径。相较于其他表音文字,汉字是一种形声字,其构造方法... 神经机器翻译技术是目前机器翻译应用中取得效果最好的方法。将外部语言学知识如单词词性、依存句法标签引入神经机器翻译系统以提高翻译性能已经被很多学者证明是一种行之有效的途径。相较于其他表音文字,汉字是一种形声字,其构造方法具有一半表音、一半表意的特殊结构,这种特殊的构造法使得汉字含有丰富的语义、语音和句法信息。该文在Marta R等工作的基础上,提出了一种新的将字形特征融入端到端模型的方法,并将之应用于中文到英文的翻译上。与基准系统相比,该方法在NIST评测集上获得平均1.1个点的显著提升,有效地证明了汉字字形特征可以对神经机器翻译模型起到促进作用。 展开更多
关键词 神经机器翻译 汉字字形特征 端到端模型
下载PDF
面向汉字识别的新特征及其提取方法 被引量:7
12
作者 赵健 冯乔生 何娟娟 《软件》 2015年第3期31-36,共6页
人主要是依靠汉字的结构特征来识别汉字,本文提出用汉字笔画端点、折角点和交叉点以及汉字笔画之间构成的"洞"的中心点在24个区域上的分布直方图作为汉字结构新特征,提出通过对Harris角点的检测、合并和去除操作的汉字笔画端... 人主要是依靠汉字的结构特征来识别汉字,本文提出用汉字笔画端点、折角点和交叉点以及汉字笔画之间构成的"洞"的中心点在24个区域上的分布直方图作为汉字结构新特征,提出通过对Harris角点的检测、合并和去除操作的汉字笔画端点、折角点和交叉点的提取方法,通过建立手写体与印刷体汉字的特征库中相同汉字新特征的集聚性与不同汉字新特征间的离散性的计算,从实验上验证了所提出的汉字新特征的有效性,分析了所提出的新特征对汉字的大小、字体、光照等影响具有良好的鲁棒性,该新特征对手写体汉字的识别具有较好的应用价值。 展开更多
关键词 汉字结构新特征 结构特征点提取 特征点空间分布直方图
下载PDF
一种基于汉字编码特征的中文多模式匹配算法
13
作者 黄宇 侯整风 +1 位作者 余虎 刘春晖 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第8期1060-1065,共6页
对于大规模中文模式串匹配,由于汉字的散度较高,导致AC算法有限状态自动机中的零状态过长,算法的效率急剧下降。文章提出了一种基于汉字编码特征的改进算法,考虑到汉字的首字节范围比尾字节的小,先查找首字节,再查找尾字节,若失败则直... 对于大规模中文模式串匹配,由于汉字的散度较高,导致AC算法有限状态自动机中的零状态过长,算法的效率急剧下降。文章提出了一种基于汉字编码特征的改进算法,考虑到汉字的首字节范围比尾字节的小,先查找首字节,再查找尾字节,若失败则直接跳转,降低了查找时间。该算法通过给零状态中字符设置标记,有效避免重复匹配和部分匹配,提高了匹配效率。 展开更多
关键词 AC算法 多模式匹配 汉字编码特征 标记
下载PDF
符号理论和汉字符号特征 被引量:1
14
作者 周军 《教育传媒研究》 2020年第1期49-52,共4页
当前我国符号学研究仍处于探索阶段,认识汉字符号特征具有重要意义。这不仅关系我国本土符号学的建立和发展,还关系到对我国传统文化的理解。汉字不仅是文明的载体,也是我国文明区别于其他文明的显著特征。为此,我们必须立足于汉语自身... 当前我国符号学研究仍处于探索阶段,认识汉字符号特征具有重要意义。这不仅关系我国本土符号学的建立和发展,还关系到对我国传统文化的理解。汉字不仅是文明的载体,也是我国文明区别于其他文明的显著特征。为此,我们必须立足于汉语自身特质,形成具有自身特性的语言学和符号学。 展开更多
关键词 符号理论 系统 结构 汉字特征 汉字符号
下载PDF
汉字结构特征与字认知关系的研究 被引量:1
15
作者 喻柏林 曹河圻 《心理科学进展》 CSSCI CSCD 1992年第1期61-62,共2页
人对汉字的认知始于其字形。而智能计算机对汉字的识别,若能模拟或借鉴人认知的过程或特点,其智能化水平则会大大提高一步。可见,研究汉字的字形知觉,不论对于人或计算机都是一个十分有意义的问题。本研究首先分析汉字字形,提出字形四... 人对汉字的认知始于其字形。而智能计算机对汉字的识别,若能模拟或借鉴人认知的过程或特点,其智能化水平则会大大提高一步。可见,研究汉字的字形知觉,不论对于人或计算机都是一个十分有意义的问题。本研究首先分析汉字字形,提出字形四种特征,然后选择合适的实验范型,逐一考查它们与整字或部件认知的关系,最后尝试用当代认知心理学观点,对于经过验证的实验结果提出自己的解释。 展开更多
关键词 汉字结构特征 认知成绩 认知关系 汉字字形 笔画数效应 当代认知心理学 智能计算机 部件 匹配法 结构方式
下载PDF
融合汉字多特征的指挥控制保障领域命名实体识别
16
作者 袁清波 杜晓明 +2 位作者 姚奕 杨帆 蒋祥 《火力与指挥控制》 CSCD 北大核心 2022年第9期48-53,共6页
针对军事指挥控制保障领域知识图谱构建的实际,提出了一种融合汉字多特征的BiLSTM+CRF命名实体识别模型,验证了拼音特征、五笔编码特征和分词边界特征对于模型性能的影响。对军事领域的命名实体识别相关工作和整体研究框架进行介绍;详... 针对军事指挥控制保障领域知识图谱构建的实际,提出了一种融合汉字多特征的BiLSTM+CRF命名实体识别模型,验证了拼音特征、五笔编码特征和分词边界特征对于模型性能的影响。对军事领域的命名实体识别相关工作和整体研究框架进行介绍;详细介绍模型中各层实现的原理和相关细节;通过在军事指挥控制保障领域命名实体识别语料库C2NER上进行实验,结果表明分词边界特征对于模型性能的提升效果较为明显,F1值从67.21%提升到了70.23%,而拼音特征和五笔特征对于模型性能提升则效果一般。 展开更多
关键词 命名实体识别 汉字特征 军事指挥控制保障 知识图谱
下载PDF
基于儿童立场与汉字特征的字词教学——以W老师《灯笼果》教学为例
17
作者 诸定国 《教育视界》 2018年第2期27-29,共3页
儿童立场是教育教学的出发点。一、二年级的字词教学要利用汉字的特征,同时也要坚持儿童立场,尊重儿童思维与认知特点。只有做到两方面有机结合,才能促进学生文字素养的提高。本文以W老师《灯笼果》一课教学为例,阐述了字词教学的三个策... 儿童立场是教育教学的出发点。一、二年级的字词教学要利用汉字的特征,同时也要坚持儿童立场,尊重儿童思维与认知特点。只有做到两方面有机结合,才能促进学生文字素养的提高。本文以W老师《灯笼果》一课教学为例,阐述了字词教学的三个策略:借助直观行动、结合汉字特征与联系文本语境。 展开更多
关键词 字词教学 儿童立场 汉字特征
下载PDF
从符号学看汉字特征 被引量:3
18
作者 樊明亚 《上饶师专学报》 1994年第1期48-55,共8页
本文运用符号学的研究方法和成果,讨论汉字符号学(包括语形学、语义学、语用学)方面的特征,并对当前汉字研究中的一些观点提出不同意见,在此基础上引出汉字优越及不能走拼音化道路的结论。
关键词 符号学 汉字特征 语形学 语义学 语用学
全文增补中
西文AntoCAD下汉字输入方法分析
19
作者 王琦 傅力 +1 位作者 齐彦 孙庆华 《江苏理工大学学报(自然科学版)》 1996年第4期71-74,共4页
通过分析AutoCAD的汉字字型文件HZTXT.SHX,提出了通过查找特征汉字的国际区位码在西文AutoCAD环境下输入汉字的方法.并给出了程序框图及说明.
关键词 AUTOCAD HZTXT.SHX文件 特征汉字 汉字输入
下载PDF
基于集成RBF神经网络的小类别手写体汉字识别系统 被引量:4
20
作者 居琰 汪同庆 +2 位作者 刘建胜 王贵新 彭健 《计算机工程与应用》 CSCD 北大核心 2002年第23期100-102,158,共4页
该文介绍了RBF神经网络的模型,讨论了RBF网络分类器的机理和特点,提出了一种集成RBF神经网络并应用于小类别手写体汉字识别系统的设计,采用了组合重心分解网格特征方法来提取汉字特征,设计了遗传进化隐层节点自生成算法用于RBF的训练。... 该文介绍了RBF神经网络的模型,讨论了RBF网络分类器的机理和特点,提出了一种集成RBF神经网络并应用于小类别手写体汉字识别系统的设计,采用了组合重心分解网格特征方法来提取汉字特征,设计了遗传进化隐层节点自生成算法用于RBF的训练。实验表明该小类别手写体汉字识别系统有很高的识别率,具有一定的实用推广价值。 展开更多
关键词 集成RBF神经网络 小类别手写体汉字识别系统 汉字特征提取 模式识别 人工神经网络
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部