期刊文献+
共找到177篇文章
< 1 2 9 >
每页显示 20 50 100
GP‐FMLNet:A feature matrix learning network enhanced by glyph and phonetic information for Chinese sentiment analysis
1
作者 Jing Li Dezheng Zhang +2 位作者 Yonghong Xie Aziguli Wulamu Yao Zhang 《CAAI Transactions on Intelligence Technology》 SCIE EI 2024年第4期960-972,共13页
Sentiment analysis is a fine‐grained analysis task that aims to identify the sentiment polarity of a specified sentence.Existing methods in Chinese sentiment analysis tasks only consider sentiment features from a sin... Sentiment analysis is a fine‐grained analysis task that aims to identify the sentiment polarity of a specified sentence.Existing methods in Chinese sentiment analysis tasks only consider sentiment features from a single pole and scale and thus cannot fully exploit and utilise sentiment feature information,making their performance less than ideal.To resolve the problem,the authors propose a new method,GP‐FMLNet,that integrates both glyph and phonetic information and design a novel feature matrix learning process for phonetic features with which to model words that have the same pinyin information but different glyph information.Our method solves the problem of misspelling words influencing sentiment polarity prediction results.Specifically,the authors iteratively mine character,glyph,and pinyin features from the input comments sentences.Then,the authors use soft attention and matrix compound modules to model the phonetic features,which empowers their model to keep on zeroing in on the dynamic‐setting words in various positions and to dispense with the impacts of the deceptive‐setting ones.Ex-periments on six public datasets prove that the proposed model fully utilises the glyph and phonetic information and improves on the performance of existing Chinese senti-ment analysis algorithms. 展开更多
关键词 aspect‐level sentiment analysis deep learning feature extraction glyph and phonetic feature matrix compound learning
下载PDF
Ancient Glyphs from Animal Bones and Tortoise Shells Deciphered
2
《China & The World Cultural Exchange》 1996年第2期7-8,共2页
关键词 Ancient glyphs from Animal Bones and Tortoise Shells Deciphered In
下载PDF
甲骨文典型细节特征研究
3
作者 谭飞 《大连大学学报》 2024年第2期27-31,共5页
甲骨文为早期成体系的古代文字,字形仍然保留着较多的形象特征,书写大多不太固定,字形往往呈现出一些差异,如笔画多少不一、形体朝向不定、部件不固定、结构不定型等。但其中的关键细节相对比较一致,具体表现在笔画的曲直、笔画的长短... 甲骨文为早期成体系的古代文字,字形仍然保留着较多的形象特征,书写大多不太固定,字形往往呈现出一些差异,如笔画多少不一、形体朝向不定、部件不固定、结构不定型等。但其中的关键细节相对比较一致,具体表现在笔画的曲直、笔画的长短、书写的方向、强化的特征、选取的对象以及部件的组合关系等方面。这些有意为之的细节,除了忠实记录着原始信息之外,也有不少出于区分字形和区别字义的考虑。典型细节中蕴含着的重要的构形信息,对字义的传达至为关键,对字形的演变产生了深远的影响。 展开更多
关键词 甲骨文 典型 细节特征 字形 字义
下载PDF
基于多粒度字形增强的中文医学命名实体识别 被引量:1
4
作者 刘威 马磊 +1 位作者 李凯 李蓉 《计算机工程》 CAS CSCD 北大核心 2024年第2期337-344,共8页
中文医学命名实体识别(CMNER)旨在从中文非结构化医学文本中提取实体。现有的基于字符的CMNER模型没有从不同角度全面考虑汉字的特点,限制了其应用于CMNER的性能。基于此,提出基于多粒度字形增强的中文医学命名实体识别模型。对于输入... 中文医学命名实体识别(CMNER)旨在从中文非结构化医学文本中提取实体。现有的基于字符的CMNER模型没有从不同角度全面考虑汉字的特点,限制了其应用于CMNER的性能。基于此,提出基于多粒度字形增强的中文医学命名实体识别模型。对于输入的句子,结合汉字的字形空间结构和偏旁部首的表示,同时根据相应的领域词典来匹配字符的领域词信息,增强字符的语义和潜在边界信息,使模型获得更好的实体识别能力;通过门控机制整合领域词和汉字的字形多粒度特征,综合考虑汉字的领域信息和汉字底层信息,从而具有更好的感知医学实体的能力。在此基础上,将多粒度字形增强的字符表示输入到双向长短记忆和条件随机场层,分别进行上下文编码和标签解码。实验结果表明,本文模型较于最佳基线模型在IMCS21和CMeEE数据集上的F1值分别提升了1.04%和0.62%。此外,通过消融实验验证了该模型的每个组成部分的有效性,在识别中文医学命名实体时具有较好的识别性能。 展开更多
关键词 命名实体识别 医学领域 字形结构 门控机制 领域词典
下载PDF
基于字形特征的中文医学命名实体识别方法
5
作者 孟伟伦 郭景峰 +3 位作者 邢珂萱 魏宁 王巧梭 刘滨 《电子学报》 EI CAS CSCD 北大核心 2024年第6期1945-1954,共10页
作为医学信息抽取的第一个关键环节,医学命名实体识别任务旨在从如电子医疗病例、中文医药说明书等非结构化文本中抽取出医学相关的实体.目前大多数中文医学命名实体识别工作通过在预训练模型上进行微调来获得文本表示向量,然后利用特... 作为医学信息抽取的第一个关键环节,医学命名实体识别任务旨在从如电子医疗病例、中文医药说明书等非结构化文本中抽取出医学相关的实体.目前大多数中文医学命名实体识别工作通过在预训练模型上进行微调来获得文本表示向量,然后利用特征工程来提升模型在医疗领域上的性能.这些模型大部分源自在通用数据集上表现较好的模型,没有考虑中文医学数据集的语言特性.通过在多个医学数据集上进行统计分析,发现部分类型的医学实体在字形上具有共性,如在汉字中大部分表示疾病含义的字符都包含“疒”,大部分表示身体器官的字符都包含“月”.针对这些问题,本文提出了一种基于字形特征的中文医学命名实体识别方法,该方法通过在文本表示向量上融合字形向量以及进一步利用数据集中负样本来提升模型的准确度和泛化能力.在多个公共的中文医学数据集上的实验结果表明,该方法获得了比其他模型更好的效果,并且通过消融实验证明了融合字形特征和从负样本中学习对于该任务是有效的. 展开更多
关键词 字形 负样本 两阶段 医学信息 命名实体识别 深度学习
下载PDF
融合汉字字形结构信息的中文命名实体识别
6
作者 陈金玉 王名扬 刘旭 《东北师大学报(自然科学版)》 CAS 北大核心 2024年第2期60-68,共9页
提出BCBGAC(BERT-CNN-BiGRU-Attention-CRF)模型,通过在汉字嵌入中集成字形结构信息来提高中文命名实体识别精度.BCBGAC使用五笔法将汉字按书写顺序分解为基本汉字组件,汉字组件由Skip-Gram方法编码,汉字组件编码矩阵输入卷积神经网络C... 提出BCBGAC(BERT-CNN-BiGRU-Attention-CRF)模型,通过在汉字嵌入中集成字形结构信息来提高中文命名实体识别精度.BCBGAC使用五笔法将汉字按书写顺序分解为基本汉字组件,汉字组件由Skip-Gram方法编码,汉字组件编码矩阵输入卷积神经网络CNN,提取汉字字形结构特征,生成汉字字形结构向量.字形结构向量与BERT模型生成的汉字基本向量拼接得到最终的汉字嵌入向量.然后将汉字向量输入到BiGRU网络中,以捕获向量之间的上下文关系.引入注意力机制来对字符向量进行加权,通过CRF解码层获得实体序列的最佳标注.在两个数据集上的实验结果表明,BCBGAC模型取得了比基线模型更好的实体识别效果.F 1在两个数据集上分别达到96.06%和95.48%,验证了BCBGAC模型在中文命名实体识别任务中的有效性. 展开更多
关键词 命名实体识别 字形结构嵌入 BiGRU 注意力机制
下载PDF
融合字形信息的中文命名实体识别方法
7
作者 王小天 奚彩萍 《计算机与数字工程》 2024年第9期2675-2679,2744,共6页
字形信息与预训练模型(如:BERT)在中文命名实体识别任务上各有优势,它们可以被组合使用。现有的方法倾向于在预训练模型外部融合特征,这种做法需要额外设计字形特征网络与融合特征网络,没有充分利用预训练模型的结构工程(Architecture E... 字形信息与预训练模型(如:BERT)在中文命名实体识别任务上各有优势,它们可以被组合使用。现有的方法倾向于在预训练模型外部融合特征,这种做法需要额外设计字形特征网络与融合特征网络,没有充分利用预训练模型的结构工程(Architecture Engineering)。为此,提出一种模型内融合算法,称为字形增强BERT(Glyph Enhanced BERT,GEBERT),通过字形适配器将字形信息注入BERT底层,使字形特征与字符特征在BERT内部融合。文中还展示了字体选取及GEBERT不同设置的消融研究。实验表明:GEBERT在MSRA数据集上达到平均F1值95.70,优于所有主流的模型外融合算法(Glyce,Glynn,FGN)获得最先进水平(State of the Art,SOTA)。在中文微博数据集上达到平均F1值70.68,仅次于FGN。 展开更多
关键词 BERT 字形 命名实体识别 适配器模型 多模态
下载PDF
《说文解字》二徐本“酉”部字比较研究——以徐铉和徐锴版本为例
8
作者 丁昱先 《文化创新比较研究》 2024年第24期31-36,共6页
《说文解字》是我国历史上第一部解说字义字形、辨识音读的字典,系统完备,影响深远。其现行版本由宋代徐铉校订,俗称大徐本,徐锴在大徐本基础上,又加入自己的补充说明,形成《说文解字系传》,俗称小徐本。二徐本既有相同也有不同之处。... 《说文解字》是我国历史上第一部解说字义字形、辨识音读的字典,系统完备,影响深远。其现行版本由宋代徐铉校订,俗称大徐本,徐锴在大徐本基础上,又加入自己的补充说明,形成《说文解字系传》,俗称小徐本。二徐本既有相同也有不同之处。文章选取其中的“酉”部字作为研究对象,进行对比,分析二徐本在编排体例与解说体例方面的相同与收字数量、部内字序、注音方法与注音用字、六书归部、释文、篆字与重文形体等方面的不同,并总结二书各自的独特之处,如:大徐本增添新附字,部内所编排的字序也更合理,并有注释;小徐本的按语注释丰富多样等。 展开更多
关键词 《说文解字》 《说文解字系传》 “酉”部 比较研究 字形 异同
下载PDF
基于图像特征的汉字字形相似度计算
9
作者 王昭 杨婧 杨敏 《山西电子技术》 2024年第2期61-63,共3页
汉字作为一种数量众多,结构复杂的象形文字,其字形的相似度计算对汉语的错别字识别和纠正具有重要意义。将汉字视为图形,通过尺度不变特征变换算法提取汉字的特征点,并利用汉字间特征点的对应关系,提出了一种基于特征点的相似度计算方... 汉字作为一种数量众多,结构复杂的象形文字,其字形的相似度计算对汉语的错别字识别和纠正具有重要意义。将汉字视为图形,通过尺度不变特征变换算法提取汉字的特征点,并利用汉字间特征点的对应关系,提出了一种基于特征点的相似度计算方法。对《通用规范汉字表》的8105个汉字进行了相似度分析,结果表明,该方法和人的认知结果比较一致。 展开更多
关键词 汉字字形 形似字 相似度计算 尺度不变特征变换
下载PDF
基于词典和字形特征的中文命名实体识别 被引量:1
10
作者 于舒娟 毛新涛 +1 位作者 张昀 黄丽亚 《中文信息学报》 CSCD 北大核心 2023年第3期112-122,共11页
命名实体识别是自然语言处理中的一项基础任务。通过基于词典的方法增强词内语义和词边界信息是中文命名实体识别的主流做法。然而,汉字由象形字演变而来,汉字字形中包含着丰富的实体信息,这些信息在该任务中却很少被使用。该文提出了... 命名实体识别是自然语言处理中的一项基础任务。通过基于词典的方法增强词内语义和词边界信息是中文命名实体识别的主流做法。然而,汉字由象形字演变而来,汉字字形中包含着丰富的实体信息,这些信息在该任务中却很少被使用。该文提出了一个基于词典和字形特征的中文命名实体识别模型,将词信息和结构信息统一地结合起来,提高了实体匹配的准确性。该文首先通过SoftLexicon方法丰富语义信息,并使用改进的部首级嵌入优化字符表示;然后通过门卷积网络加强了对潜在词和上下文信息的提取;最后在四个基准数据集上实验,结果表明与传统模型和最新模型相比,基于词典和字形特征的模型取得了显著的性能提升。 展开更多
关键词 中文命名实体识别 词典 字形特征
下载PDF
On the Compilation Modes of Local History of Science and Technology——A Case Study of the History of Ba-Shu Science and Technology
11
作者 Zha Youliang Wu Lingwei 《Contemporary Social Sciences》 2020年第1期40-53,共14页
The contents of"Ba-Shu History of Science and Technology"take up a single volume of A General History of Ba-Shu Culture.This paper attempts to explore compilation modes of the history of local science and te... The contents of"Ba-Shu History of Science and Technology"take up a single volume of A General History of Ba-Shu Culture.This paper attempts to explore compilation modes of the history of local science and technology by analyzing the compilation of"Shu History of Science and Technology".There are three approaches available,i.e.a general history-based approach,a discipline-based approach and an integrated approach,also known as a discipline-specific approach based on general history.This paper considers the integrated approach to be the most feasible as it elaborates Ba-Shu culture as a sub-culture of Chinese culture,the connotations of Ba-Shu achievements in science and technology,the special significance of the history of Ba-Shu science and technology,as well as the latest progress in studying the history of Ba-Shu science and technology.This paper also puts forward a possible choice to better approach the compilation of the history of local science and technology,reveals areas worth improving,and indicates a proper direction to move towards. 展开更多
关键词 history of local science and technology history of ba-shu science and technology compilation mode
下载PDF
AutoCAD实体导出Glyph2脚本的实现
12
作者 罗小美 《现代机械》 2016年第3期91-94,共4页
目前CFD网格划分软件Pointwise不能导入Auto CAD图纸,无法实现数据重用。为了提高工作效率,需要开发一个能在Pointwise中重建Auto CAD实体对象的程序。这个程序作为Auto CAD的扩展运行,把Auto CAD图纸中的实体对象逐个翻译成能重新创建P... 目前CFD网格划分软件Pointwise不能导入Auto CAD图纸,无法实现数据重用。为了提高工作效率,需要开发一个能在Pointwise中重建Auto CAD实体对象的程序。这个程序作为Auto CAD的扩展运行,把Auto CAD图纸中的实体对象逐个翻译成能重新创建Pointwise实体对象的Glyph2脚本语句,在Pointwise中执行该脚本可以得到Auto CAD实体对象的等价物。实际运行该扩展程序证明该实现是切实可行的,避免了重复建模工作。 展开更多
关键词 AUTOCAD OBJECTARX 导出 glyph2
下载PDF
Ten Characteristics of Ba-Shu Culture in the Global Context
13
作者 Tan Jihe 《Contemporary Social Sciences》 2021年第3期19-29,共11页
First of all, the article identifies the highlights of the documentary The Romantic Shudao.It adopts a panoramic view of the broad Chinese cultural community and depicts the tangible Shudao(road to the Shu area) and t... First of all, the article identifies the highlights of the documentary The Romantic Shudao.It adopts a panoramic view of the broad Chinese cultural community and depicts the tangible Shudao(road to the Shu area) and the intangible "Romance" associated with it by combining the oral history and collective memory as perceived by common people.The vivid stories can easily reach a wide audience and can thus help to enhance people's confidence in the ever-prospering local Ba-Shu culture.Secondly, the article explains the ten major characteristics of the Ba-Shu culture by looking at the wonderful ecological landscape, the mystical culture and literature, and the magic spiritual aesthetics of the area in an international and modern context.It also studies the Ba-Shu cultural community and the origins, historical development, and main features of the city clusters within the Chengdu-Chongqing economic circle and analyzes the historical and practical values of building a cultural corridor connecting Chengdu and Chongqing. 展开更多
关键词 ba-shu cultural community Chengdu-Chongqing city cluster ShuirunTianfu(water nourishing Sichuan) agricultural-sericultural civilization Tianfu silk ancient Shu culture of immortality
下载PDF
面向汉字矢量图形特征的字向量表征方法 被引量:2
14
作者 唐善成 鲁彪 +2 位作者 张雪 张莹 梁少君 《科学技术与工程》 北大核心 2023年第16期6967-6973,共7页
为解决现有中文字向量表征方法中字形特征利用不充分的问题,利用矢量图形的尺度不变性,提出了一种面向汉字矢量图形特征的字向量(scalable vector graphics to vector,SVG2vec)表征方法。预处理阶段将汉字像素图像转化矢量图形,生成字... 为解决现有中文字向量表征方法中字形特征利用不充分的问题,利用矢量图形的尺度不变性,提出了一种面向汉字矢量图形特征的字向量(scalable vector graphics to vector,SVG2vec)表征方法。预处理阶段将汉字像素图像转化矢量图形,生成字形矢量坐标对序列;特征学习阶段采用双向循环神经网络(recurrent neural network,RNN)和自回归混合密度循环神经网络构建矢量图形变分自编码器模型,利用模型学习汉字字形结构特征;向量生成阶段输入字形矢量坐标对序列到编码器,编码器将字形特征映射到概率连续分布空间,得到SVG2vec字向量。与已有字向量在不同层级任务上进行对比实验。结果表明:SVG2vec向量在命名实体识别、中文分词和短文本相似度计算实验中,F1均值比Word2vec、GloVe等未利用字形特征的向量分别提高了1.27、0.4,1.67、0.12,3.28、2.03,比GnM2Vec、CWE等利用字形特征的向量分别提高了1.02、1.07,1.69、1.34,0.04、0.31,SVG2vec能更有效利用汉字字形特征。 展开更多
关键词 汉字字形 矢量图形 字向量 变分自编码器
下载PDF
开启虚拟现实体验时代 联络互动智能硬件战略发布全球首款虚拟现实视网膜眼镜Glyph
15
《石油工业计算机应用》 2015年第3期57-57,共1页
在6月30日下午,联络互动联合美国Avegant公司重磅发布了全球首款虚拟现实视网膜眼镜Glyph。此次发布的Glyph一改传统虚拟现实设备"重功能"而"轻体验"的弊病,将视网膜技术与时尚的外观设计结合,全面优化虚拟现实技术的用户体验,让虚... 在6月30日下午,联络互动联合美国Avegant公司重磅发布了全球首款虚拟现实视网膜眼镜Glyph。此次发布的Glyph一改传统虚拟现实设备"重功能"而"轻体验"的弊病,将视网膜技术与时尚的外观设计结合,全面优化虚拟现实技术的用户体验,让虚拟现实设备完成了从实现量产的1.0时代,向优化用户体验的2.0时代的革新。 展开更多
关键词 虚拟现实 glyph 首款 用户体验 生态链 外观设计 全球布局
下载PDF
西夏字的区别性特征在草书中的表现
16
作者 孙颖新 《北方民族大学学报(哲学社会科学版)》 CSSCI 北大核心 2023年第4期146-153,共8页
西夏文字中的一些构字部件笔画相同,仅借助个别笔画的长短对比及其与周边笔画的关系来区分意义。字符间唯一的最小差别被称为区别性特征。在西夏文的草书抄本中,单字和构字部件的笔画无论怎样变形或简省,区别性特征都必须保持。像“横... 西夏文字中的一些构字部件笔画相同,仅借助个别笔画的长短对比及其与周边笔画的关系来区分意义。字符间唯一的最小差别被称为区别性特征。在西夏文的草书抄本中,单字和构字部件的笔画无论怎样变形或简省,区别性特征都必须保持。像“横笔的长短”之类特征一旦作为区别性特征存在,抄写人在面对其他不需要这个特征构成唯一区别的所有单字中都会加以强调,甚至会在一定程度上放弃草书笔法,转而用楷书笔法以求字形清晰。 展开更多
关键词 西夏文 草书 构字部件 区别性特征
下载PDF
甲骨文“骨”“冎”辨释
17
作者 王晓鹏 《考古与文物》 CSSCI 北大核心 2023年第5期120-124,共5页
甲骨文■等字形通常隶释作“冎”字,与其密切相关的■等字形旧释“骨”(冎),或释“■”,现在许多学者则释作“肩”。依据■等字形在甲骨卜辞中的用法,以及古文字和传世典籍等材料,并从■等字形与相关文字的形、音、义关系来分析,释“肩... 甲骨文■等字形通常隶释作“冎”字,与其密切相关的■等字形旧释“骨”(冎),或释“■”,现在许多学者则释作“肩”。依据■等字形在甲骨卜辞中的用法,以及古文字和传世典籍等材料,并从■等字形与相关文字的形、音、义关系来分析,释“肩”依据不充分、不妥当,释“骨”更为合理。通过释论■等形及相关文字的释读问题,进而辨释“■”与“■”两种字形的形、音、义关系,我们认为甲骨文“■”与“■”已明显分化为两个字——“■”释读为“冎”,“■”等形则应释读为“骨”,也就是说“■”与“■”表示的是“冎”“骨”两个不同的词。 展开更多
关键词 甲骨文 辨释
下载PDF
多粒度融合的命名实体识别
18
作者 孙红 王哲 《中文信息学报》 CSCD 北大核心 2023年第3期123-134,共12页
目前主流的命名实体识别算法都是从词汇增强的角度出发,引入外部词汇信息提升NER模型获取词边界信息的能力,并未考虑到中文字结构信息在此任务中的重要作用。因此,该文提出多粒度融合的命名实体识别算法,同时引入中文字结构与外部词汇信... 目前主流的命名实体识别算法都是从词汇增强的角度出发,引入外部词汇信息提升NER模型获取词边界信息的能力,并未考虑到中文字结构信息在此任务中的重要作用。因此,该文提出多粒度融合的命名实体识别算法,同时引入中文字结构与外部词汇信息,通过编码汉字中每个字部件,并使用注意力机制使得文本序列中的字启发式地融合细粒度信息,赋予模型获取中文字形特征的能力。在多个命名实体识别数据集上的实验结果显示,该算法在模型精度以及推理速度方面具有较大优势。 展开更多
关键词 信息抽取 中文命名实体识别 注意力机制 词汇增强 中文字形特征
下载PDF
论书法字形与影视海报设计的美学视域融通
19
作者 张郑波 《新疆艺术学院学报》 2023年第3期44-53,共10页
将篆书、隶书、楷书、行草等中国传统书法字体与影视海报设计有机衔接,能够在增强影像主题叙事、剧情故事性和场景画面感的同时,营造出与包豪斯主义、立体构成、抽象表现等欧美风不同的新东方美学意象,构建起颇具中国格调、中国气派的... 将篆书、隶书、楷书、行草等中国传统书法字体与影视海报设计有机衔接,能够在增强影像主题叙事、剧情故事性和场景画面感的同时,营造出与包豪斯主义、立体构成、抽象表现等欧美风不同的新东方美学意象,构建起颇具中国格调、中国气派的艺术新形态,让“国潮”文化在世界设计史、影视史上呈现新时代独具民族特色的中国风尚。 展开更多
关键词 书法字形 影视海报 设计美学 中国风 东方时尚
下载PDF
繁体字字形规范的基本理念与当代实践
20
作者 王立军 《语言文字应用》 CSSCI 北大核心 2023年第1期10-18,共9页
《古籍印刷通用字规范字形表》的发布实施,是我国汉字规范工作的又一次重要实践,填补了繁体字字形规范方面的空白,体现了研制者对繁体字字形规范问题的当代思考。繁体字在当今社会文化生活中仍具有重要的应用价值,但在实际应用中存在着... 《古籍印刷通用字规范字形表》的发布实施,是我国汉字规范工作的又一次重要实践,填补了繁体字字形规范方面的空白,体现了研制者对繁体字字形规范问题的当代思考。繁体字在当今社会文化生活中仍具有重要的应用价值,但在实际应用中存在着较多问题,必须加以整理规范。对繁体字进行规范,必须既尊重古籍用字的事实,又立足当代的视角,坚持“优选”的原则,秉持古今沟通及内地与港澳台地区沟通的理念,在科学性和适用性之间寻求最佳的契合点。 展开更多
关键词 繁体字 古籍印刷通用字 汉字规范 《古籍印刷通用字规范字形表》
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部