期刊文献+
共找到1,218篇文章
< 1 2 61 >
每页显示 20 50 100
基于ER Rule的多分类器汽车评论情感分类研究
1
作者 周谧 周雅婧 +1 位作者 贺洋 方必和 《运筹与管理》 CSCD 北大核心 2024年第5期161-168,共8页
该文针对汽车评论语料的情感二分类问题,提出一种基于证据推理规则的多分类器融合的情感分类方法。在情感特征构建方面,通过实验对比不同特征模型对分类结果的影响,并改进传统的TFIDF权重计算方法。同时,在此基础上使用ER Rule融合不同... 该文针对汽车评论语料的情感二分类问题,提出一种基于证据推理规则的多分类器融合的情感分类方法。在情感特征构建方面,通过实验对比不同特征模型对分类结果的影响,并改进传统的TFIDF权重计算方法。同时,在此基础上使用ER Rule融合不同分类器进行文本情感极性分析,并考虑各分类器的权重和可靠度。最后,爬取汽车网站上的评论数据对上述方法进行测试,并用公开的中文酒店评论语料数据进行了验证,结果表明该方法能够有效集成不同分类器的优点,与传统机器学习分类算法相比,其结果在Recall,F1值和Accuracy三个指标上得到了提高,与目前流行的深度学习算法和集成学习算法相比,其结果总体占优。 展开更多
关键词 证据推理规则 多分类器融合 TFIDF权重 深度学习算法 集成学习算法
下载PDF
基于注意力机制的海关报表识别方法研究
2
作者 万燕 李毅凡 姚砺 《智能计算机与应用》 2024年第4期26-33,共8页
海关报表作为进出口业务中的重要材料,需要快速识别文本并录入系统,提高业务效率。海关报表图像通常存在字迹模糊粘连、字号过小和噪声污染等问题,增加了报表文本识别的难度。本文针对海关报表图片识别准确率低的问题,提出了基于注意力... 海关报表作为进出口业务中的重要材料,需要快速识别文本并录入系统,提高业务效率。海关报表图像通常存在字迹模糊粘连、字号过小和噪声污染等问题,增加了报表文本识别的难度。本文针对海关报表图片识别准确率低的问题,提出了基于注意力机制的海关报表识别方法。在DBNet模型中引入了注意力机制,提升小字符文本检测能力,使网络更加关注字符相关区域;在视觉模型中引入可变形卷积模块,扩大感受野,并将视觉特征和语义特征增强后通过门控机制实现多模态融合,提升对低质量字符的识别精度。实验结果表明,本文方法在海关报表低质量图像的检测和识别准确率方面领先其他方法。 展开更多
关键词 海关报表识别 注意力机制 文本识别
下载PDF
基于话题决策模型的英文文本切题度计算方法研究
3
作者 胡婷 《自动化技术与应用》 2024年第4期60-62,98,共4页
为了对英文作文考试中英文文本的切题度加以判断,提出一套基于话题决策模型的英文文本切题度计算方法。介绍该算法的数据处理流程与话题决策模型的数据处理方法,最后通过WIKI_727K数据集对话题决策模型进行训练与测试,经实验研究发现,... 为了对英文作文考试中英文文本的切题度加以判断,提出一套基于话题决策模型的英文文本切题度计算方法。介绍该算法的数据处理流程与话题决策模型的数据处理方法,最后通过WIKI_727K数据集对话题决策模型进行训练与测试,经实验研究发现,所提出的话题决策模型在精确率、召回率等方面具有一定的应用优势,并在ASAP数据集上表现出较为理想的切题度判断效果。 展开更多
关键词 英文文本 切题度 话题决策模型
下载PDF
基于改进TextSnake的印章字符检测算法
4
作者 甘辉鑫 巩荣芬 +1 位作者 储茂祥 杨永辉 《辽宁科技大学学报》 CAS 2024年第3期213-220,共8页
针对字符模糊、宽高比多变、与背景文字重叠等因素导致的印章字符易被漏检、误检等问题,提出基于TextSnake的印章字符检测算法,记作TextSnake-CR算法。首先在特征融合中嵌入手工设计的感受野增强模块,使浅层特征拥有更大感受视野,从而... 针对字符模糊、宽高比多变、与背景文字重叠等因素导致的印章字符易被漏检、误检等问题,提出基于TextSnake的印章字符检测算法,记作TextSnake-CR算法。首先在特征融合中嵌入手工设计的感受野增强模块,使浅层特征拥有更大感受视野,从而有效地降低误检率;其次提出颜色特征提取模块,用于提取印章字符中颜色特征,增强模糊印章字符的检测精度;最后改进模型的分类损失函数,抑制背景噪声对模型的干扰,进一步提高模型检测性能。实验结果表明,TextSnake-CR在公开印章数据集与自制数据集上的F值分别达到90.71%和81.79%,与其他算法相比,有效地提高了印章字符检测准确率。 展开更多
关键词 印章字符检测 TextSnake 颜色特征提取 感受野增强 分类损失函数
下载PDF
PosiGPT:基于预训练的中文积极情感评论模型
5
作者 卢晨耀 李敏波 《计算机应用与软件》 北大核心 2024年第9期33-40,共8页
近年来,越来越多的人因为工作和生活的压力处于抑郁状态,许多人没有得到足够的鼓励和正确的指导。基于这个背景,提出中文评论模型PosiGPT。基于生成式预训练模型,使用中文微博数据进行训练,可以检测抑郁状态的博文,并产生积极回复。除... 近年来,越来越多的人因为工作和生活的压力处于抑郁状态,许多人没有得到足够的鼓励和正确的指导。基于这个背景,提出中文评论模型PosiGPT。基于生成式预训练模型,使用中文微博数据进行训练,可以检测抑郁状态的博文,并产生积极回复。除了该模型外,还发布了PosiChat数据集,其包含源自新浪微博的抑郁文本及其积极评论。在PosiChat数据集上进行评估,结果表明模型生成的文本具有较强的流畅性和合理性,且在情感倾向上属于积极情感状态,初步达到了抑郁检测及积极回复的功能。 展开更多
关键词 文本生成 抑郁检测 积极情感评论 预训练
下载PDF
基于长短期记忆网络的英语标题自动生成
6
作者 千颖利 《自动化技术与应用》 2024年第4期71-73,共3页
为实现英文文本标题的自动化生成,研究一套基于长短期记忆网络的句子级LSTM编码策略,并在标题生成模型中引入注意力机制来获取英文文本的上下文向量,保留文本中的重要信息。在此基础上,通过负对数似然函数来对模型加以训练。最后通过Byt... 为实现英文文本标题的自动化生成,研究一套基于长短期记忆网络的句子级LSTM编码策略,并在标题生成模型中引入注意力机制来获取英文文本的上下文向量,保留文本中的重要信息。在此基础上,通过负对数似然函数来对模型加以训练。最后通过Byte Cup 2018数据集对本文提出的英语标题自动生成算法进行实验,并通过过ROUGE-N指标对标题生成质量加以评价。实验研究发现,所提出的句子级LSTM编码方案在英文文本标题生成准确性方面相比于其他常规摘要生成模型来说具有显著优势。 展开更多
关键词 长短期记忆网络 英语文本 标题自动生成 句子级LSTM编码
下载PDF
基于多尺度混合域注意力机制的笔迹鉴别方法
7
作者 熊武 曹从军 +2 位作者 宋雪芳 邵云龙 王旭升 《计算机应用》 CSCD 北大核心 2024年第7期2225-2232,共8页
针对笔迹鉴别任务中图像大面积是背景、笔迹信息稀疏、关键性信息难以捕捉,并且个人笔迹签名风格具有微小变化而刻意模仿的笔迹高度相似,以及公开的中文笔迹数据集的匮乏的问题,通过对注意力机制和孪生网络模型进行改进,提出一种基于多... 针对笔迹鉴别任务中图像大面积是背景、笔迹信息稀疏、关键性信息难以捕捉,并且个人笔迹签名风格具有微小变化而刻意模仿的笔迹高度相似,以及公开的中文笔迹数据集的匮乏的问题,通过对注意力机制和孪生网络模型进行改进,提出一种基于多尺度混合域注意力机制的笔迹鉴别方法(MMDANet)。首先,在有效通道注意力模块上并联一个最大池化层,并将二维条带池化模块的通道数扩展到三维,将改进的有效通道注意力模块和条带池化模块融合生成混合域模块(MDM),解决了笔迹图像大面积是背景、笔迹信息稀疏、细节特征难以提取的问题;其次,利用PANet特征金字塔进行多尺度提取特征,捕获真伪笔迹间的细微差异,采用孪生网络的对比损失与AM-Softmax损失加权融合进行训练,增加类别间的区分度,解决个人笔迹风格变化和真伪笔迹高度相似的问题;最后自制了总体样本数为8000的中文笔迹数据集(CHD)。所提方法在自制中文数据集CHD上的准确率达到了84.25%,且相较于次优的Two-stage SiamNet方法,所提方法在3个外文数据集Cedar、Bengla和Hindi上准确率分别提升了4.53%、1.02%和1.67%。实验结果表明,MMDANet可以更准确地捕获真伪笔迹的细微差异,完成复杂的笔迹鉴别任务。 展开更多
关键词 笔迹鉴别 孪生网络 注意力机制 多尺度 混合域
下载PDF
改进CRNN网络的直播弹幕文本识别
8
作者 张荣泽 王修晖 《计算机工程与应用》 CSCD 北大核心 2024年第15期143-149,共7页
在直播带货场景中,通过分析消费者发送的弹幕信息,能够在一定程度上反映出当前商品的实际评价是否与主播的描述一致,对直播行业中假冒伪劣产品的监管具有重要指导意义。针对弹幕文本识别的特殊性,提出了一种基于改进CRNN(convolutional ... 在直播带货场景中,通过分析消费者发送的弹幕信息,能够在一定程度上反映出当前商品的实际评价是否与主播的描述一致,对直播行业中假冒伪劣产品的监管具有重要指导意义。针对弹幕文本识别的特殊性,提出了一种基于改进CRNN(convolutional recurrent neural network)的实时弹幕识别网络,以解决CRNN算法对于复杂背景环境下的文本特征信息提取不全等问题。为此所设计的网络采用了编解码结构对特征提取模块进行强化设计,以解决弹幕像素区域小造成的特征提取过程中的特征丢失问题。使用Transformer模型对输入的帧画面构建长距离全局特征关系,以强化网络模型对弹幕信息的捕捉能力,并对提取的特征信息进行序列建模及转录得到具体的弹幕语义信息。实验结果表明,所设计的网络在测试集上检测精度高达0.926,平均精度值提高了0.101。 展开更多
关键词 文本识别 深度学习 循环卷积网络 Transformer模型
下载PDF
基于规则+词典+条件随机场的中医医案实体识别研究
9
作者 谭世雨 杜志慧 余江维 《中医药导报》 2024年第6期216-220,共5页
目的:针对中医医案中实体具有边界不清晰、类别易混淆等难点,提出了基于规则、词典、条件随机场相结合的实体识别模型。方法:构建中医术语词典,分析医案文本规则,构建特征函数,使用jieba工具对中医医案进行分词,人工标注医案中的5类实... 目的:针对中医医案中实体具有边界不清晰、类别易混淆等难点,提出了基于规则、词典、条件随机场相结合的实体识别模型。方法:构建中医术语词典,分析医案文本规则,构建特征函数,使用jieba工具对中医医案进行分词,人工标注医案中的5类实体作为训练集和验证集,实现基于条件随机场的医案实体识别研究;最后采用准确率、召回率、F1值对模型进行评价,以探究词典、不同实体类别、文本特征对实体识别结果的影响。结果:模型F1值达到了83.5%,实现了较好的识别效果;词典的加入对实体识别有着显著的促进作用;上下文特征对于模型识别效果影响最大;不同类别的实体识别结果差异较大,其中“方药”的识别效果最好,其次是“治法”和“体征”,“证型”与“症状”的识别效果最差。结论:本研究提供了一个有效的实体识别模型,这种方法能够极大地提高中医医案实体识别的准确度,也为未来的研究提供了有价值的参考。 展开更多
关键词 中医医案 命名实体识别 中医术语词典 条件随机场 特征函数 中医药智能化
下载PDF
基于改进Swin-Transformer的柑橘病叶分类模型
10
作者 方俊泽 郭正 +2 位作者 李歌 邢素霞 王瑜 《中国农机化学报》 北大核心 2024年第1期252-258,共7页
针对柑橘病害人工检测效率低、成本高、准确度低等问题,结合人工智能技术对柑橘病叶进行分类识别。首先,建立模拟复杂环境下的柑橘病叶数据集。其次,提出一种改进的Swin-Trasnformer柑橘病叶分类模型,包含局部感知通道增强注意力模块(LP... 针对柑橘病害人工检测效率低、成本高、准确度低等问题,结合人工智能技术对柑橘病叶进行分类识别。首先,建立模拟复杂环境下的柑橘病叶数据集。其次,提出一种改进的Swin-Trasnformer柑橘病叶分类模型,包含局部感知通道增强注意力模块(LPCE),以提升模型的感受野和特征表达能力,通过通道之间的相关性进行加权,使模型更容易提取关键特征。试验证明本文模型的分类识别准确率达到98.52%,精确率、召回率和F 1-score分别达到98.17%、98.24%、98.28%,均超过基线模型。该模型为柑橘病害的检测提供技术支撑。 展开更多
关键词 柑橘病叶 深度学习 分类识别 Swin-Transformer 注意力模块
下载PDF
基于图像特征的汉字字形相似度计算
11
作者 王昭 杨婧 杨敏 《山西电子技术》 2024年第2期61-63,共3页
汉字作为一种数量众多,结构复杂的象形文字,其字形的相似度计算对汉语的错别字识别和纠正具有重要意义。将汉字视为图形,通过尺度不变特征变换算法提取汉字的特征点,并利用汉字间特征点的对应关系,提出了一种基于特征点的相似度计算方... 汉字作为一种数量众多,结构复杂的象形文字,其字形的相似度计算对汉语的错别字识别和纠正具有重要意义。将汉字视为图形,通过尺度不变特征变换算法提取汉字的特征点,并利用汉字间特征点的对应关系,提出了一种基于特征点的相似度计算方法。对《通用规范汉字表》的8105个汉字进行了相似度分析,结果表明,该方法和人的认知结果比较一致。 展开更多
关键词 汉字字形 形似字 相似度计算 尺度不变特征变换
下载PDF
多域字符距离感知的场景文本图像超分辨率重建
12
作者 黄俊炀 陈宏辉 +2 位作者 王嘉宝 陈平平 林志坚 《电子学报》 EI CAS CSCD 北大核心 2024年第7期2262-2270,共9页
场景文本图像超分辨率(Scene Text Image Super-Resolution, STISR)旨在提高文本在低分辨率图像中的分辨率和可读性.但是在空间变形或低分辨率的文本图像中,由于缺乏文本区域细节,语义线索和视觉特征信息难以与字符位置匹配对齐,文本识... 场景文本图像超分辨率(Scene Text Image Super-Resolution, STISR)旨在提高文本在低分辨率图像中的分辨率和可读性.但是在空间变形或低分辨率的文本图像中,由于缺乏文本区域细节,语义线索和视觉特征信息难以与字符位置匹配对齐,文本识别效果不佳.针对该问题,本文提出多域字符距离感知的场景文本图像超高分辨率重建方法(Perceiving Multi-Domain Character distance super-resolution, PMDC),强化视觉语义特征,提高文本区域和纹理信息.首先,采用非对称卷积以及语义先验信息模块,提取文本图像的视觉和语义特征信息;其次,融合字符距离感知模块中的视觉和语义特征,得到增强位置编码感知字符间的间距变化和语义相似性;最后,结合引导线索和视觉特征对像素进行重组得到超分辨率文本图像.在公开数据集TextZoom上的实验结果,与最近TATT文本超分网络性能相比,在峰值信噪比指标上提高0.11 dB,有效提高文本清晰度和边缘纹理细节,同时提升1.5%的平均识别准确率,改进文本图像的可读性. 展开更多
关键词 计算机视觉 场景文本图像 超分辨率 注意力机制 特征信息关联
下载PDF
基于ASHE和SWT的低对比度自然场景图像文字定位
13
作者 徐武 杨昊东 +1 位作者 陈盈君 汤弘毅 《计算机应用与软件》 北大核心 2023年第3期229-234,共6页
为解决在自然场景下光照不均匀使得图像对比度低,导致图像文字定位错检的问题,采用自适应子直方图均衡算法(Adaptive Sub-Histogram Equalization,ASHE)对图像进行对比度增强处理;采用最大稳定极值区域算法提取候选区域,结合形态学与启... 为解决在自然场景下光照不均匀使得图像对比度低,导致图像文字定位错检的问题,采用自适应子直方图均衡算法(Adaptive Sub-Histogram Equalization,ASHE)对图像进行对比度增强处理;采用最大稳定极值区域算法提取候选区域,结合形态学与启发式规则进行初步定位;通过改进的笔画宽度变换算法(SWT)与汉字特征进行精确定位;使用字符链融合算法,将文字区域合并,实现最终文本定位。实验结果表明改进算法对自然场景低对比度图像中文字具有较高的定位准确率,并且有效地降低了时间复杂度。 展开更多
关键词 对比度 文字定位 自适应子直方图均衡算法 笔画宽度变换
下载PDF
基于像素分配的文本检测方法研究
14
作者 吉训生 喻智 徐晓祥 《计算机测量与控制》 2023年第7期21-27,共7页
针对现有方法在场景文本检测上的不足,提出一种基于像素分配方的场景文本检测方法,并采用了交叉注意力模块和多尺度特征自适应模块来分别在空间和和通道上优化特征提取;为了丰富不同尺度的特征表示,采用多尺度特征自适应模块进行自动分... 针对现有方法在场景文本检测上的不足,提出一种基于像素分配方的场景文本检测方法,并采用了交叉注意力模块和多尺度特征自适应模块来分别在空间和和通道上优化特征提取;为了丰富不同尺度的特征表示,采用多尺度特征自适应模块进行自动分配不同尺度特征的权重;为了有效获取上下文信息,将特征网络提取到的特征送入交叉注意力模块;对每个像素,在其所在的水平路径和垂直路径上收集上下文信息;再通过循环操作,每一个像素便可以在全图范围内获取上下文信息;通过全卷积网络方法,使用多任务学习框架学习文本实例的几何特征,结合多任务学习的结果完成像素到文本框的分配,经过简单处理后重建文本实例的多边形边界框;在任意形状公开数据集Total-text上进行测试,文章方法的召回率、精确率、F值分别为75.71%、89.15%、81.89%,在多方向公开数据集ICDAR2015上也表现良好,经实验得召回率、精确率、F值分别为79.06%、89.24%、83.84%,证明了文章方法的有效性。 展开更多
关键词 图像处理 文本检测 交叉注意力 像素分配
下载PDF
基于多重启发式规则的英文特征值提取算法研究
15
作者 郑海燕 《自动化技术与应用》 2023年第11期95-97,共3页
提出一种基于多重启发式规则的英文特征值提取算法。该算法从概率论和英语语义两个层面引入了词频启发式规则、集中度启发式规则、同义启发式规则、同源启发式规则等特征值提取手段,阐述各种启发规则下的数据处理方法以及特征值提取算... 提出一种基于多重启发式规则的英文特征值提取算法。该算法从概率论和英语语义两个层面引入了词频启发式规则、集中度启发式规则、同义启发式规则、同源启发式规则等特征值提取手段,阐述各种启发规则下的数据处理方法以及特征值提取算法具体流程,并将所提出的基于多重启发式规则的英文特征值提取算法与基于词频的常规算法进行对比,取得了较为理想的特征值提取效果。 展开更多
关键词 英文文本 特征值提取 概率启发 语义启发
下载PDF
基于双输入和BiLSTM-MHSA的评论文本方面情感分类方法
16
作者 王柳迪 马伟锋 +2 位作者 孙晓勇 王雨晨 毛思佳 《浙江科技学院学报》 CAS 2023年第5期412-420,共9页
【目的】针对方面情感分类输入类别在不同领域之间差异较大,汽车用户评论文本语义信息不全,语义特征难以提取等问题,提出基于双通道输入的并行双向编码表征(bidirectional encoder representation from transformers,BERT)双向长短期记... 【目的】针对方面情感分类输入类别在不同领域之间差异较大,汽车用户评论文本语义信息不全,语义特征难以提取等问题,提出基于双通道输入的并行双向编码表征(bidirectional encoder representation from transformers,BERT)双向长短期记忆多头自注意力模型的方面情感分类方法。【方法】首先采用了方面情感和方面抽取的双重标签进行标注;其次通过并行的方面抽取和方面情感分类任务通道,分别使用BERT、双向长短期记忆网络(bidirectional long and short-term memory networks,Bi-LSTM)及多头注意力机制(multihead self-attention,MHSA)提取更深层次的语义信息及近距离和远距离特征信息;最后采用条件随机场(conditional random field,CRF)分类器和Softmax分类器进行分类。【结果】在相关的汽车用户评论文本数据集和多语言混合数据集上,本研究提出的模型相较于主流的方面情感分类方法,具有同步抽取方面词和判断情感极性的能力,且有效提高了方面词抽取和方面情感分类的准确率和F_(1)值。【结论】本研究提出的模型更有利于汽车销售者分析用户评论,同时对识别用户评论文本的情感极性的研究也有一定的参考价值。 展开更多
关键词 方面词抽取 方面情感分类 多任务学习 用户评论
下载PDF
基于局部信息的手写汉字笔画提取 被引量:1
17
作者 范勇峰 李成城 +1 位作者 林民 郭振东 《内蒙古师范大学学报(自然科学汉文版)》 CAS 2023年第2期181-188,共8页
现有计算机在指导手写汉字练习与测试中,指导依据大都基于全局特征,缺少基于更细粒度特征。提出一种基于局部信息的手写汉字笔画提取方法,为手写汉字评价与指导等任务提供数据支持。首先提取出汉字骨架并对骨架中的毛刺与断裂等问题进... 现有计算机在指导手写汉字练习与测试中,指导依据大都基于全局特征,缺少基于更细粒度特征。提出一种基于局部信息的手写汉字笔画提取方法,为手写汉字评价与指导等任务提供数据支持。首先提取出汉字骨架并对骨架中的毛刺与断裂等问题进行优化;然后使用PBOD算法提取汉字交叉区域后,对交叉区域进行合并删除,消除笔画形变,通过局部信息计算笔画段的组合系数,根据组合系数提取笔画;最后根据获取到的笔画数与算法迭代次数,动态调整组合系数阈值,保证在正确连接笔画段的前提下提取到更可能多的笔画。将该方法在手写汉字数据集上进行实验,其准确率、召回率与F1值分别达到了95.91%、95.71%与95.81%,可用于后续的手写汉字评判与指导等任务。 展开更多
关键词 手写汉字练习 骨架提取与优化 PBOD算法 交叉区域合并 局部信息 笔画提取
下载PDF
基于结构知识的手写体汉字部件提取算法 被引量:1
18
作者 李泽瑶 李成城 《计算机工程与设计》 北大核心 2023年第5期1479-1486,共8页
针对手写体汉字结构复杂、部件粘连等问题,提出一种基于结构知识的手写体汉字部件提取方法。依据汉字结构特征,结合投影法制定连通区域合并规则,实现汉字部件初步提取。在此基础上,针对部件间存在粘连等书写不规范问题,对传统滴水算法... 针对手写体汉字结构复杂、部件粘连等问题,提出一种基于结构知识的手写体汉字部件提取方法。依据汉字结构特征,结合投影法制定连通区域合并规则,实现汉字部件初步提取。在此基础上,针对部件间存在粘连等书写不规范问题,对传统滴水算法进行改进,实现粘连部件分割。经实验验证,该方法较传统滴水算法在粘连部件切分方面的效果有明显提升,可实现对多种结构汉字的部件提取,具有较高的实用价值。 展开更多
关键词 手写体汉字 汉字结构 投影法 连通区域合并 粘连部件 滴水算法改进 汉字部件提取
下载PDF
基于神经网络的纸笔手写规范汉字量化评价研究
19
作者 王敏 马万 +3 位作者 祝闯 史善飞 舒江波 卢帅成 《华中师范大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第6期813-820,共8页
汉字书写教育是我国素质教育的重要内容之一.当前,我国中小学生规范汉字书写教育存在两大问题:1)缺乏有效指导,规范汉字书写要领以定性描述为主,细节要点的量化特征没有体现,学生无法准确把握书写细节;2)缺乏有效的评价,大部分教师或家... 汉字书写教育是我国素质教育的重要内容之一.当前,我国中小学生规范汉字书写教育存在两大问题:1)缺乏有效指导,规范汉字书写要领以定性描述为主,细节要点的量化特征没有体现,学生无法准确把握书写细节;2)缺乏有效的评价,大部分教师或家长对学生的书写只能给出整体的定性评价,无法给出精准的细节评价.针对上述问题,该文开展日常自然书写场景下纸笔手写规范汉字的量化评价研究,主要包括三个方面的工作:1)利用手写汉字的骨架图像和预评价结果构建基于卷积神经网络的分类评价模型,实现对手写汉字书写规范性的自动分类评价;2)基于手写汉字笔段属性数据实现对书写细节的量化评价,并给出书写调整的建议;3)利用手写汉字各项书写规则的书写规范性评分,构建基于多元线性回归的书写评分模型,实现对手写汉字整字书写质量的评价. 展开更多
关键词 规范汉字 书写规则 量化评价
下载PDF
基于ERNIE与多特征融合的中文命名实体识别
20
作者 陈克金 叶善力 《浙江科技学院学报》 CAS 2023年第5期421-429,456,共10页
【目的】在中文命名实体识别中,传统命名实体识别方法中词向量只能将其映射为单一向量,无法表征一词多义,在特征提取过程中易忽略局部特征。针对以上问题,提出一种基于知识增强语义表示(enhanced reprsentation through knowledge integ... 【目的】在中文命名实体识别中,传统命名实体识别方法中词向量只能将其映射为单一向量,无法表征一词多义,在特征提取过程中易忽略局部特征。针对以上问题,提出一种基于知识增强语义表示(enhanced reprsentation through knowledge integration,ERNIE)与多特征融合的实体识别方法。【方法】首先,通过预训练模型ERNIE获得词向量;然后将词向量并行输入双向长短时记忆网络(bidirectional long short-term memory network,BiLSTM)与膨胀卷积神经网络(iterated dilated convolutional neural network,IDCNN)中提取特征,再将输出特征向量进行融合;最后通过条件随机场(conditional random field,CRF)解码获取最佳序列。【结果】本研究所提出的模型优于其他传统模型,在微软亚洲研究院(Microsoft Research Asia,MSRA)数据集上的F_(1)值达到了95.18%,相比基准模型BiLSTM-CRF F_(1)值提高了8.86百分点,相比ERNIE-BiLSTM-CRF模型F_(1)值提高了1.34百分点。此外,在ERNIE-BiLSTM-IDCNN-CRF中引入注意力机制后F_(1)值仅提升了0.07百分点,可见引入注意力机制对本研究所提出的模型之识别效果提升有限。【结论】本研究所提出的模型有效地提升了中文数据集上的实体识别性能,可为自然语言处理的命名实体识别研究提供参考。 展开更多
关键词 命名实体识别 ERNIE 双向长短期记忆网络 膨胀卷积神经网络 注意力机制
下载PDF
上一页 1 2 61 下一页 到第
使用帮助 返回顶部