期刊文献+
共找到1,210篇文章
< 1 2 61 >
每页显示 20 50 100
基于话题决策模型的英文文本切题度计算方法研究
1
作者 胡婷 《自动化技术与应用》 2024年第4期60-62,98,共4页
为了对英文作文考试中英文文本的切题度加以判断,提出一套基于话题决策模型的英文文本切题度计算方法。介绍该算法的数据处理流程与话题决策模型的数据处理方法,最后通过WIKI_727K数据集对话题决策模型进行训练与测试,经实验研究发现,... 为了对英文作文考试中英文文本的切题度加以判断,提出一套基于话题决策模型的英文文本切题度计算方法。介绍该算法的数据处理流程与话题决策模型的数据处理方法,最后通过WIKI_727K数据集对话题决策模型进行训练与测试,经实验研究发现,所提出的话题决策模型在精确率、召回率等方面具有一定的应用优势,并在ASAP数据集上表现出较为理想的切题度判断效果。 展开更多
关键词 英文文本 切题度 话题决策模型
下载PDF
基于长短期记忆网络的英语标题自动生成
2
作者 千颖利 《自动化技术与应用》 2024年第4期71-73,共3页
为实现英文文本标题的自动化生成,研究一套基于长短期记忆网络的句子级LSTM编码策略,并在标题生成模型中引入注意力机制来获取英文文本的上下文向量,保留文本中的重要信息。在此基础上,通过负对数似然函数来对模型加以训练。最后通过Byt... 为实现英文文本标题的自动化生成,研究一套基于长短期记忆网络的句子级LSTM编码策略,并在标题生成模型中引入注意力机制来获取英文文本的上下文向量,保留文本中的重要信息。在此基础上,通过负对数似然函数来对模型加以训练。最后通过Byte Cup 2018数据集对本文提出的英语标题自动生成算法进行实验,并通过过ROUGE-N指标对标题生成质量加以评价。实验研究发现,所提出的句子级LSTM编码方案在英文文本标题生成准确性方面相比于其他常规摘要生成模型来说具有显著优势。 展开更多
关键词 长短期记忆网络 英语文本 标题自动生成 句子级LSTM编码
下载PDF
基于改进Swin-Transformer的柑橘病叶分类模型
3
作者 方俊泽 郭正 +2 位作者 李歌 邢素霞 王瑜 《中国农机化学报》 北大核心 2024年第1期252-258,共7页
针对柑橘病害人工检测效率低、成本高、准确度低等问题,结合人工智能技术对柑橘病叶进行分类识别。首先,建立模拟复杂环境下的柑橘病叶数据集。其次,提出一种改进的Swin-Trasnformer柑橘病叶分类模型,包含局部感知通道增强注意力模块(LP... 针对柑橘病害人工检测效率低、成本高、准确度低等问题,结合人工智能技术对柑橘病叶进行分类识别。首先,建立模拟复杂环境下的柑橘病叶数据集。其次,提出一种改进的Swin-Trasnformer柑橘病叶分类模型,包含局部感知通道增强注意力模块(LPCE),以提升模型的感受野和特征表达能力,通过通道之间的相关性进行加权,使模型更容易提取关键特征。试验证明本文模型的分类识别准确率达到98.52%,精确率、召回率和F 1-score分别达到98.17%、98.24%、98.28%,均超过基线模型。该模型为柑橘病害的检测提供技术支撑。 展开更多
关键词 柑橘病叶 深度学习 分类识别 Swin-Transformer 注意力模块
下载PDF
基于图像特征的汉字字形相似度计算
4
作者 王昭 杨婧 杨敏 《山西电子技术》 2024年第2期61-63,共3页
汉字作为一种数量众多,结构复杂的象形文字,其字形的相似度计算对汉语的错别字识别和纠正具有重要意义。将汉字视为图形,通过尺度不变特征变换算法提取汉字的特征点,并利用汉字间特征点的对应关系,提出了一种基于特征点的相似度计算方... 汉字作为一种数量众多,结构复杂的象形文字,其字形的相似度计算对汉语的错别字识别和纠正具有重要意义。将汉字视为图形,通过尺度不变特征变换算法提取汉字的特征点,并利用汉字间特征点的对应关系,提出了一种基于特征点的相似度计算方法。对《通用规范汉字表》的8105个汉字进行了相似度分析,结果表明,该方法和人的认知结果比较一致。 展开更多
关键词 汉字字形 形似字 相似度计算 尺度不变特征变换
下载PDF
基于ASHE和SWT的低对比度自然场景图像文字定位
5
作者 徐武 杨昊东 +1 位作者 陈盈君 汤弘毅 《计算机应用与软件》 北大核心 2023年第3期229-234,共6页
为解决在自然场景下光照不均匀使得图像对比度低,导致图像文字定位错检的问题,采用自适应子直方图均衡算法(Adaptive Sub-Histogram Equalization,ASHE)对图像进行对比度增强处理;采用最大稳定极值区域算法提取候选区域,结合形态学与启... 为解决在自然场景下光照不均匀使得图像对比度低,导致图像文字定位错检的问题,采用自适应子直方图均衡算法(Adaptive Sub-Histogram Equalization,ASHE)对图像进行对比度增强处理;采用最大稳定极值区域算法提取候选区域,结合形态学与启发式规则进行初步定位;通过改进的笔画宽度变换算法(SWT)与汉字特征进行精确定位;使用字符链融合算法,将文字区域合并,实现最终文本定位。实验结果表明改进算法对自然场景低对比度图像中文字具有较高的定位准确率,并且有效地降低了时间复杂度。 展开更多
关键词 对比度 文字定位 自适应子直方图均衡算法 笔画宽度变换
下载PDF
基于像素分配的文本检测方法研究
6
作者 吉训生 喻智 徐晓祥 《计算机测量与控制》 2023年第7期21-27,共7页
针对现有方法在场景文本检测上的不足,提出一种基于像素分配方的场景文本检测方法,并采用了交叉注意力模块和多尺度特征自适应模块来分别在空间和和通道上优化特征提取;为了丰富不同尺度的特征表示,采用多尺度特征自适应模块进行自动分... 针对现有方法在场景文本检测上的不足,提出一种基于像素分配方的场景文本检测方法,并采用了交叉注意力模块和多尺度特征自适应模块来分别在空间和和通道上优化特征提取;为了丰富不同尺度的特征表示,采用多尺度特征自适应模块进行自动分配不同尺度特征的权重;为了有效获取上下文信息,将特征网络提取到的特征送入交叉注意力模块;对每个像素,在其所在的水平路径和垂直路径上收集上下文信息;再通过循环操作,每一个像素便可以在全图范围内获取上下文信息;通过全卷积网络方法,使用多任务学习框架学习文本实例的几何特征,结合多任务学习的结果完成像素到文本框的分配,经过简单处理后重建文本实例的多边形边界框;在任意形状公开数据集Total-text上进行测试,文章方法的召回率、精确率、F值分别为75.71%、89.15%、81.89%,在多方向公开数据集ICDAR2015上也表现良好,经实验得召回率、精确率、F值分别为79.06%、89.24%、83.84%,证明了文章方法的有效性。 展开更多
关键词 图像处理 文本检测 交叉注意力 像素分配
下载PDF
基于多重启发式规则的英文特征值提取算法研究
7
作者 郑海燕 《自动化技术与应用》 2023年第11期95-97,共3页
提出一种基于多重启发式规则的英文特征值提取算法。该算法从概率论和英语语义两个层面引入了词频启发式规则、集中度启发式规则、同义启发式规则、同源启发式规则等特征值提取手段,阐述各种启发规则下的数据处理方法以及特征值提取算... 提出一种基于多重启发式规则的英文特征值提取算法。该算法从概率论和英语语义两个层面引入了词频启发式规则、集中度启发式规则、同义启发式规则、同源启发式规则等特征值提取手段,阐述各种启发规则下的数据处理方法以及特征值提取算法具体流程,并将所提出的基于多重启发式规则的英文特征值提取算法与基于词频的常规算法进行对比,取得了较为理想的特征值提取效果。 展开更多
关键词 英文文本 特征值提取 概率启发 语义启发
下载PDF
基于双输入和BiLSTM-MHSA的评论文本方面情感分类方法
8
作者 王柳迪 马伟锋 +2 位作者 孙晓勇 王雨晨 毛思佳 《浙江科技学院学报》 CAS 2023年第5期412-420,共9页
【目的】针对方面情感分类输入类别在不同领域之间差异较大,汽车用户评论文本语义信息不全,语义特征难以提取等问题,提出基于双通道输入的并行双向编码表征(bidirectional encoder representation from transformers,BERT)双向长短期记... 【目的】针对方面情感分类输入类别在不同领域之间差异较大,汽车用户评论文本语义信息不全,语义特征难以提取等问题,提出基于双通道输入的并行双向编码表征(bidirectional encoder representation from transformers,BERT)双向长短期记忆多头自注意力模型的方面情感分类方法。【方法】首先采用了方面情感和方面抽取的双重标签进行标注;其次通过并行的方面抽取和方面情感分类任务通道,分别使用BERT、双向长短期记忆网络(bidirectional long and short-term memory networks,Bi-LSTM)及多头注意力机制(multihead self-attention,MHSA)提取更深层次的语义信息及近距离和远距离特征信息;最后采用条件随机场(conditional random field,CRF)分类器和Softmax分类器进行分类。【结果】在相关的汽车用户评论文本数据集和多语言混合数据集上,本研究提出的模型相较于主流的方面情感分类方法,具有同步抽取方面词和判断情感极性的能力,且有效提高了方面词抽取和方面情感分类的准确率和F_(1)值。【结论】本研究提出的模型更有利于汽车销售者分析用户评论,同时对识别用户评论文本的情感极性的研究也有一定的参考价值。 展开更多
关键词 方面词抽取 方面情感分类 多任务学习 用户评论
下载PDF
基于神经网络的纸笔手写规范汉字量化评价研究
9
作者 王敏 马万 +3 位作者 祝闯 史善飞 舒江波 卢帅成 《华中师范大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第6期813-820,共8页
汉字书写教育是我国素质教育的重要内容之一.当前,我国中小学生规范汉字书写教育存在两大问题:1)缺乏有效指导,规范汉字书写要领以定性描述为主,细节要点的量化特征没有体现,学生无法准确把握书写细节;2)缺乏有效的评价,大部分教师或家... 汉字书写教育是我国素质教育的重要内容之一.当前,我国中小学生规范汉字书写教育存在两大问题:1)缺乏有效指导,规范汉字书写要领以定性描述为主,细节要点的量化特征没有体现,学生无法准确把握书写细节;2)缺乏有效的评价,大部分教师或家长对学生的书写只能给出整体的定性评价,无法给出精准的细节评价.针对上述问题,该文开展日常自然书写场景下纸笔手写规范汉字的量化评价研究,主要包括三个方面的工作:1)利用手写汉字的骨架图像和预评价结果构建基于卷积神经网络的分类评价模型,实现对手写汉字书写规范性的自动分类评价;2)基于手写汉字笔段属性数据实现对书写细节的量化评价,并给出书写调整的建议;3)利用手写汉字各项书写规则的书写规范性评分,构建基于多元线性回归的书写评分模型,实现对手写汉字整字书写质量的评价. 展开更多
关键词 规范汉字 书写规则 量化评价
下载PDF
基于ERNIE与多特征融合的中文命名实体识别
10
作者 陈克金 叶善力 《浙江科技学院学报》 CAS 2023年第5期421-429,456,共10页
【目的】在中文命名实体识别中,传统命名实体识别方法中词向量只能将其映射为单一向量,无法表征一词多义,在特征提取过程中易忽略局部特征。针对以上问题,提出一种基于知识增强语义表示(enhanced reprsentation through knowledge integ... 【目的】在中文命名实体识别中,传统命名实体识别方法中词向量只能将其映射为单一向量,无法表征一词多义,在特征提取过程中易忽略局部特征。针对以上问题,提出一种基于知识增强语义表示(enhanced reprsentation through knowledge integration,ERNIE)与多特征融合的实体识别方法。【方法】首先,通过预训练模型ERNIE获得词向量;然后将词向量并行输入双向长短时记忆网络(bidirectional long short-term memory network,BiLSTM)与膨胀卷积神经网络(iterated dilated convolutional neural network,IDCNN)中提取特征,再将输出特征向量进行融合;最后通过条件随机场(conditional random field,CRF)解码获取最佳序列。【结果】本研究所提出的模型优于其他传统模型,在微软亚洲研究院(Microsoft Research Asia,MSRA)数据集上的F_(1)值达到了95.18%,相比基准模型BiLSTM-CRF F_(1)值提高了8.86百分点,相比ERNIE-BiLSTM-CRF模型F_(1)值提高了1.34百分点。此外,在ERNIE-BiLSTM-IDCNN-CRF中引入注意力机制后F_(1)值仅提升了0.07百分点,可见引入注意力机制对本研究所提出的模型之识别效果提升有限。【结论】本研究所提出的模型有效地提升了中文数据集上的实体识别性能,可为自然语言处理的命名实体识别研究提供参考。 展开更多
关键词 命名实体识别 ERNIE 双向长短期记忆网络 膨胀卷积神经网络 注意力机制
下载PDF
继电保护定值模型建立及语义识别技术研究 被引量:2
11
作者 熊学海 万春竹 +2 位作者 杨波 赵凌 齐雪雯 《自动化技术与应用》 2023年第5期128-132,共5页
针对各厂家继电保护定值信息语义不标准,严重影响信息审核和应用的问题,提出基于知识图谱和文本相似度计算的继电保护定值信息智能识别模型。建立语义预处理、语义智能识别、定值信息知识图谱等模块。基于正则表达式处理字母、数字以及... 针对各厂家继电保护定值信息语义不标准,严重影响信息审核和应用的问题,提出基于知识图谱和文本相似度计算的继电保护定值信息智能识别模型。建立语义预处理、语义智能识别、定值信息知识图谱等模块。基于正则表达式处理字母、数字以及特殊符号不标准表述;通过文本相似度算法,计算待规范信息和规范信息间余弦值,判定两者间的相似程度;基于自然语言处理技术,建立继电保护标准语义信息知识网络。通过某地区继电保护定值信息验证,模型能够准确地标准化各厂家的定值信息。 展开更多
关键词 定值信息模型 文本识别 文本相似度计算
下载PDF
基于局部信息的手写汉字笔画提取
12
作者 范勇峰 李成城 +1 位作者 林民 郭振东 《内蒙古师范大学学报(自然科学汉文版)》 CAS 2023年第2期181-188,共8页
现有计算机在指导手写汉字练习与测试中,指导依据大都基于全局特征,缺少基于更细粒度特征。提出一种基于局部信息的手写汉字笔画提取方法,为手写汉字评价与指导等任务提供数据支持。首先提取出汉字骨架并对骨架中的毛刺与断裂等问题进... 现有计算机在指导手写汉字练习与测试中,指导依据大都基于全局特征,缺少基于更细粒度特征。提出一种基于局部信息的手写汉字笔画提取方法,为手写汉字评价与指导等任务提供数据支持。首先提取出汉字骨架并对骨架中的毛刺与断裂等问题进行优化;然后使用PBOD算法提取汉字交叉区域后,对交叉区域进行合并删除,消除笔画形变,通过局部信息计算笔画段的组合系数,根据组合系数提取笔画;最后根据获取到的笔画数与算法迭代次数,动态调整组合系数阈值,保证在正确连接笔画段的前提下提取到更可能多的笔画。将该方法在手写汉字数据集上进行实验,其准确率、召回率与F1值分别达到了95.91%、95.71%与95.81%,可用于后续的手写汉字评判与指导等任务。 展开更多
关键词 手写汉字练习 骨架提取与优化 PBOD算法 交叉区域合并 局部信息 笔画提取
下载PDF
基于K-P算法优化的手写汉字细化算法
13
作者 范勇峰 李成城 林民 《计算机工程与设计》 北大核心 2023年第10期3076-3083,共8页
为解决现有汉字细化算法中的骨架断裂、交叉点畸变等问题,提出一种K-P(Kmeans++-PCA)算法,优化现有的手写汉字细化算法。提出交叉点匹配模板,减少骨架毛刺去除时对非交叉点的遍历,借助主成分分析算法与端点距离对骨架断点进行连接判断,... 为解决现有汉字细化算法中的骨架断裂、交叉点畸变等问题,提出一种K-P(Kmeans++-PCA)算法,优化现有的手写汉字细化算法。提出交叉点匹配模板,减少骨架毛刺去除时对非交叉点的遍历,借助主成分分析算法与端点距离对骨架断点进行连接判断,对骨架交叉点畸变进行处理,使用点到边界方向距离算法提取交叉区域后结合Kmeans++聚类对畸变区域进行分析,利用笔画走势信息对骨架进行修复并使用B样插值算法完成骨架重建。将优化后的算法在手写汉字数据集上进行实验,验证了优化后的算法优于优化前的算法。 展开更多
关键词 手写汉字 汉字细化 主成分分析算法 骨架断裂 点到边界方向距离算法 交叉点畸变 Kmeans++聚类
下载PDF
基于结构知识的手写体汉字部件提取算法
14
作者 李泽瑶 李成城 《计算机工程与设计》 北大核心 2023年第5期1479-1486,共8页
针对手写体汉字结构复杂、部件粘连等问题,提出一种基于结构知识的手写体汉字部件提取方法。依据汉字结构特征,结合投影法制定连通区域合并规则,实现汉字部件初步提取。在此基础上,针对部件间存在粘连等书写不规范问题,对传统滴水算法... 针对手写体汉字结构复杂、部件粘连等问题,提出一种基于结构知识的手写体汉字部件提取方法。依据汉字结构特征,结合投影法制定连通区域合并规则,实现汉字部件初步提取。在此基础上,针对部件间存在粘连等书写不规范问题,对传统滴水算法进行改进,实现粘连部件分割。经实验验证,该方法较传统滴水算法在粘连部件切分方面的效果有明显提升,可实现对多种结构汉字的部件提取,具有较高的实用价值。 展开更多
关键词 手写体汉字 汉字结构 投影法 连通区域合并 粘连部件 滴水算法改进 汉字部件提取
下载PDF
轻量级柱面线杆标识牌字符识别算法
15
作者 林绍福 李松静 刘希亮 《计算机工程与设计》 北大核心 2023年第8期2498-2505,共8页
为全面、准确、快速地提取柱面电线杆标识牌信息,提出一种轻量级柱面电线杆标识牌字符识别算法Tiny-DBNet-CRNN。对柱面图像进行反投影矫正展平;融合注意力机制,利用深度可分离卷积残差块,构建轻量级文本检测网络分割出文本区域;构建字... 为全面、准确、快速地提取柱面电线杆标识牌信息,提出一种轻量级柱面电线杆标识牌字符识别算法Tiny-DBNet-CRNN。对柱面图像进行反投影矫正展平;融合注意力机制,利用深度可分离卷积残差块,构建轻量级文本检测网络分割出文本区域;构建字符识别模型CRNN输出标识牌字符信息。采用真实场景数据和ICDAR 2015数据进行实验,结果与当前流行模型相比,Tiny-DBNet-CRNN字符识别正确率提升了40.3%,达95.11%;在精度下降0.60%的微小损失下,检测速度提升3倍,参数规模上总体下降45.15%。 展开更多
关键词 电线杆标识牌 反投影算法 轻量级网络 深度可分离卷积 注意力机制 DBNet算法 CRNN算法
下载PDF
手写体数字识别技术的研究 被引量:34
16
作者 柳回春 马树元 +1 位作者 吴平东 李晓梅 《计算机工程》 CAS CSCD 北大核心 2003年第4期24-25,61,共3页
手写体数字识别特征提取方面,有模板匹配,统计特征和结构特征,在分类器设计上有基于距离的分类器和神经网络分类器等。分析和评价了这些问题后,指出今后的研究方向应在特征综合、分类器集成以及新的分类器的研究上。
关键词 手写体数字识别 手写字符识别 信息处理 神经网络 特征提取 分类器 支持向量机
下载PDF
中文金融新闻中公司名的识别 被引量:47
17
作者 王宁 葛瑞芳 +2 位作者 苑春法 黄锦辉 李文捷 《中文信息学报》 CSCD 北大核心 2002年第2期1-6,共6页
在金融领域信息抽取中 ,公司名扮演着非常重要的角色 ;因此如何正确识别文本中出现的公司名是一个非常重要的研究课题。在对金融新闻文本进行了深入地分析和研究的基础上 ,总结出了公司名的结构特征及其上下文信息 ,建立了六个用于识别... 在金融领域信息抽取中 ,公司名扮演着非常重要的角色 ;因此如何正确识别文本中出现的公司名是一个非常重要的研究课题。在对金融新闻文本进行了深入地分析和研究的基础上 ,总结出了公司名的结构特征及其上下文信息 ,建立了六个用于识别公司名的知识库 ,并提出了一个基于两次扫描过程的识别策略。初步实验结果表明 ,在封闭测试中实验系统公司名识别的精确率可以达到 97 3% ,召回率可达 89 3% ;在开放测试中精确率可以达到 6 2 8% ,召回率可达 6 2 1%。 展开更多
关键词 公司名 金融领域 专名识别 信息抽取 金融新闻 中文识别 识别策略
下载PDF
基于统计方法的中文姓名识别 被引量:34
18
作者 黄德根 杨元生 +2 位作者 王省 张艳丽 钟万勰 《中文信息学报》 CSCD 北大核心 2001年第2期31-37,44,共8页
专有名词的识别对自动分词有重要意义。本文针对如何识别中文姓名做了有益的尝试 ,主要采用基于统计方法 ,进行中文姓名识别。本文建立了有监督学习机制 ,提出了句子切分结果可信度等概念 ,并在此基础上建立了较好的统计模型 ,系统闭式... 专有名词的识别对自动分词有重要意义。本文针对如何识别中文姓名做了有益的尝试 ,主要采用基于统计方法 ,进行中文姓名识别。本文建立了有监督学习机制 ,提出了句子切分结果可信度等概念 ,并在此基础上建立了较好的统计模型 ,系统闭式精确率和召回率分别达 95 .97%和 95 .5 2 % ,开式精确率和召回率分别达 92 .37%和 88.6 2 % 展开更多
关键词 双词同现频度 单词频度 学习机制 中文姓名识别 自动分词 统计模型 召回率 可信度
下载PDF
基于分解与动态规划策略的汉语未登录词识别 被引量:43
19
作者 吕雅娟 赵铁军 +2 位作者 杨沐昀 于浩 李生 《中文信息学报》 CSCD 北大核心 2001年第1期28-33,共6页
:未登录词的识别是汉语自动分词中的主要问题。本文以对中国人名 ,中国地名和外国译名进行整体识别为目标 ,采用分解处理策略降低了整体处理难度 ,并使用动态规划方法实现了最佳路径的搜索 ,较好地解决了未登录词之间的冲突问题。通过... :未登录词的识别是汉语自动分词中的主要问题。本文以对中国人名 ,中国地名和外国译名进行整体识别为目标 ,采用分解处理策略降低了整体处理难度 ,并使用动态规划方法实现了最佳路径的搜索 ,较好地解决了未登录词之间的冲突问题。通过对真实语料识别的测试 。 展开更多
关键词 未登录词识别 分解处理 动态规划 汉语自动分词 路径搜索 整体识别
下载PDF
基于SVM和纹理的笔迹鉴别方法 被引量:32
20
作者 刘宏 李锦涛 +1 位作者 崔国勤 唐胜 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2003年第12期1479-1484,共6页
针对与书写内容无关的笔迹 ,提出利用快速Gabor小波提取笔迹图像的整体纹理特征、用支持向量机(SVM)进行训练和识别的方法 SVM是解决两类问题的算法 ,而笔迹鉴别是一个多类问题 ,通过“一对多”的方法将多类问题转化为两类问题 在 87人... 针对与书写内容无关的笔迹 ,提出利用快速Gabor小波提取笔迹图像的整体纹理特征、用支持向量机(SVM)进行训练和识别的方法 SVM是解决两类问题的算法 ,而笔迹鉴别是一个多类问题 ,通过“一对多”的方法将多类问题转化为两类问题 在 87人笔迹库上的实验结果表明 。 展开更多
关键词 笔迹鉴别 SVM 纹理 生物识别 计算机 文字识别
下载PDF
上一页 1 2 61 下一页 到第
使用帮助 返回顶部