期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
以多模态大模型推动中国古文字研究发展
1
作者 莫伯峰 张重生 《中国语言战略》 2024年第2期37-47,共11页
人工智能技术与古文字研究的结合已经产生了一批有影响的成果,但几乎都是基于单模态模型。单一模态的智能模型在面对复杂的古文字问题时还存在很大的限制,只能在某些方面起到“辅助”作用,难以独立而完整地解决各种实际问题。文字的形... 人工智能技术与古文字研究的结合已经产生了一批有影响的成果,但几乎都是基于单模态模型。单一模态的智能模型在面对复杂的古文字问题时还存在很大的限制,只能在某些方面起到“辅助”作用,难以独立而完整地解决各种实际问题。文字的形、音、义与各种模态存在不同的关联,汉字的表意属性决定了图像模态和文本模态具有同样重要的作用,中国古文字研究与人工智能的结合须走多模态之路。近年来多模态大模型正在飞速发展,以此为契机来综合性地解决古文字检测、识别、复原等问题,有望取得更好的效果,而文字考释等一些过去难以触及的关键问题也能探索出新的解决路径。 展开更多
关键词 多模态 人工智能 古文字 甲骨文
下载PDF
深度对比学习综述 被引量:20
2
作者 张重生 陈杰 +3 位作者 李岐龙 邓斌权 王杰 陈承功 《自动化学报》 EI CAS CSCD 北大核心 2023年第1期15-39,共25页
在深度学习中,如何利用大量、易获取的无标注数据增强神经网络模型的特征表达能力,是一个具有重要意义的研究问题,而对比学习是解决该问题的有效方法之一,近年来得到了学术界的广泛关注,涌现出一大批新的研究方法和成果.本文综合考察对... 在深度学习中,如何利用大量、易获取的无标注数据增强神经网络模型的特征表达能力,是一个具有重要意义的研究问题,而对比学习是解决该问题的有效方法之一,近年来得到了学术界的广泛关注,涌现出一大批新的研究方法和成果.本文综合考察对比学习近年的发展和进步,提出一种新的面向对比学习的归类方法,该方法将现有对比学习方法归纳为5类,包括:1)样本对构造;2)图像增广;3)网络架构;4)损失函数;5)应用.基于提出的归类方法,对现有对比研究成果进行系统综述,并评述代表性方法的技术特点和区别,系统对比分析现有对比学习方法在不同基准数据集上的性能表现.本文还将梳理对比学习的学术发展史,并探讨对比学习与自监督学习、度量学习的区别和联系.最后,本文将讨论对比学习的现存挑战,并展望未来发展方向和趋势. 展开更多
关键词 对比学习 深度学习 特征提取 自监督学习 度量学习
下载PDF
基于序列相似性计算的甲骨残片缀合算法 被引量:1
3
作者 张重生 王斌 《电子学报》 EI CAS CSCD 北大核心 2023年第4期860-869,共10页
甲骨残片缀合一直是甲骨学研究中最急迫最具基础性的工作,它使得甲骨残片经过拼接,复原为更加完整的原始材料.尽管前人及同行曾提出若干计算机辅助的甲骨缀合方法,但这些方法缀合准确度不足,未能真正投入使用,并不能真正帮助专家解决甲... 甲骨残片缀合一直是甲骨学研究中最急迫最具基础性的工作,它使得甲骨残片经过拼接,复原为更加完整的原始材料.尽管前人及同行曾提出若干计算机辅助的甲骨缀合方法,但这些方法缀合准确度不足,未能真正投入使用,并不能真正帮助专家解决甲骨缀合问题,导致当前的甲骨缀合工作仍旧依靠人工、依旧费时费力.为了更好地研究甲骨残片的机器缀合问题,本文使用一个较大规模甲骨缀合基准数据集OB-Rejoin,该数据集包含了约一千幅甲骨拓片图像,且融入了大量的甲骨学界已缀成果,用于算法评估.基于该数据集,本文设计了一种基于斜率变化量序列匹配的甲骨缀合算法(Slope United Sequence Matching for Oracle Bone Fragments Conjugation,SUM),该方法将甲骨残片的断边碴口图像匹配问题转化为数值型的序列数据和序列相似性比对问题,以将尚不够非常精密的计算机视觉领域的碴口图像匹配问题转换为数据科学领域较为成熟的序列数据相似性匹配问题.SUM将数值型的碴口序列数据进一步转换为斜率变化量序列和字符序列数据,最后利用字符序列的模糊匹配完成甲骨残片的碴口匹配.在实验环节,SUM算法与经典的序列相似性计算方法在精确率、召回率、漏检率方面进行了对比,并与两个较新的基于深度学习的序列匹配算法和形状匹配算法进行了性能对比.整体而言,SUM在OB-Rejoin数据集上的Top-15缀合召回率达到了95.181%,超越了对比算法.重要出土文献的精准复原本身是历史学和古文字研究中客观存在的重大现实需求,具有重要的史学价值和意义,因此,本文的研究成果,不但有助于解决甲骨残片的机器缀合问题,还对秦汉简牍和敦煌遗书等重要出土文献的精准复原具有重要的参考价值. 展开更多
关键词 甲骨文 甲骨缀合 序列相似性计算 形状匹配 边缘匹配
下载PDF
传感器网络中健壮数据聚集算法 被引量:2
4
作者 吴中博 张重生 +1 位作者 陈红 秦航 《软件学报》 EI CSCD 北大核心 2009年第7期1885-1894,共10页
节约能量以提高网络寿命是传感器网络研究面临的重要挑战.网内聚集查询在中间节点对数据进行预处理,可以减少消息传送的数量或者大小,从而实现能量的有效利用,但是,目前的聚集查询研究假设采样数据都是正确的.而目前的异常检测算法以检... 节约能量以提高网络寿命是传感器网络研究面临的重要挑战.网内聚集查询在中间节点对数据进行预处理,可以减少消息传送的数量或者大小,从而实现能量的有效利用,但是,目前的聚集查询研究假设采样数据都是正确的.而目前的异常检测算法以检测率作为首要目标,不考虑能量的消耗,也不考虑查询的特点.所以将两方面的研究成果简单地结合在一起并不能产生很好的效果.分析了错误和异常数据可能对聚集结果造成的影响,提出了健壮聚集算法RAA(robust aggregation algorithm).RAA对传统聚集查询进行了改进,在聚集的同时利用读向量相似性判断数据是否发生了错误或异常,删除错误数据,聚集正常数据并报告异常,使用户可以对网络目前状况有清晰的理解.最后,比较了RAA和TAGVoting(在使用TAG(tiny aggregation)算法聚集的同时利用Voting算法进行异常检测),实验结果表明,RAA算法在能量消耗和异常检测率方面都优于TAGVoting. 展开更多
关键词 传感器网络 查询处理 数据聚集 异常检测 读向量
下载PDF
颌骨巨大囊肿袋形术临床治疗效果评价 被引量:6
5
作者 张春生 李世芬 张重生 《现代口腔医学杂志》 CAS CSCD 2002年第6期567-567,共1页
关键词 颌骨巨大囊肿 袋形术 治疗 疗效
下载PDF
AI缀合中的人机耦合 被引量:12
6
作者 莫伯峰 张重生 门艺 《出土文献》 CSSCI 2021年第1期19-26,154,共9页
本文结合我们近期的计算机缀合实践,以五组新缀甲骨为例,探讨了AI时代如何利用计算机的优势,并结合专家知识,共同推进古文字研究发展的一些经验。认为AI和专家各有所长,二者需要密切合作,人机耦合是现阶段利用AI技术最为有效的一种方式。
关键词 甲骨 缀合 人工智能
下载PDF
基于人工智能的甲骨文识别技术与字形数据库构建 被引量:5
7
作者 门艺 张重生 《中国文字研究》 2021年第1期9-16,共8页
已有的甲骨文工具书在整理模式、编排方式、检索方法、呈现手段等方面积累了经验,但也有字形分合无标准、检索困难、隶定方式混乱等现象。纸制工具书不利于复用、优化和改进,且无法对每个字形的相关资料穷尽性枚举并提供相关的上下文信... 已有的甲骨文工具书在整理模式、编排方式、检索方法、呈现手段等方面积累了经验,但也有字形分合无标准、检索困难、隶定方式混乱等现象。纸制工具书不利于复用、优化和改进,且无法对每个字形的相关资料穷尽性枚举并提供相关的上下文信息。利用新一代人工智能技术处理数量庞大、表义复杂、字形多变的甲骨文字,训练深度学习模型,实现在全张拓片上对甲骨文字逐一自动定位、识别,可依据字形自动进行分类,在此基础上建设材料完整、语段信息方便查看、开放式编辑的甲骨文字形数据库。进一步设计相关甲骨文识别与相似性检索软件,使字形数据库成为以图片检索甲骨文的便利工具。 展开更多
关键词 甲骨文 字形 人工智能 数据库
下载PDF
基于血栓弹力图的后循环脑梗死患者病情进展风险预测模型构建与验证
8
作者 张重生 谢娟 王前友 《临床误诊误治》 CAS 2024年第19期55-61,共7页
目的基于血栓弹力图构建后循环脑梗死患者病情进展风险预测模型,旨在为临床实践提供最佳预测工具。方法选取2021年5月至2023年4月120例后循环脑梗死患者作为建模人群,另选取同期80例后循环脑梗死患者作为验证人群,统计患者病情进展情况... 目的基于血栓弹力图构建后循环脑梗死患者病情进展风险预测模型,旨在为临床实践提供最佳预测工具。方法选取2021年5月至2023年4月120例后循环脑梗死患者作为建模人群,另选取同期80例后循环脑梗死患者作为验证人群,统计患者病情进展情况、临床资料及血栓弹力图参数。采用LASSO初筛后循环脑梗死患者疾病进展的特征变量,Logistic回归分析疾病进展的影响因素;采用R软件构建列线图预测模型,并分别采用受试者工作特征曲线、临床决策曲线、校准曲线评价该模型区分度、有效性及准确度。结果LASSO回归分析显示,当惩罚系数λ=0.122时模型性能优良且影响因素最少,最终筛选出6个预测变量为心房颤动史、入院时美国国立卫生院卒中量表(NIHSS)评分及血栓弹力图参数反应时间、凝固时间、最大振幅、凝固角。Logistic回归分析显示,入院时NIHSS评分、心房颤动史及血栓弹力图参数反应时间、凝固时间、最大振幅、凝固角均为后循环脑梗死患者疾病进展的影响因素(P<0.01)。根据上述影响因素建立后循环脑梗死患者疾病进展风险列线图预测模型;在建模与验证人群中,该列线图模型曲线下面积分别为0.875(95%CI:0.813,0.937)、0.914(95%CI:0.851,0.976),提示具有良好的区分度;校准曲线显示,该列线图模型在建模与验证人群中预测值与实际观察结果高度相关,提示准确度良好;临床决策曲线显示,在建模与验证人群中,该列线图模型净获益值较好,提示预测效能良好。结论心房颤动史、入院时NIHSS评分及血栓弹力图参数反应时间、凝固时间、最大振幅、凝固角均为后循环脑梗死患者病情进展的影响因素,基于上述影响因素构建列线图模型,具有良好风险预测效能。 展开更多
关键词 后循环脑梗死 血栓弹力图 病情进展 列线图 预测模型 心房颤动 NIHSS评分 ROC曲线
下载PDF
口腔颌面部淀粉样变性(附8例临床报告)
9
作者 张春生 李世芬 +1 位作者 张重生 李蕊 《天津医科大学学报》 2002年第1期17-17,共1页
关键词 口腔 颌面 淀粉样变性 病理
下载PDF
基于深度学习的场景文字检测综述 被引量:27
10
作者 姜维 张重生 殷绪成 《电子学报》 EI CAS CSCD 北大核心 2019年第5期1152-1161,共10页
近年来,基于深度学习的场景文字检测技术取得重要进展.本文综述了该技术在2014~2018年间的最新工作,将其分为传统区域建议方法、文字建议网络方法、基于分割的方法以及文字建议网络与分割的混合方法,并对各类方法的优劣进行分析.本文... 近年来,基于深度学习的场景文字检测技术取得重要进展.本文综述了该技术在2014~2018年间的最新工作,将其分为传统区域建议方法、文字建议网络方法、基于分割的方法以及文字建议网络与分割的混合方法,并对各类方法的优劣进行分析.本文还展望了未来发展趋势,指出未来研究热点. 展开更多
关键词 深度学习 场景文字 检测定位
下载PDF
基于锚点的字符级甲骨图像自动标注算法研究 被引量:4
11
作者 史先进 曹爽 +3 位作者 张重生 陶月锋 吕灵灵 沈夏炯 《电子学报》 EI CAS CSCD 北大核心 2021年第10期2020-2031,共12页
甲骨文是中国最早的系统文字,是目前能见到的最早的成熟汉字.甲骨文的研究对历史探究和文化传承具有重要的意义.但是要实现字符级别的甲骨字符图像标注,在现有技术环境下,只能通过资深甲骨学专家进行人工标注,不仅耗费人力资源,而且效... 甲骨文是中国最早的系统文字,是目前能见到的最早的成熟汉字.甲骨文的研究对历史探究和文化传承具有重要的意义.但是要实现字符级别的甲骨字符图像标注,在现有技术环境下,只能通过资深甲骨学专家进行人工标注,不仅耗费人力资源,而且效率低下.针对这一问题,在前期工作中的甲骨字符图像识别模型的基础上,本文提出了一种甲骨字符图像自动标注算法.该算法通过先分列后切割的思想,先将甲骨拓片上的每一个字符图像归结到某一个特定列,再以锚点甲骨字为参考点,根据空间近邻关系找到甲骨原文中的字所对应的甲骨字符图像,从而实现了甲骨字符图像的自动标注.同时,将标注好的甲骨字符图像添加到样本数据集,并利用增广后的数据集(增加6~10倍)重新训练甲骨字符图像识别模型,有利于提高基于深度学习的甲骨文识别算法的识别准确度;以较小的成本大幅增加样本数量,也可以节约专家大量的时间和人力. 展开更多
关键词 甲骨文 图像标注 数据增广 锚点 空间近邻 模式识别
下载PDF
耳朵信息对侧脸检测的影响研究
12
作者 王弯弯 张重生 《电子学报》 EI CAS CSCD 北大核心 2018年第3期646-651,共6页
如何准确地检测和定位图像中的人脸是人脸检测领域的关键问题.为了进一步提高人脸检测器的性能,常见的方法是增加训练数据集或采用更鲁棒的人脸特征表示,而训练人脸检测器的一个基础工作是:为训练图像中的人脸标注边界框.但标注的人脸... 如何准确地检测和定位图像中的人脸是人脸检测领域的关键问题.为了进一步提高人脸检测器的性能,常见的方法是增加训练数据集或采用更鲁棒的人脸特征表示,而训练人脸检测器的一个基础工作是:为训练图像中的人脸标注边界框.但标注的人脸边界框是否应该包含耳朵信息,以及对训练出的侧脸检测器性能的影响尚未被研究.本文的实验结果表明:在侧脸数据集上训练人脸检测器时,如果人脸边界框包含耳朵信息,基于DPM(Deformable Parts Model)方法训练得到的侧脸检测器使侧脸检测的准确率降低1.9%,召回率提高6.3%.而基于Viola&Jones和Fast R-CNN方法训练得到的侧脸检测器使准确率分别提高6.8%和4.4%,召回率分别提高14.9%和12.9%.这说明包含耳朵信息训练出的侧脸检测模型,有助于提高侧脸检测率. 展开更多
关键词 多角度人脸检测 人脸检测器 耳朵 人脸边界框 侧脸检测
下载PDF
遗忘型与血管性轻度认知功能障碍患者认知功能比较研究
13
作者 谢娟 王前友 +1 位作者 张重生 张源 《中文科技期刊数据库(引文版)医药卫生》 2024年第11期096-099,共4页
探讨遗忘型轻度认知障碍(amnesticMildCognitiveImpairment,aMCI)和血管性轻度认知障碍(VascularMildCognitiveImpairment,VaMCI)患者神经心理特征差异。方法 30名aMCI患者和30名VaMCI患者被纳入本研究,30名健康体者检被选为对照组。aMC... 探讨遗忘型轻度认知障碍(amnesticMildCognitiveImpairment,aMCI)和血管性轻度认知障碍(VascularMildCognitiveImpairment,VaMCI)患者神经心理特征差异。方法 30名aMCI患者和30名VaMCI患者被纳入本研究,30名健康体者检被选为对照组。aMCI组与VaMCI组患者、正常对照组完成蒙特利尔认知评估量表(MontrealCognitiveAssessment,MoCA);aMCI组与VaMCI组患者完成记忆功能测试(听觉词语学习测验)及执行功能测试(Stroop色词测验),视空间测验,言语流畅性测验。对各组之间神经心理测试结果进行分析。结果 MoCA分数正常对照组高于aMCI组及VaMCI组,差异具有统计学意义(P<0.05);aMCI组在听觉词语学习测验各项得分均低于VaMCI组,差异具有统计学意义(P<0.05);aMCI组Stroop色词测验CWT-C正确数高于VaMCI组,差异具有统计学意义(P<0.05);aMCI组Stroop色词测验CWT-A、CWT-B、CWT-C耗时数均低于VaMCI组,差异具有统计学意义(P<0.05);aMCI组与VaMCI组画钟试验比较差异无统计学意义(P>0.05);aMCI组言语流畅性测测验列举动物正确数少于与VaMCI组,差异具有统计学意义(P<0.05)。结论 遗忘型轻度认知障碍患者以情景记忆损害为主,血管性轻度认知障碍患者以执行功能损害为主,结果 反映了两者在病理机制上的差异。 展开更多
关键词 遗忘型轻度认知障碍 血管性轻度认知障碍 神经心理测验
下载PDF
急性颈内动脉系统脑梗死患者侧支循环建立特点及影响因素 被引量:1
14
作者 张重生 施德 《中外医学研究》 2019年第36期47-49,共3页
目的:探讨急性颈内动脉系统脑梗死患者侧支循环建立特点及其影响因素。方法:采用血管造影(DSA)对笔者所在医院收治的165例急性颈内动脉系统脑梗死患者的侧支循环建立特点进行评估,根据患者资料分析其影响因素。结果:165例急性颈内动脉... 目的:探讨急性颈内动脉系统脑梗死患者侧支循环建立特点及其影响因素。方法:采用血管造影(DSA)对笔者所在医院收治的165例急性颈内动脉系统脑梗死患者的侧支循环建立特点进行评估,根据患者资料分析其影响因素。结果:165例急性颈内动脉系统脑梗死患者中123例患者有侧支循环,占比74.55%,无侧支循环42例,占比25.45%;单因素分析结果发现有吸烟史、饮酒史、糖尿病、高血压、长期运动、口服他汀类药物等因素在有无侧支循环建立方面比较差异有统计学意义(P<0.05);多因素非条件Logistic回归分析结果有无侧支循环建立的其独立风险因素是吸烟史、糖尿病、长期运动和口服他汀类。结论:急性颈内动脉系统脑梗死患者侧支循环的建立与吸烟史、糖尿病、长期运动和口服他汀类等因素相关,早期干预可能有助于减少急性脑梗死的发生,改善预后。 展开更多
关键词 侧支循环 颈内动脉狭窄 急性脑梗死 多因素Logistic 回归分析
下载PDF
血栓弹力图联合PLR对伴脑小血管病的急性脑梗死后出血性转化风险的评估价值 被引量:7
15
作者 应黎 张重生 +2 位作者 赵博轩 李华 王文安 《中国急救复苏与灾害医学杂志》 2023年第2期195-198,共4页
目的研究血栓弹力图(TEG)联合血小板/淋巴细胞比值(PLR)对伴脑小血管病(CSVD)的急性脑梗死后出血性转化(HT)风险的评估价值。方法选取2019年1月—2021年12月上海健康医学院附属崇明医院伴CSVD的急性脑梗死患者97例,并按照入院7 d内是否... 目的研究血栓弹力图(TEG)联合血小板/淋巴细胞比值(PLR)对伴脑小血管病(CSVD)的急性脑梗死后出血性转化(HT)风险的评估价值。方法选取2019年1月—2021年12月上海健康医学院附属崇明医院伴CSVD的急性脑梗死患者97例,并按照入院7 d内是否发生HT分为HT组与非HT组,比较两组一般资料、TEG参数及PLR值,分析HT发生的影响因素,采用受试者工作特征(ROC)曲线评估TEG参数联合PLR对HT的预测价值。结果97例伴CSVD的急性脑梗死患者23例发生HT,HT发生率为23.71%;HT组与非HT组性别、年龄、BMI、基础疾病、发生症状至就诊时间、脑梗死部位、抗栓治疗比较,差异无统计学意义(P>0.05);HT组大面积梗死、CSVD脑白质高信号分度为重度、双重抗血小板占比高于非HT组(P<0.05);两组凝固时间(K)、血栓最大振幅(MA)、凝固角(α)比较,差异无统计学意义(P>0.05);HT组凝血反应时间(R)、血凝块稳定性(LY30)、血小板/淋巴细胞比值(PLR)大于非HT组(P<0.05);经Logistic回归分析,大面积脑梗死、CSVD脑白质高信号分度、双重抗血小板治疗、R、LY30、PLR为HT发生的危险因素(P<0.05);ROC曲线分析显示,TEG参数R、LY30及PLR诊断HT的Cut-off值为6.00 min、2.352%、124.38,曲线下面积(AUC)值为0.784、0.898、0.889,联合诊断的AUC值为0.967。结论TEG参数及PLR是伴CSVD的急性脑梗死患者HT发生风险的影响因素,且对预后具有一定预测价值。 展开更多
关键词 脑小血管病 急性脑梗死 血栓弹力图 血小板/淋巴细胞比值 出血性转化 风险评估
下载PDF
帕金森病患者动态血压对认知功能的影响 被引量:2
16
作者 应黎 张重生 王文安 《临床荟萃》 CAS 2018年第12期1036-1039,共4页
目的帕金森病(PD)患者多伴有动态血压(ABP)异常和认知功能障碍,PD认知功能减退的机制不明确,本研究旨在探讨PD患者ABP的变化对其认知功能改变的影响。方法选取60例简易精神状态检查量表(Minimum Mental State Examination,MMSE)评分排... 目的帕金森病(PD)患者多伴有动态血压(ABP)异常和认知功能障碍,PD认知功能减退的机制不明确,本研究旨在探讨PD患者ABP的变化对其认知功能改变的影响。方法选取60例简易精神状态检查量表(Minimum Mental State Examination,MMSE)评分排除严重认知功能障碍的PD患者和40例年龄、性别相匹配的健康人作为对照,分别予以24小时ABP监测和蒙特利尔认知功能评估(MoCA)评分,比较两组ABP的变化,并评价ABP的变化值对认知功能的影响程度。结果 PD组非杓型血压的发生率明显高于对照组(P=0.028);PD组夜间平均血压(nMBP)与对照组比较显著增高(P=0.049);PD组夜间平均动脉血压下降水平(MABP%)明显低于对照组(P=0.022);PD组MoCA评分明显低于对照组(P=0.024);PD组MABP%、帕金森病评定量表第三部分(UPDRS)评分、年龄和教育年限对MoCA评分有着显著的影响(P=0.04、0.012、0.015、0.020),对照组教育年限和年龄对MoCA评分有显著影响(P=0.010和0.035)。结论 PD患者而非正常人的MABP%是其认知功能下降的独立危险因素。 展开更多
关键词 帕金森病 认知障碍 动态血压
下载PDF
DuC-GAN:增强GAN训练稳定性的新模型
17
作者 韩诗阳 张重生 《北京邮电大学学报》 EI CAS CSCD 北大核心 2024年第3期42-47,共6页
针对生成对抗网络(GAN)训练不稳定的问题,提出了一种新的双循环GAN(DuC-GAN)增强稳定性的模型。该模型通过在生成器和判别器之间添加额外的循环来解决GAN训练中的不稳定性问题。新循环由一个冻结的主判别器和一个辅助判别器组成,他们与... 针对生成对抗网络(GAN)训练不稳定的问题,提出了一种新的双循环GAN(DuC-GAN)增强稳定性的模型。该模型通过在生成器和判别器之间添加额外的循环来解决GAN训练中的不稳定性问题。新循环由一个冻结的主判别器和一个辅助判别器组成,他们与生成器一起进行训练,并以生成器的性能作为切换循环的指标。在多个数据集上的测试表明,相比现有模型,所提模型显著提高了GAN的性能和训练稳定性。实验结果表明,双循环GAN实现了更快的收敛速度和更好的生成效果。 展开更多
关键词 生成对抗网络 双循环结构 训练稳定性 模式崩溃
原文传递
基于Transformer的低质场景字符检测算法 被引量:6
18
作者 张重生 陈杰 +2 位作者 纵瑞星 杨帅磊 凡高娟 《北京邮电大学学报》 EI CAS CSCD 北大核心 2022年第2期124-130,共7页
为了提升低质场景文本图像的文字检测和识别性能,提出一种基于Transformer的字符级场景文本检测算法。依据场景文本行中的字符顺序,设计基于Transformer的编码-解码结构,能够输出每个字符检测框的坐标以及排序预测。根据匈牙利算法的思... 为了提升低质场景文本图像的文字检测和识别性能,提出一种基于Transformer的字符级场景文本检测算法。依据场景文本行中的字符顺序,设计基于Transformer的编码-解码结构,能够输出每个字符检测框的坐标以及排序预测。根据匈牙利算法的思想,设计了基于字符检测框坐标及排序损失的损失函数,以提高匹配检测结果的准确性。在3个字符级标注的场景文本数据集上的场景字符检测、场景字符识别的相关实验结果表明,所提算法能够取得较好的性能,在多个评价指标上均优于对比算法。 展开更多
关键词 低质场景文本 场景字符检测 TRANSFORMER 场景字符识别
原文传递
基于GBDT和HOG特征的人脸关键点定位 被引量:2
19
作者 张重生 彭国雯 于珂珂 《河南大学学报(自然科学版)》 CAS 2018年第2期214-222,共9页
人脸关键点检测是计算机视觉领域的一个重要分支,其检测精度将在很大程度上影响人脸识别和表情分析的结果.提出一种新的解决人脸关键点检测问题的方法,即H-GBDT.H-GBDT是一种基于GBDT决策树和HOG特征的人脸关键点检测算法,该算法是将人... 人脸关键点检测是计算机视觉领域的一个重要分支,其检测精度将在很大程度上影响人脸识别和表情分析的结果.提出一种新的解决人脸关键点检测问题的方法,即H-GBDT.H-GBDT是一种基于GBDT决策树和HOG特征的人脸关键点检测算法,该算法是将人脸图像的HOG特征作为GBDT的输入,关键点的真实坐标作为GBDT的输出来训练预测模型,在该过程中每个关键点将分纵坐标和横坐标两次在GBDT中做回归运算,并经过不断的调整GBDT和HOG特征的参数来训练出最佳预测模型.在BioID、LFW、LFPW三种数据集上验证H-GBDT算法的性能.BioID是正脸数据集,实验结果表明H-GDBT在该数据集上的检测效果最佳,其检测误差基本上可控制在2%以内;而LFW和LFPW是自然场景下的数据集,H-GBDT在这两种数据集上的检测误差一般在2%~4%之间. 展开更多
关键词 人脸关键点检测 人脸特征 GBDT HOG
原文传递
基于多描述编码的WMSN传输性能 被引量:2
20
作者 凡高娟 张重生 元沐南 《北京邮电大学学报》 EI CAS CSCD 北大核心 2012年第6期70-73,共4页
针对无线多媒体传感器网络(WMSN)数据传输存在无线链路差、传输质量要求高等问题,提出一种基于多描述编码的传输策略.该策略利用源节点进行多描述编码,通过选择初始分发节点,形成多个转发路径.以图像传输为实例,从数据到达率、图像传输... 针对无线多媒体传感器网络(WMSN)数据传输存在无线链路差、传输质量要求高等问题,提出一种基于多描述编码的传输策略.该策略利用源节点进行多描述编码,通过选择初始分发节点,形成多个转发路径.以图像传输为实例,从数据到达率、图像传输前后的对比、峰值信噪比等参数对该策略进行性能验证.仿真结果表明,该传输策略能解决无线链路不稳定性带来的问题,并保证数据传输的可靠性. 展开更多
关键词 多描述编码 无线多媒体传感器网络 性能
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部