智能算法在中文数据集上的文本匹配训练方法

A Novel Algorithm in Text Matching on Chinese Dataset

下载PDF

导出

摘要分析表明,医学中应用大量使用自然文本语言,为方便计算机分析,往往需要对其中的关键信息进去抽取,并将其表达文字规范化,从而使文本匹配成为广泛关注的技术问题。基于深度学习技术,阐述embedding表达的方案,迭代演进的数据扩展等,提出一种文本匹配的模型框架和数据扩展方法,通过多次少量的增量标注大幅度扩展可靠标签数据,使得模型的准确率大幅提升,从而满足应用要求。 The analysis shows that Natural Language Processing is widely used in Medical applications,which makes it important to transfer words into standard expression format.This paper introduces a new framework for text matching,which includes aRoBERTa based representation network,an evolutionary data expansion process and a fast searching engine.The results of experiment shows that the whole solution can improve matching accuracy greatly with expanding high-quality annotation datasets simultaneously.

作者徐盛戴佳骏李昱辰 XU Sheng;DAI Jiajun;LI Yuchen(Yijian(Shanghai)Information Technology Co.,Ltd.,Shanghai 200050,China)

机构地区翼健(上海)信息科技有限公司

出处《集成电路应用》 2022年第5期28-31,共4页 Application of IC

关键词智能算法中文数据文本匹配训练标签数据 intelligent algorithm Chinese data text matching training label data

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1屠恩美,杨杰.半监督学习理论及其研究进展概述[J].上海交通大学学报,2018,52(10):1280-1291. 被引量：30

共引文献29

1阿力木江·艾沙,殷晓雨,库尔班·吾布力,李喆.Centroid和EM结合的半监督文本分类[J].计算机工程与设计,2019,40(11):3118-3123.
2王健,郑七凡,李超,石晶.基于ENCODER_ATT机制的远程监督关系抽取[J].广西师范大学学报（自然科学版）,2019,37(4):53-60.
3王丁辰,周哲海.人工智能在眼底图像识别方法中的应用[J].激光杂志,2020,41(4):183-186. 被引量：10
4付治,王红军,李天瑞,滕飞,张继.基于k个标记样本的弱监督学习框架[J].软件学报,2020,31(4):981-990. 被引量：2
5李子乾.云计算中垃圾邮件识别的机器学习算法[J].自动化技术与应用,2020,39(5):88-95.
6何婧媛,阿茹罕.基于卷积神经网络的遥感图像分类[J].电子设计工程,2020,28(12):109-113. 被引量：6
7刘先锋,石静,陈明,杨予丹.基于符号规范化割的半监督学习与图像分割[J].小型微型计算机系统,2020,41(7):1547-1552. 被引量：3
8朱恒东,马盈仓,张要,张宁.基于L21范数和回归正则项的半监督聚类算法[J].郑州大学学报（理学版）,2020,52(4):67-74. 被引量：5
9徐洪学,孙万有,杜英魁,汪安祺.机器学习经典算法及其应用研究综述[J].电脑知识与技术,2020,16(33):17-19. 被引量：32
10赵凯琳,靳小龙,王元卓.小样本学习研究综述[J].软件学报,2021,32(2):349-369. 被引量：143

1李金彪,侯进,李晨,陈子锐,何川.基于BERT-AWC的文本分类方法研究[J].微电子学与计算机,2022,39(6):41-50. 被引量：1
2曾祥新,陶然,刘慧慧,杨添淞,吕晓琳,李佳诺,韩名媛,祁美慧,吴月妮,孙芳瑞,孙忠人.基于CiteSpace探讨针灸治疗慢性疲劳综合征的研究热点和趋势[J].神经损伤与功能重建,2022,17(5):269-274. 被引量：6
3陈坚光.在思辨阅读中提升学生的理解能力[J].小学教学参考,2022(13):25-27.
4刘魁雯.信息技术在水文勘测工作中的实施与应用[J].乡镇企业导报,2021(3):132-133.
5闫锁田.打好学生全面成长的文化底色——天水市建设路第三小学文化育人活动纪实[J].甘肃教育,2022(2):10-11. 被引量：1
6沈阳市艺术幼儿师范学校[J].招生考试通讯（中考版）,2021(7):66-66.
7李军,江水,徐启胜,李岩.基于VMD分解与卷积神经网络的液压泵故障诊断[J].锻压装备与制造技术,2022,57(3):82-87. 被引量：2
8沈阳市艺术幼儿师范学校[J].招生考试通讯（中考版）,2021(8):66-66.
9许一星.立足语文要素,找准语用训练落脚点[J].福建教育研究,2022(6):50-51.
10徐嘉昕,钱凯,蒋立虹.机器学习算法在肺癌临床诊断及生存预后分析中的应用[J].中国胸心血管外科临床杂志,2022,29(6):777-781. 被引量：4

集成电路应用

2022年第5期

浏览历史

内容加载中请稍等...

智能算法在中文数据集上的文本匹配训练方法

参考文献1

共引文献29

相关作者

相关机构

相关主题

浏览历史