期刊文献+
共找到333篇文章
< 1 2 17 >
每页显示 20 50 100
基于BERT模型自适应的科技项目申报书关键文本抽取方法
1
作者 徐晨阳 李子伦 +1 位作者 张兆娜 杨冬菊 《科技通报》 2025年第1期8-14,共7页
科技项目申报书内容涵盖了科技领域主要的研究方向和创新性。为提升科技领域项目文本关键内容的抽取效果,本文提出了一种基于BERT(bidirectional encoder representations from transformers)模型自适应的科技项目申报书关键文本抽取方... 科技项目申报书内容涵盖了科技领域主要的研究方向和创新性。为提升科技领域项目文本关键内容的抽取效果,本文提出了一种基于BERT(bidirectional encoder representations from transformers)模型自适应的科技项目申报书关键文本抽取方法。在该方法中,首先进行原始文本的预处理;其次,将BERT和伪标签相结合进行模型训练,并构建自适应阈值确保模型训练最优化;最后,本文将模型工程化,进行实际应用。通过实验对比验证:提出的方法在文本抽取过程中表现出良好的性能,数据标注准确度随着数据规模不断增大而呈现提升;该方法在准确率、精确率、召回率与F1值等方面,均优于模型LSTM+SAT(long short-term memory+short-term memery)和模型BERT+PL(BERT+pseudo label)。 展开更多
关键词 bert模型 自适应 伪标签 文本抽取 模型训练
下载PDF
基于BERT模型的空管危险源文本数据挖掘
2
作者 杨昌其 姜美岑 林灵 《航空计算技术》 2024年第4期89-93,共5页
由于危险源与安全隐患在民航安全管理工作中容易出现概念混淆和记录混乱的情况,根据双重预防机制管理规定,需要将两者区分开来。通过在ASIS系统上采集得到空管危险源控制清单作为研究对象,并对其进行相应的文本数据挖掘工作。根据危险... 由于危险源与安全隐患在民航安全管理工作中容易出现概念混淆和记录混乱的情况,根据双重预防机制管理规定,需要将两者区分开来。通过在ASIS系统上采集得到空管危险源控制清单作为研究对象,并对其进行相应的文本数据挖掘工作。根据危险源与安全隐患特点构建相应的文本分类模型:首先通过文本清洗、去停用词、Jieba分词等对空管危险源控制清单进行预处理,然后基于BERT模型生成词向量,采用BERT-Base-Chinese预训练模型进行预训练,并对模型进行微调超参数,最后结合Softmax分类器得到分类结果。 展开更多
关键词 文本分类 数据挖掘 bert模型 危险源 安全隐患
下载PDF
基于BERT模型的源代码漏洞检测技术研究
3
作者 罗乐琦 张艳硕 +2 位作者 王志强 文津 薛培阳 《信息安全研究》 CSCD 北大核心 2024年第4期294-301,共8页
源代码漏洞检测常使用代码指标、机器学习和深度学习等技术.但是这些技术存在无法保留源代码中的句法和语义信息、需要大量专家知识对漏洞特征进行定义等问题.为应对现有技术存在的问题,提出基于BERT(bidirectional encoder representat... 源代码漏洞检测常使用代码指标、机器学习和深度学习等技术.但是这些技术存在无法保留源代码中的句法和语义信息、需要大量专家知识对漏洞特征进行定义等问题.为应对现有技术存在的问题,提出基于BERT(bidirectional encoder representations from transformers)模型的源代码漏洞检测模型.该模型将需要检测的源代码分割为多个小样本,将每个小样本转换成近似自然语言的形式,通过BERT模型实现源代码中漏洞特征的自动提取,然后训练具有良好性能的漏洞分类器,实现Python语言多种类型漏洞的检测.该模型在不同类型的漏洞中实现了平均99.2%的准确率、97.2%的精确率、96.2%的召回率和96.7%的F1分数的检测水平,对比现有的漏洞检测方法有2%~14%的性能提升.实验结果表明,该模型是一种通用的、轻量级的、可扩展的漏洞检测方法. 展开更多
关键词 漏洞检测 深度学习 PYTHON语言 bert模型 自然语言处理
下载PDF
基于改进BERT模型的连续血压的预测方法研究
4
作者 郭子玉 周亚晶 《黑龙江大学自然科学学报》 CAS 2024年第2期157-162,共6页
目前高血压已成为严重危害全球公共健康的重大问题。区别于传统的侵入式和袖带法的血压测量方式,为实时监测血压并助力早期诊断,本文专注于研究脉搏波波形与血压之间的内在关系,并提出了一种使用脉搏波的基于改进BERT(Bidirectional enc... 目前高血压已成为严重危害全球公共健康的重大问题。区别于传统的侵入式和袖带法的血压测量方式,为实时监测血压并助力早期诊断,本文专注于研究脉搏波波形与血压之间的内在关系,并提出了一种使用脉搏波的基于改进BERT(Bidirectional encoder representationns from transformers)模型的血压预测方法。方法首先应用巴特沃斯滤波器对原始脉搏波信号进行滤波预处理并周期性划分,然后结合深度学习技术,采用改进后的BERT模型,对划分后的脉搏波周期数据进行特征提取和分析。为验证本方法预测的有效性和准确性,采用MIMIC-Ⅲ数据库的数据进行实验。实验结果表明,本方法可以有效预测血压值,完全满足英国高血压学会的A类标准。通过深入研究脉搏波与血压的关系,本文改进BERT模型为高血压的预测与诊断提供了新的技术手段。 展开更多
关键词 血压预测 脉搏波 巴特沃斯滤波 改进bert模型
下载PDF
基于BERT模型的生成式自动文本摘要
5
作者 周圆 张琨 +2 位作者 陈智源 江浩俊 方自正 《计算机与数字工程》 2024年第10期3052-3058,共7页
随着深度学习的不断发展,预训练语言模型在自然语言处理领域已经取得了良好的效果。当然,自动文本摘要作为自然语言处理领域的重要研究方向之一也得益于大规模预训练语言模型。尤其在生成式文本摘要方面,利用大规模预训练语言模型,生成... 随着深度学习的不断发展,预训练语言模型在自然语言处理领域已经取得了良好的效果。当然,自动文本摘要作为自然语言处理领域的重要研究方向之一也得益于大规模预训练语言模型。尤其在生成式文本摘要方面,利用大规模预训练语言模型,生成一段能较为准确地反映原文主旨信息的摘要。但是目前的研究还存在一些问题,比如对原文档的语义信息了解不够充分,无法对多义词进行有效表征,生成的摘要存在重复内容,且逻辑性不强等。为了缓解上述问题,论文基于BERT预训练语言模型提出一种新的生成式文本摘要模型TextRank-BERT-PGN-Coverage(TBPC)。该模型利用经典的Encoder-Decoder框架,预训练权重并生成摘要。该实验采用CNN/Daily Mail数据集作为实验所用数据集,实验结果表明,与该领域目前已有的研究结果相比,论文提出的模型取得了较好的实验效果。 展开更多
关键词 生成式文本摘要 TextRank算法 bert模型 指针生成网络 覆盖机制
下载PDF
基于BERT模型的航空评论数据情感分析研究 被引量:1
6
作者 韩光 高明 钟佳晨 《微型电脑应用》 2024年第6期250-252,共3页
在航空服务的选择过程中,用户通常通过查看海量评论信息进行判断。然而,随着评论数据剧增和数据采集手段的提升,如何快速从评论中提取有效用户情感信息的难度也不断上升。基于BERT模型设计出一种针对航空评论数据的情感分析方法。在真... 在航空服务的选择过程中,用户通常通过查看海量评论信息进行判断。然而,随着评论数据剧增和数据采集手段的提升,如何快速从评论中提取有效用户情感信息的难度也不断上升。基于BERT模型设计出一种针对航空评论数据的情感分析方法。在真实的航空评论数据集上,该方法准确率能够达到0.8141,可在一定程度上降低购票风险,提升航空公司服务质量。 展开更多
关键词 航空评论数据 情感分析 bert模型
下载PDF
基于BERT模型的网络文本地理信息命名实体识别
7
作者 王立 严霞 +2 位作者 王斌 杨杰 汪玉翔 《制造业自动化》 2024年第5期145-150,共6页
随着互联网的快速发展,网络文本蕴含的地理信息日益丰富。由于网络文本具有数量庞大、动态性强的特点,地理实体的种类和数量也在激增。然而,现有的地理信息命名实体识别研究能够识别的实体类型极其有限。针对此问题,将BERT-BiGRU-CRF模... 随着互联网的快速发展,网络文本蕴含的地理信息日益丰富。由于网络文本具有数量庞大、动态性强的特点,地理实体的种类和数量也在激增。然而,现有的地理信息命名实体识别研究能够识别的实体类型极其有限。针对此问题,将BERT-BiGRU-CRF模型作为命名实体识别模型,以地理信息领域学术论文作为知识库来源,对行政区划实体、林地实体、交通实体及水域实体进行识别。实验结果表明,该模型在上述四种实体识别任务中取得的F1值均超过了90%,其中行政区划实体识别的效果最佳。模型整体F1值达到92.26%,优于传统的命名实体识别模型BiGRU、CRF及BiGRU-CRF模型。 展开更多
关键词 bert模型 命名实体识别 地理信息 BiGRU-CRF模型
下载PDF
云计算中基于BERT模型的文本分析与处理
8
作者 白佳璐 《信息记录材料》 2024年第6期208-210,共3页
本研究针对云计算环境中文本处理的需求,提出了一种基于双向编码器表示转换器(bidirectional encoder representation from transformers,BERT)的并行化方法。首先,介绍了BERT模型的基本原理以及编码器组成的Transformer结构,并对文本... 本研究针对云计算环境中文本处理的需求,提出了一种基于双向编码器表示转换器(bidirectional encoder representation from transformers,BERT)的并行化方法。首先,介绍了BERT模型的基本原理以及编码器组成的Transformer结构,并对文本进行标记化和上下文建模的机制;其次,本研究关注文本在云计算环境下的处理效率,提出了一种并行化的BERT模型优化策略,并通过对文本进行预处理、分割和标记化,实现了对BERT模型的并行计算,以提高在大规模文本数据上的计算效率;最后,为验证所提出方法的有效性,本文选用了CoNLL2003数据集进行实验。实验结果表明,相较于串行模型,并行BERT模型在准确率、召回率和F1值上均有显著提升,其优于串行模型的原因包括计算效率提升、全局上下文建模、资源利用率提高和更强泛化能力等方面。 展开更多
关键词 bert模型 文本分析 并行 云计算
下载PDF
语义相似度与BERT模型融合的多标签文本自适应分类方法
9
作者 张红 《微型电脑应用》 2024年第3期49-52,共4页
针对文本搜索需求难以判断、文本难以分类的问题,研究语义相似度与双向语言编码器(BERT)模型融合的多标签文本自适应分类方法。先预处理文本并确定文本表示形式,基于信息增益理论提取并降维处理文本特征,依据语义相似度理论计算文本之... 针对文本搜索需求难以判断、文本难以分类的问题,研究语义相似度与双向语言编码器(BERT)模型融合的多标签文本自适应分类方法。先预处理文本并确定文本表示形式,基于信息增益理论提取并降维处理文本特征,依据语义相似度理论计算文本之间相似度,再引入BERT模型搭建多标签文本自适应分类框架,通过对抗训练获取模型最佳参数,将待分类文本输入至训练好文本分类BERT模型中,即可实现多标签文本的自适应分类。实验数据显示应用提出方法获得F 1参量大于给定最小限值,汉明损失参量HL小于给定最大限值,充分证实了提出方法文本分类效果较佳。 展开更多
关键词 bert模型 多标签 语义相似度 文本分类
下载PDF
基于Bert模型对不完整事件日志的多属性修复
10
作者 张振虎 王丽丽 《洛阳师范学院学报》 2024年第2期17-22,共6页
流程挖掘是从事件日志中自动构建流程模型,并利用其分析、增强、监测实际的业务流程.然而不完整的事件日志会严重影响流程挖掘的结果.因此,修复事件日志是提高过程挖掘结果准确性的举措之一.现有的修复事件日志技术主要修复事件日志中... 流程挖掘是从事件日志中自动构建流程模型,并利用其分析、增强、监测实际的业务流程.然而不完整的事件日志会严重影响流程挖掘的结果.因此,修复事件日志是提高过程挖掘结果准确性的举措之一.现有的修复事件日志技术主要修复事件日志中的缺失活动,很少考虑修复日志中多个缺失的属性.现实中日志除了活动缺失,还存在属性缺失现象.针对此问题,提出了一种基于Bert的神经网络模型,用来修复事件中多个属性的缺失.该方法从数据的角度出发,通过Bert模型的预训练任务学习事件中属性之间的依赖关系,根据属性的前后文信息预测缺失的属性值.最后使用公开可用的真实事件日志对所提出的方法进行实验评估,评估结果表明本文所提出方法可以修复事件日志中多属性的缺失,且验证了该方法的准确性. 展开更多
关键词 修复事件日志 缺失属性 bert模型 预训练任务 多属性修复
下载PDF
基于BERT模型的智能化测试平台架构设计与优化
11
作者 江朝麟 《软件》 2024年第11期184-186,共3页
当前,软件测试作为确保软件产品质量的关键环节,正面临着前所未有的挑战。随着软件功能的日益复杂和发布周期的缩短,传统的手动测试方法已经难以满足高效、准确的测试需求,构建智能化测试平台成为解决这一问题的有效途径。本文提出了一... 当前,软件测试作为确保软件产品质量的关键环节,正面临着前所未有的挑战。随着软件功能的日益复杂和发布周期的缩短,传统的手动测试方法已经难以满足高效、准确的测试需求,构建智能化测试平台成为解决这一问题的有效途径。本文提出了一种基于BERT模型的智能化测试平台架构设计,该平台能够利用BERT的强大语义理解能力,实现测试用例的自动生成、优先级排序、缺陷预测以及测试结果的深入分析。首先,介绍了智能化测试平台的背景和必要性,详细阐述了BERT模型的基本原理和特点。其次,提出了一个包含数据预处理、BERT模型集成、测试用例生成、测试执行与监控、测试结果分析与优化等关键组件的智能化测试平台架构。再次,探讨了针对特定测试任务对BERT模型进行微调、多模态数据融合以及持续学习与更新等优化策略。最后,总结了基于BERT模型的智能化测试平台在提高软件测试效率和准确性方面的潜力。 展开更多
关键词 bert模型 智能化测试 平台架构
下载PDF
基于BERT模型的电网基建工程知识图谱特征提取方法
12
作者 黄为 张莉 《科学技术创新》 2024年第19期29-32,共4页
由于电网基建工程涉及因素较多,导致在对其知识图谱特征进行提取时,F1值难以得到保障,为此,本文章提出基于BERT模型的电网基建工程知识图谱特征提取方法研究。以RDF模型为基础,构建了以三元组为基本单元的电网基建工程知识图谱模型;通... 由于电网基建工程涉及因素较多,导致在对其知识图谱特征进行提取时,F1值难以得到保障,为此,本文章提出基于BERT模型的电网基建工程知识图谱特征提取方法研究。以RDF模型为基础,构建了以三元组为基本单元的电网基建工程知识图谱模型;通过关系(即边)之间的联系,实现对电网基建工程知识图谱目标特征的有效提取。在测试结果中,设计方法对于不同特征,对应的提取结果F1值基本稳定在0.90以上,最大值达到了0.94,与对照组相比,在稳定性和有效性方面具有较为明显的优势。 展开更多
关键词 bert模型 电网基建工程知识图谱 特征提取 工程实体 关联关系 三元组 数据解析
下载PDF
基于BERT模型的自动问答系统的设计与实现
13
作者 周巧扣 《现代信息科技》 2024年第20期83-86,共4页
为解决在线课程学习过程中所遇问题得不到及时解答的情况,设计并实现在线课程自动问答系统。首先收集课程中真实问题作为训练数据集,其次基于BERT模型构建双塔神经网络模型,将问题成对输入模型,以语义相似问题的特征向量尽可能相似为训... 为解决在线课程学习过程中所遇问题得不到及时解答的情况,设计并实现在线课程自动问答系统。首先收集课程中真实问题作为训练数据集,其次基于BERT模型构建双塔神经网络模型,将问题成对输入模型,以语义相似问题的特征向量尽可能相似为训练目的。训练模型中的参数后,准确率和F1-Score性能指标上的值分别达到0.931和0.918。使用训练好的模型将问题集和学习者提出的问题都转为特征向量,使用Faiss召回问题特征向量集中与学习者的问题最相似的问题,最后返回最相似的问题所对应的答案。系统具有较高的准确性和有效性,能够为在线课程学习提供支持。 展开更多
关键词 自动问答系统 bert模型 语义相似度 在线学习
下载PDF
基于BERT模型的中文期刊文献自动分类实践研究 被引量:11
14
作者 沈立力 姜鹏 王静 《图书馆杂志》 CSSCI 北大核心 2022年第5期109-118,135,共11页
Google AI团队发布的BERT模型在多项自然语言处理任务中取得了研究成果,但在中文文献自动分类领域尚有待探索。本文旨在探索BERT;中文基础模型在中文社科、科技期刊文献分类上的实际分类效果,指出模型在实际应用中存在的问题并提出解决... Google AI团队发布的BERT模型在多项自然语言处理任务中取得了研究成果,但在中文文献自动分类领域尚有待探索。本文旨在探索BERT;中文基础模型在中文社科、科技期刊文献分类上的实际分类效果,指出模型在实际应用中存在的问题并提出解决方法。本文选取R大类(医药、卫生)、TG大类(金属学与金属工艺)、F大类(经济)、J大类(艺术)共1 745 000条数据作为训练语料,并以另外9 610条数据作为测试样本,利用BERT模型分别对社科、科技期刊文献进行分类研究。测试结果表明BERT模型在社科文献中的四级准确率为76.95%,科技文献为68.55%。之后引入惩罚策略,为实际工作中免检数据阈值的设定提供参考。BERT;模型在《全国报刊索引》实际分类标引工作中有一定可行性,基本满足当前网络环境下中文文献自动分类的需求。 展开更多
关键词 bert模型 深度学习 文献分类 《中国图书馆分类法》
下载PDF
基于BERT模型的“互联网+政务”群众留言文本热点追踪研究 被引量:10
15
作者 徐绪堪 印家伟 王晓娇 《情报杂志》 CSSCI 北大核心 2022年第9期136-142,78,共8页
[研究目的]大数据时代,提升政府治理能力和人民群众生活幸福感是各级政府核心任务,尤其是从群众留言文本中获取民众关注的热点问题,从而快速响应并及时解决群众反馈的问题,从群众留言文本中提取有价值的热点对政府部门显得尤其紧迫和必... [研究目的]大数据时代,提升政府治理能力和人民群众生活幸福感是各级政府核心任务,尤其是从群众留言文本中获取民众关注的热点问题,从而快速响应并及时解决群众反馈的问题,从群众留言文本中提取有价值的热点对政府部门显得尤其紧迫和必要。[研究方法]以从上海市政府信箱、上海市委信箱、上海信访的“互联网+政务”网络平台爬取的群众留言29074条数据为研究对象,对比分析BERT、LSTM以及FastText三个模型的分类效果,选择BERT模型构建群众留言热点追踪框架,对反馈最多的住房规划、医疗卫生和交通出行三类问题使用Affinity Propagation聚类算法与BERT实体命名识别相结合的方式对每个分类下的问题进行聚类,最后通过聚类形成的问题进行热度计算得出群众反馈的热点问题。[研究结论]从热点追踪的结果可知住房安全、疫情防控和两港快线设立分别为住房规划、医疗卫生和交通出行三类留言中讨论热度最高的问题,据此提出针对性建议。 展开更多
关键词 bert模型 互联网+政务 群众留言 Affinity Propagation聚类方法 文本分类
下载PDF
基于BERT模型的排比句自动识别方法 被引量:2
16
作者 朱晓亮 谯宇同 《计算机应用与软件》 北大核心 2021年第7期153-158,共6页
排比句的条理清晰、气势宏大,为各类文体的写作所广泛使用,但目前排比句自动识别方法的识别效率欠佳。采用深度学习的方法来优化排比句的自动识别;设计融合预处理算法与BERT模型的排比句自动识别方法,提升模型的整体表现。针对作文数据... 排比句的条理清晰、气势宏大,为各类文体的写作所广泛使用,但目前排比句自动识别方法的识别效率欠佳。采用深度学习的方法来优化排比句的自动识别;设计融合预处理算法与BERT模型的排比句自动识别方法,提升模型的整体表现。针对作文数据集的测试结果表明,其识别效果和计算性能均有所改善,从而验证了该方法的有效性。 展开更多
关键词 作文 排比句 自动抽取 bert模型
下载PDF
基于BERT模型的投资者情绪指数建模及与价格关系分析 被引量:2
17
作者 林杰 江晨曦 《上海管理科学》 2020年第4期75-80,共6页
基于BERT模型,应用21家期货公司行情预测分析文本数据,构建了期货市场投资者情绪指数;在此基础上,运用格兰杰因果检验分析了期货市场价格与市场情绪指数的相互影响作用。研究结果表明,BERT模型相较基于经典分类算法模型在各评价指标上... 基于BERT模型,应用21家期货公司行情预测分析文本数据,构建了期货市场投资者情绪指数;在此基础上,运用格兰杰因果检验分析了期货市场价格与市场情绪指数的相互影响作用。研究结果表明,BERT模型相较基于经典分类算法模型在各评价指标上均有约10%的提升。同时,投资者情绪指数与期货收盘价之间存在相互影响,期货收盘价对投资者情绪的影响程度更大,影响持续时间更短。 展开更多
关键词 投资者情绪指数 bert模型 期货市场 文本情感分类
下载PDF
基于领域BERT模型的服务文本分类方法 被引量:2
18
作者 闫云飞 孙鹏 +2 位作者 张杰勇 马钰棠 赵亮 《空军工程大学学报》 CSCD 北大核心 2023年第1期103-111,共9页
针对BERT模型领域适应能力较差,无法解决训练数据类别数量不均衡和分类难易不均衡等问题,提出一种基于WBBI模型的服务文本分类方法。首先通过TF-IDF算法提取领域语料中的词汇扩展BERT词表,提升了BERT模型的领域适应性;其次,通过建立的BE... 针对BERT模型领域适应能力较差,无法解决训练数据类别数量不均衡和分类难易不均衡等问题,提出一种基于WBBI模型的服务文本分类方法。首先通过TF-IDF算法提取领域语料中的词汇扩展BERT词表,提升了BERT模型的领域适应性;其次,通过建立的BERT-BiLSTM模型实现服务文本分类;最后,针对数据集的类别数量不均衡和分类难易不均衡问题,在传统焦点损失函数的基础上提出了一种可以根据样本不均衡性特点动态调整的变焦损失函数。为了验证WBBI模型的性能,在互联网获取的真实数据集上进行了大量对比试验,实验结果表明:WBBI模型与通用文本分类模型TextCNN、BiLSTM-attention、RCNN、Transformer相比Macro-F1值分别提高了4.29%、6.59%、5.3%和43%;与基于BERT的文本分类模型BERT-CNN、BERT-DPCNN相比,WBBI模型具有更快的收敛速度和更好的分类效果。 展开更多
关键词 服务分类 文本分类 bert模型 双向长短时记忆网络(BiLSTM) 焦点损失函数
下载PDF
基于BERT模型的航天科技开源情报分类 被引量:4
19
作者 孔凡芃 刘旭红 +1 位作者 刘秀磊 李晗 《北京信息科技大学学报(自然科学版)》 2021年第1期28-33,共6页
提出一种基于BERT模型的航天科技开源情报分类算法。通过双向Transformer机制捕捉航天科技开源情报中句子间的关系;采用Multi-head Self-attention机制关注文本中的大量专有名词;结合Softmax分类器对提取的特征进行分类。与TextRCNN、DP... 提出一种基于BERT模型的航天科技开源情报分类算法。通过双向Transformer机制捕捉航天科技开源情报中句子间的关系;采用Multi-head Self-attention机制关注文本中的大量专有名词;结合Softmax分类器对提取的特征进行分类。与TextRCNN、DPCNN等主流语言模型相比,该算法在测试集上的准确率分别提升1.7%、3.33%,验证了该算法在航天科技开源情报分类上的有效性。 展开更多
关键词 文本分类 bert模型 航天科技 开源情报
下载PDF
基于BERT模型的图书表示学习与多标签分类研究 被引量:8
20
作者 蒋彦廷 胡韧奋 《新世纪图书馆》 CSSCI 2020年第9期38-44,共7页
中文图书细粒度多标签分类的自动化,有利于促进图书的检索与学科的沟通。文章充分发挥BERT语言模型的微调特性,提出一种通过21类粗粒度分类微调语言模型,学习到更好的图书表示,进而实现细粒度分类的新策略。结果显示,在单标签的分类任务... 中文图书细粒度多标签分类的自动化,有利于促进图书的检索与学科的沟通。文章充分发挥BERT语言模型的微调特性,提出一种通过21类粗粒度分类微调语言模型,学习到更好的图书表示,进而实现细粒度分类的新策略。结果显示,在单标签的分类任务上,BERT模型的正确率分别较LSTM与Fasttext模型提升约4.9%与2.0%。KNN-ML对257类的细粒度多标签分类证明了前期微调的有效性。最佳情况下,有75.82%的图书细粒度类别恰好全部预测正确,92.10%的图书至少被正确预测了一个细粒度类别。因此可以得出结论,该系统有助于实现图书自动的细粒度归类,并帮助图书标引者补充合理的分类号。 展开更多
关键词 中文图书 bert模型 深度学习 微调策略 多标签分类
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部