期刊文献+
共找到1,465篇文章
< 1 2 74 >
每页显示 20 50 100
基于Sentence-BERT与孤立森林算法的专利新颖性评估
1
作者 邓娜 王雨佳 +1 位作者 杨洋 陈旭 《情报杂志》 北大核心 2025年第2期174-182,共9页
进行关键技术抽取作为实施方法特征;其次,采用Sentence-BERT对上述特征进行文本向量化表示后组合输入至孤立森林算法获得离群专利集;最后,通过技术量权值过滤法提高专利新颖性评估的精度。以金融科技领域专利进行实证研究,结果表明,该... 进行关键技术抽取作为实施方法特征;其次,采用Sentence-BERT对上述特征进行文本向量化表示后组合输入至孤立森林算法获得离群专利集;最后,通过技术量权值过滤法提高专利新颖性评估的精度。以金融科技领域专利进行实证研究,结果表明,该评估方法准确率相较专业专利分析平台方法提升了9%~11%。证明了该方法在专利新颖性评估中的有效性,能为后续专利审核工作和高价值专利分析提供参考。 展开更多
关键词 专利评估 专利新颖性 BiLSTM-CRF Sentence-bert 孤立森林算法 机器学习
下载PDF
一种基于注意力机制的BERT-CNN-GRU检测方法
2
作者 郑雅洲 刘万平 黄东 《计算机工程》 北大核心 2025年第1期258-268,共11页
针对现有检测方法对短域名检测性能普遍较差的问题,提出一种BERT-CNN-GRU结合注意力机制的检测方法。通过BERT提取域名的有效特征和字符间组成逻辑,根据并行的融合简化注意力的卷积神经网络(CNN)和基于多头注意力机制的门控循环单元(GRU... 针对现有检测方法对短域名检测性能普遍较差的问题,提出一种BERT-CNN-GRU结合注意力机制的检测方法。通过BERT提取域名的有效特征和字符间组成逻辑,根据并行的融合简化注意力的卷积神经网络(CNN)和基于多头注意力机制的门控循环单元(GRU)提取域名深度特征。CNN使用n-gram排布的方式提取不同层次的域名信息,并采用批标准化(BN)对卷积结果进行优化。GRU能够更好地获取前后域名的组成差异,多头注意力机制在捕获域名内部的组成关系方面表现出色。将并行检测网络输出的结果进行拼接,最大限度地发挥两种网络的优势,并采用局部损失函数聚焦域名分类问题,提高分类性能。实验结果表明,该方法在二分类上达到了最优效果,在短域名多分类数据集上15分类的加权F1值达到了86.21%,比BiLSTM-Seq-Attention模型提高了0.88百分点,在UMUDGA数据集上50分类的加权F1值达到了85.51%,比BiLSTM-Seq-Attention模型提高了0.45百分点。此外,该模型对变体域名和单词域名生成算法(DGA)检测性能较好,具有处理域名数据分布不平衡的能力和更广泛的检测能力。 展开更多
关键词 恶意短域名 bert预训练 批标准化 注意力机制 门控循环单元 并行卷积神经网络
下载PDF
基于MD-BERT-LGBM的智能诊疗与预测模型设计
3
作者 岳晓磊 刘欣 《信息技术》 2025年第1期126-132,共7页
针对目前医疗资源紧张且难以实现精准预测病情发展的问题,文中提出了一种基于MD-BERT-LGBM的智能诊疗与预测模型。该模型引入了多模态高维度向量来表征信息,以此提高模型精确度。采用双向编码BERT替代传统的CNN算法来处理文本信息数据,... 针对目前医疗资源紧张且难以实现精准预测病情发展的问题,文中提出了一种基于MD-BERT-LGBM的智能诊疗与预测模型。该模型引入了多模态高维度向量来表征信息,以此提高模型精确度。采用双向编码BERT替代传统的CNN算法来处理文本信息数据,同时在每个BERT模块内融合了KMP识别算法。通过归一化指数函数来预训练和校准BERT模型,用LGBM机器学习算法高效地处理表征多模态高维度向量数据。多组实验测试结果表明,与同类的CNN-MDRP模型相比,所提模型的诊疗与预测精确度分别提升了1.1%和4.0%,具有良好的可靠性。 展开更多
关键词 智能诊疗 预测模型 bert-LGBM 机器学习 多模态
下载PDF
基于BERT与要素提取的相似案例匹配
4
作者 焦宇超 阎刚 《智能计算机与应用》 2025年第1期130-135,共6页
相似法律案件检索是一项特殊的检索任务,对于给定的查询案例,需要从给定的候选案例中搜索相似的案例。与传统的文本匹配不同,法律案件匹配具有文本较长、主题性强的特点。针对上述问题,本文提出了一种基于案件要素的相似案例检索方法。... 相似法律案件检索是一项特殊的检索任务,对于给定的查询案例,需要从给定的候选案例中搜索相似的案例。与传统的文本匹配不同,法律案件匹配具有文本较长、主题性强的特点。针对上述问题,本文提出了一种基于案件要素的相似案例检索方法。首先对BERT模型使用通用语料进行微调;然后采用段落聚合方法,对案件文书上下文语义信息进行编码,同时将法律文书数据融入模型。本文在LeCaRD数据集上进行了广泛的实验,实验结果表明,本文提出的模型优于现有模型。 展开更多
关键词 相似案例匹配 bert 长文本 法律要素
下载PDF
面向跨提示中文作文自动评分的多尺度BERT-wwm模型
5
作者 赵国良 陈亮 王珺琳 《通信与信息技术》 2025年第1期114-117,共4页
跨提示中文作文自动评分任务是真实教育环境中广泛应用的方法,然而,在使用预训练模型实现的过程中主要涉及两个问题,一是不同提示提取的文本特征差异,限制模型在其他提示上的泛化能力;二是传统BERT预训练模型的分词方法未能充分考虑中... 跨提示中文作文自动评分任务是真实教育环境中广泛应用的方法,然而,在使用预训练模型实现的过程中主要涉及两个问题,一是不同提示提取的文本特征差异,限制模型在其他提示上的泛化能力;二是传统BERT预训练模型的分词方法未能充分考虑中文分词的需求。针对这些问题,一方面,使用基于BERT模型的多尺度文本表示方法,从文章、段落和标记三个不同尺度来提取文本特征,增强提取通用文本特征的能力;另一方面,使用中文BERT-wwm模型来增强模型对中文语义的理解能力,该模型采用全词掩码的预训练方式,解决BERT模型难以理解复杂中文语法和逻辑的问题。实验结果表明,在自制数据集中,模型的预测得分与真实人工评分具有较高的一致性,达到0.736,并在文本特征高度差异化的题材中表现良好。 展开更多
关键词 跨提示作文自动评分 自然语言处理 深度学习 bert
下载PDF
基于LDA-BERT相似性测度模型的文本主题演化研究 被引量:3
6
作者 海骏林峰 严素梅 +1 位作者 陈荣 李建霞 《图书馆工作与研究》 CSSCI 北大核心 2024年第1期72-79,共8页
文章针对LDA主题模型在提取文本主题时忽略文本语义关联的问题,提出基于LDA-BERT的相似性测度模型:首先,结合利用TF-IDF和TextRank方法提取文本特征词,利用LDA主题模型挖掘文本主题;其次,通过嵌入BERT模型,结合LDA主题模型构建的主题-... 文章针对LDA主题模型在提取文本主题时忽略文本语义关联的问题,提出基于LDA-BERT的相似性测度模型:首先,结合利用TF-IDF和TextRank方法提取文本特征词,利用LDA主题模型挖掘文本主题;其次,通过嵌入BERT模型,结合LDA主题模型构建的主题-主题词概率分布,从词粒度层面表示主题向量;最后,利用余弦相似度算法计算主题之间的相似度。在相似性测度模型基础上构建向量相似度指标分析文献研究主题之间的关联,并绘制主题演化知识图谱。通过智慧图书馆领域的实证研究发现,使用LDA-BERT模型计算出的主题相似度结果相较于LDA主题模型的计算结果更加准确,与实际情况更相符。 展开更多
关键词 相似性测度 LDA-bert模型 LDA模型 bert模型 主题演化
下载PDF
DPAL-BERT:A Faster and Lighter Question Answering Model
7
作者 Lirong Yin Lei Wang +8 位作者 Zhuohang Cai Siyu Lu Ruiyang Wang Ahmed AlSanad Salman A.AlQahtani Xiaobing Chen Zhengtong Yin Xiaolu Li Wenfeng Zheng 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第10期771-786,共16页
Recent advancements in natural language processing have given rise to numerous pre-training language models in question-answering systems.However,with the constant evolution of algorithms,data,and computing power,the ... Recent advancements in natural language processing have given rise to numerous pre-training language models in question-answering systems.However,with the constant evolution of algorithms,data,and computing power,the increasing size and complexity of these models have led to increased training costs and reduced efficiency.This study aims to minimize the inference time of such models while maintaining computational performance.It also proposes a novel Distillation model for PAL-BERT(DPAL-BERT),specifically,employs knowledge distillation,using the PAL-BERT model as the teacher model to train two student models:DPAL-BERT-Bi and DPAL-BERTC.This research enhances the dataset through techniques such as masking,replacement,and n-gram sampling to optimize knowledge transfer.The experimental results showed that the distilled models greatly outperform models trained from scratch.In addition,although the distilled models exhibit a slight decrease in performance compared to PAL-BERT,they significantly reduce inference time to just 0.25%of the original.This demonstrates the effectiveness of the proposed approach in balancing model performance and efficiency. 展开更多
关键词 DPAL-bert question answering systems knowledge distillation model compression bert Bi-directional long short-term memory(BiLSTM) knowledge information transfer PAL-bert training efficiency natural language processing
下载PDF
基于BERT模型的医疗安全事件智能分类研究与实践 被引量:1
8
作者 赵从朴 袁达 +3 位作者 朱溥珏 周炯 陈政 彭华 《医学信息学杂志》 CAS 2024年第1期27-32,38,共7页
目的/意义改进医疗安全事件分类评估模式,提升工作效率和时效性。方法/过程选取既往医疗安全事件数据进行预处理,利用BERT模型进行训练、测试、迭代优化,构建医疗安全事件智能分类预测模型。结果/结论利用该模型对2022年1-11月临床科室... 目的/意义改进医疗安全事件分类评估模式,提升工作效率和时效性。方法/过程选取既往医疗安全事件数据进行预处理,利用BERT模型进行训练、测试、迭代优化,构建医疗安全事件智能分类预测模型。结果/结论利用该模型对2022年1-11月临床科室上报的466例医疗安全事件进行分类,F1值达0.66。将BERT模型应用于医疗安全事件分类评估辅助,可提升工作效率和时效性,有助于及时干预医疗安全风险隐患。 展开更多
关键词 医疗安全事件 bert 深度学习 智能分类
下载PDF
基于BERT-BiLSTM-CRF模型的油气领域命名实体识别 被引量:6
9
作者 高国忠 李宇 +1 位作者 华远鹏 吴文旷 《长江大学学报(自然科学版)》 2024年第1期57-65,共9页
针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from... 针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from transformers)预训练模型得到输入序列语义的词向量;然后将训练后的词向量输入双向长短期记忆网络(bi-directional long short-term memory,BiLSTM)模型进一步获取上下文特征;最后根据条件随机场(conditional random fields,CRF)的标注规则和序列解码能力输出最大概率序列标注结果,构建油气领域命名实体识别模型框架。将BERT-BiLSTM-CRF模型与其他2种命名实体识别模型(BiLSTM-CRF、BiLSTM-Attention-CRF)在包括3万多条文本语料数据、4类实体的自建数据集上进行了对比实验。实验结果表明,BERT-BiLSTM-CRF模型的准确率(P)、召回率(R)和F_(1)值分别达到91.3%、94.5%和92.9%,实体识别效果优于其他2种模型。 展开更多
关键词 油气领域 命名实体识别 bert 双向长短期记忆网络 条件随机场 bert-BiLSTM-CRF模型
下载PDF
基于BERT-LDA的国外LIS领域学科交叉研究演化分析与前沿主题识别 被引量:1
10
作者 袁毅 孟盈 《数字图书馆论坛》 CSSCI 2024年第9期1-15,共15页
识别学科交叉研究的前沿主题,并对演化趋势进行分析,有助于揭示学科交叉融合的方向,为未来创新性、突破性研究提供参考。首先,基于引文视角构建测度论文学科交叉性的指标,识别具有学科交叉性的研究论文;其次,通过BERT-LDA模型识别研究主... 识别学科交叉研究的前沿主题,并对演化趋势进行分析,有助于揭示学科交叉融合的方向,为未来创新性、突破性研究提供参考。首先,基于引文视角构建测度论文学科交叉性的指标,识别具有学科交叉性的研究论文;其次,通过BERT-LDA模型识别研究主题,利用余弦相似度计算主题之间的相似度,构建主题演化路径;最后,基于新颖度、增长性、关注度、影响力构建前沿主题识别指标体系,识别具有前沿性的学科交叉研究主题。以图书情报学(Library and Information Science,LIS)为例展开研究,研究结果显示,2004—2023年该学科领域的交叉研究主题呈现出逐渐细化和深入的特点,主要集中在信息挖掘与知识发现、互联网信息行为、医疗信息学3个方面;现阶段学科交叉研究前沿主题为医疗数据模型、舆情治理与情感分析、机器学习与深度学习;基于信息技术的研究方法和其在不同领域的应用研究具有良好的应用前景,有可能成为未来LIS领域的核心研究主题。 展开更多
关键词 研究前沿 主题演化 学科交叉 bert-LDA 主题识别 图书情报学 信息科学 图书馆学
下载PDF
基于BERT和CNN的药物不良反应个例报道文献分类方法
11
作者 孟祥福 任全莹 +3 位作者 杨东燊 李可千 姚克宇 朱彦 《计算机科学》 CSCD 北大核心 2024年第S01期1104-1109,共6页
在临床上,药物不良反应导致的死亡和用药不当造成的住院及门诊费急剧升高,成为临床安全合理用药面临的主要问题之一。目前对药物不良反应的回顾性分析和文献分析多以公开发表的文献资料为依据。学术文献作为重要的数据来源之一,如何自... 在临床上,药物不良反应导致的死亡和用药不当造成的住院及门诊费急剧升高,成为临床安全合理用药面临的主要问题之一。目前对药物不良反应的回顾性分析和文献分析多以公开发表的文献资料为依据。学术文献作为重要的数据来源之一,如何自动批量地对其进行数据处理尤为重要。针对医药文本独特的表述方式,基于BERT及其组合模型进行文本分类技术比对实验,建立对药物不良反应个例报道文献数据进行高效快速分类的方法,进而分辨出药物不良反应的类型,有效预警药害事件。实验结果表明,使用BERT模型的分类准确率达到99.75%,其可以准确高效地对药物不良反应个例报道文献进行分类,在辅助医疗、构建医学文本结构化数据等方面均具有重要的价值和意义,进而能够更好地维护公众健康。 展开更多
关键词 药物不良反应 个例文献报道 医学文本分类 深度学习 bert
下载PDF
基于BERT实现基础医学专业术语智能提取系统
12
作者 李冬梅 朱朝阳 +4 位作者 李丽 邹玲 危晓莉 陈张一 彭慧琴 《基础医学教育》 2024年第11期1002-1007,共6页
在生成式人工智能的推动下,因材施教的个性化学习是现代教育的必然趋势。基于知识图谱的个性化学习路径是目前普遍采用的方式。在知识图谱的构建中,对专业术语的精准提取是最基础的工作,但仅靠人工完成,存在工作量大、易遗漏、不能及时... 在生成式人工智能的推动下,因材施教的个性化学习是现代教育的必然趋势。基于知识图谱的个性化学习路径是目前普遍采用的方式。在知识图谱的构建中,对专业术语的精准提取是最基础的工作,但仅靠人工完成,存在工作量大、易遗漏、不能及时更新的问题。文章通过自行设计标注的数据集medBaseDt,在开源预训练大模型BERT的基础上进行微调,训练完成termBERT模型,并设计开发了基础医学专业术语智能提取系统。该系统在组织学与胚胎学和病理学等教材中进行推理应用,专业术语提取准确率达到94.5±1.16%,取得了非常好的效果。通过该系统,教师能快速获取指定教材内容的专业词汇,快速完成知识图谱的设计。同时,该项技术也为后续研发AI智能构建知识图谱、智能生成试题和个性化学习打下了扎实的基础。 展开更多
关键词 基础医学 教学改革 人工智能 大语言模型 bert 微调
下载PDF
基于BERT古文预训练模型的实体关系联合抽取
13
作者 李智杰 杨盛杰 +3 位作者 李昌华 张颉 董玮 介军 《计算机系统应用》 2024年第8期187-195,共9页
古汉语文本承载着丰富的历史和文化信息,对这类文本进行实体关系抽取研究并构建相关知识图谱对于文化传承具有重要作用.针对古汉语文本中存在大量生僻汉字、语义模糊和复义等问题,提出了一种基于BERT古文预训练模型的实体关系联合抽取模... 古汉语文本承载着丰富的历史和文化信息,对这类文本进行实体关系抽取研究并构建相关知识图谱对于文化传承具有重要作用.针对古汉语文本中存在大量生僻汉字、语义模糊和复义等问题,提出了一种基于BERT古文预训练模型的实体关系联合抽取模型(entity relation joint extraction model based on BERT-ancient-Chinese pretrained model,JEBAC).首先,通过融合BiLSTM神经网络和注意力机制的BERT古文预训练模型(BERT-ancientChinese pre-trained model integrated BiLSTM neural network and attention mechanism,BACBA),识别出句中所有的subject实体和object实体,为关系和object实体联合抽取提供依据.接下来,将subject实体的归一化编码向量与整个句子的嵌入向量相加,以更好地理解句中subject实体的语义特征;最后,结合带有subject实体特征的句子向量和object实体的提示信息,通过BACBA实现句中关系和object实体的联合抽取,从而得到句中所有的三元组信息(subject实体,关系,object实体).在中文实体关系抽取DuIE2.0数据集和CCKS 2021的文言文实体关系抽取CCLUE小样本数据集上,与现有的方法进行了性能比较.实验结果表明,该方法在抽取性能上更加有效,F1值分别可达79.2%和55.5%. 展开更多
关键词 古汉语文本 实体关系抽取 bert古文预训练模型 BiLSTM 注意力 三元组信息
下载PDF
基于BERT-BiLSTM的油田安全生产隐患文本分类
14
作者 陈晨 石赫 +1 位作者 徐悦 张新梅 《科学技术与工程》 北大核心 2024年第29期12650-12657,共8页
事故隐患分类能够直观反映企业安全生产管理的薄弱点,同时将直接决定企业优化安全管理工作的方向。油田安全生产过程中,隐患种类多,数据量大,单纯依赖人工方式分类及管理效率较低,且难以发掘数据中蕴含的潜在规律。基于油田安全生产的... 事故隐患分类能够直观反映企业安全生产管理的薄弱点,同时将直接决定企业优化安全管理工作的方向。油田安全生产过程中,隐患种类多,数据量大,单纯依赖人工方式分类及管理效率较低,且难以发掘数据中蕴含的潜在规律。基于油田安全生产的需求及事故隐患特征,提出了一种基于BERT-BiLSTM的分类模型,用于油田安全生产隐患文本的主题自动分类,通过基于Transformer的双向编码器表示(bidirectionalencoder representations from Transformer,BERT)模型提取输入文本的字符级特征,生成全局文本信息的向量表示,再通过双向长短时记忆网络(bi-directional long short-term memory,BiLSTM)模型对局部关键信息和上下文深层次特征进行特征提取,进而通过Softmax激活函数进行概率计算得到分类结果。通过与传统分类方法的比较表明,BERT-BiLSTM分类模型在加权平均准确率、加权平均召回率和加权平均F_(1)等指标方面均有所改善,模型与油田企业现有安全管理信息系统的有机融合将为进一步提升油田企业的事故隐患管理针对性,推动企业安全管理从事后被动反应向事前主动预防转变提供重要的技术支撑。 展开更多
关键词 隐患管理 油田安全生产 文本分类 bert模型 BiLSTM模型
下载PDF
基于BERT的命名实体识别
15
作者 赵英明 王浩森 赵明瞻 《河北建筑工程学院学报》 CAS 2024年第1期253-257,共5页
在中文命名实体识别任务中,将字向量化表示是重要的步骤,然而传统的词向量表示方法只能将字映射为单一向量,无法表征字的多义性。对此引入了BERT预训练语言模型,BERT模型可以增强字的语义表示,根据其上下文动态生成语义向量。而针对BER... 在中文命名实体识别任务中,将字向量化表示是重要的步骤,然而传统的词向量表示方法只能将字映射为单一向量,无法表征字的多义性。对此引入了BERT预训练语言模型,BERT模型可以增强字的语义表示,根据其上下文动态生成语义向量。而针对BERT微调训练对计算机性能要求较高的问题,采用了固定参数嵌入的方式对BERT进行应用,并搭建了BERT-BiLSTM-CRF模型。实验结果表明,基于BERT的命名实体识别模型在MSRA数据集上的F1-Score指标达到94.48%。优于传统机器学习模型和其他基于深度学习模型的方法。研究结果表明,BERT模型在命名实体识别任务中具有很好的应用前景。 展开更多
关键词 命名实体识别 bert 微调 bert-BiLSTM-CRF模型 深度学习
下载PDF
基于BERT模型的空管危险源文本数据挖掘
16
作者 杨昌其 姜美岑 林灵 《航空计算技术》 2024年第4期89-93,共5页
由于危险源与安全隐患在民航安全管理工作中容易出现概念混淆和记录混乱的情况,根据双重预防机制管理规定,需要将两者区分开来。通过在ASIS系统上采集得到空管危险源控制清单作为研究对象,并对其进行相应的文本数据挖掘工作。根据危险... 由于危险源与安全隐患在民航安全管理工作中容易出现概念混淆和记录混乱的情况,根据双重预防机制管理规定,需要将两者区分开来。通过在ASIS系统上采集得到空管危险源控制清单作为研究对象,并对其进行相应的文本数据挖掘工作。根据危险源与安全隐患特点构建相应的文本分类模型:首先通过文本清洗、去停用词、Jieba分词等对空管危险源控制清单进行预处理,然后基于BERT模型生成词向量,采用BERT-Base-Chinese预训练模型进行预训练,并对模型进行微调超参数,最后结合Softmax分类器得到分类结果。 展开更多
关键词 文本分类 数据挖掘 bert模型 危险源 安全隐患
下载PDF
融合BERT和双向长短时记忆网络的中文反讽识别研究
17
作者 王旭阳 戚楠 魏申酉 《计算机工程与应用》 CSCD 北大核心 2024年第20期153-159,共7页
用户对微博热点话题进行评论时会使用反语、讽刺的修辞手法,其本身带有一定的情感倾向会对情感分析结果造成一定影响。因此该文主要针对中文微博评论进行反讽识别,构建了一个包含反语、讽刺和非反讽的三分类数据集,提出一个基于BERT和... 用户对微博热点话题进行评论时会使用反语、讽刺的修辞手法,其本身带有一定的情感倾向会对情感分析结果造成一定影响。因此该文主要针对中文微博评论进行反讽识别,构建了一个包含反语、讽刺和非反讽的三分类数据集,提出一个基于BERT和双向长短时记忆网络(BiLSTM)的模型BERT_BiLSTM。该模型通过BERT生成含有上下文信息的动态字向量,输入BiLSTM提取文本的深层反讽特征,在全连接层传入softmax对文本进行反讽识别。实验结果表示,在二分类和三分类数据集上,提出的BERT_BiLSTM模型与现有主流模型相比准确率和F1值均有明显提高。 展开更多
关键词 反讽识别 bert 特征提取 双向长短时记忆网络(BiLSTM)
下载PDF
BTM-BERT模型在民航机务维修安全隐患自动分类中的应用
18
作者 陈芳 张亚博 《安全与环境学报》 CAS CSCD 北大核心 2024年第11期4366-4373,共8页
为界定民航机务维修安全隐患类别,实现安全隐患数据的自动分类,首先,利用构建的机务维修停用词库对安全隐患记录语料进行预处理。其次,运用词对主题模型(Biterm Topic Model,BTM)提取主题和关键词,确定了“员工未按规定对工作现场进行... 为界定民航机务维修安全隐患类别,实现安全隐患数据的自动分类,首先,利用构建的机务维修停用词库对安全隐患记录语料进行预处理。其次,运用词对主题模型(Biterm Topic Model,BTM)提取主题和关键词,确定了“员工未按规定对工作现场进行监管”等12类安全隐患。最后,根据BTM主题模型标注的数据集对算法进行微调,构建了基于变换器的双向编码(Bidirectional Encoder Representations from Transformers,BERT)算法的机务维修安全隐患记录自动分类模型,并与传统的分类算法进行对比。结果表明:所构建的模型可以实现民航机务维修安全隐患自动分类,其效果远高于传统机器学习支持向量机算法的效果,构建的分类模型的精确率、召回率和F 1较文本卷积神经网络算法分别提升了0.12、0.14和0.14,总体准确率达到了93%。 展开更多
关键词 安全工程 机务维修 词对主题模型(BTM) 基于变换器的双向编码(bert) 安全隐患 文本分类
下载PDF
基于Bert的合同文本实体识别
19
作者 王浩畅 许亚琼 《计算机与数字工程》 2024年第9期2697-2701,2758,共6页
智慧合同发展的基础性任务就是对合同实体要素进行命名实体识别研究。论文通过人工订制标注规则,构建了包括合同名称、包装条款、验收条款、违约条款等23类实体的合同数据集;对于构建好的合同数据集,采用Bert-BiLSTM-CRF神经网络模型进... 智慧合同发展的基础性任务就是对合同实体要素进行命名实体识别研究。论文通过人工订制标注规则,构建了包括合同名称、包装条款、验收条款、违约条款等23类实体的合同数据集;对于构建好的合同数据集,采用Bert-BiLSTM-CRF神经网络模型进行训练,通过对比23个合同要素的识别结果,以及与经典的神经网络模型进行对比实验结果表明,论文所用模型能够更加有效地应用于合同文本实体识别的任务。 展开更多
关键词 合同文本 命名实体识别 bert
下载PDF
基于BERT和图注意力网络的篇章级事件论元识别
20
作者 王凯 廖涛 《现代计算机》 2024年第6期14-19,64,共7页
事件论元识别是事件抽取的子任务之一,其目的在于识别文本中与事件相关的论元及论元对应的论元角色。研究表明,句子的依存句法关系有助于事件论元任务识别,然而,在构造篇章的依存句法关系时容易引入不相关的论元产生噪声问题,现有方法... 事件论元识别是事件抽取的子任务之一,其目的在于识别文本中与事件相关的论元及论元对应的论元角色。研究表明,句子的依存句法关系有助于事件论元任务识别,然而,在构造篇章的依存句法关系时容易引入不相关的论元产生噪声问题,现有方法对噪声问题处理不佳。针对该问题,提出了一个基于BERT和图注意力网络的篇章级事件论元识别模型。该模型从两个角度去解决噪声问题,一方面,通过获取充分的篇章语义特征作为辅助,去构建更有效的篇章依存句法特征;另一方面,采用图注意力网络对不同的论元节点分配不同的权重,从而去除掉无效的论元。在RAMS语料库上的实验结果表明,该方法有效解决了篇章依存句法关系中存在的噪声问题,取得了较好的篇章级事件论元识别结果。 展开更多
关键词 篇章级事件论元识别 依存句法关系 bert 图注意力网络
下载PDF
上一页 1 2 74 下一页 到第
使用帮助 返回顶部