期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于PycModel高效深度学习模型的心理咨询问题分类探究
1
作者 易云恒 张超群 +1 位作者 武家辉 汤卫东 《深圳信息职业技术学院学报》 2024年第4期56-64,共9页
大众心理健康问题日益受到广泛关注。为提高心理医疗资源的使用效率,采用互联网手段采集与心理咨询相关的数据,使用一种融合脚本筛选、数据整理以及利用Easydata进行主动学习式数据标注的新方法构建数据集,结合卷积神经网络和BERT预训... 大众心理健康问题日益受到广泛关注。为提高心理医疗资源的使用效率,采用互联网手段采集与心理咨询相关的数据,使用一种融合脚本筛选、数据整理以及利用Easydata进行主动学习式数据标注的新方法构建数据集,结合卷积神经网络和BERT预训练模型等技术,在textvec-base-chinese模型的基础上,提出了PycModel模型,以实现更加高效的心理咨询问题分类。实验结果显示,PycModel在心理咨询问题分类的准确率明显优于其他参照模型,该模型能够有效提高心理咨询的效率和效果,可以为心理健康服务提供有力的支持。 展开更多
关键词 文本分类 心理咨询问题分类:深度学习
下载PDF
CRF机制结合LDA的病历文书后结构化系统的应用
2
作者 温煜 赖舒婷 +1 位作者 曾菲菲 雷佳雨 《微型电脑应用》 2024年第4期59-63,共5页
为了提高病历文书结构化分类准确度,提出利用条件随机场(CRF)半监督词典分词算法结合隐式狄利克雷分布(LDA)医学病历文本分类算法,构建出CRF机制结合LDA的病历文书后结构化系统。结果表明:当主题数量为40时,LDA主题建模的困惑度最小值为... 为了提高病历文书结构化分类准确度,提出利用条件随机场(CRF)半监督词典分词算法结合隐式狄利克雷分布(LDA)医学病历文本分类算法,构建出CRF机制结合LDA的病历文书后结构化系统。结果表明:当主题数量为40时,LDA主题建模的困惑度最小值为-6.97,与初始困惑度相比,LDA主题建模困惑度下降9.76%;当主题数量为3时,得到了一致性值的最低值为0.361;当主题数量为40时,得到了一致性值的最大值为0.442,与最低值相比,LDA主题建模一致性值上升22.44%。综上可以看出,研究的CRF机制结合LDA的病历文书后结构化系统具有较好的应用效果。 展开更多
关键词 条件随机场 半监督词典 隐式狄利克雷分布 病历文书 文本分类
下载PDF
基于BERT-BILSTM-CRF模型的电力行业事故文本智能分析 被引量:7
3
作者 刘斐 文中 吴艺 《中国安全生产科学技术》 CAS CSCD 北大核心 2023年第1期209-215,共7页
为解决电力行业事故报告文本较长、语义复杂,难以进行有效文本识别问题,提出1种以BERT作为底层的预训练模型,并设计1种双重注意力机制编码器,结合BILSTM-CRF深度挖掘事故文本语义特征,从而实现文本智能分析。首先构建电力词典,通过对BER... 为解决电力行业事故报告文本较长、语义复杂,难以进行有效文本识别问题,提出1种以BERT作为底层的预训练模型,并设计1种双重注意力机制编码器,结合BILSTM-CRF深度挖掘事故文本语义特征,从而实现文本智能分析。首先构建电力词典,通过对BERT预训练,进行BIO标注,然后引入BILSTM-CRF模型实现对文本标签智能分类,最后将该模型与现行其他4种深度学习模型进行对比。研究结果表明:该模型智能识别精确率、召回率及F 1值(查准率)均达到约97%,较其他4种模型中效果最好的模型分别提高0.02,0.03,0.02。研究结果可为电力行业事故报告文本分析提供1种新思路。 展开更多
关键词 BERT-BILSTM-CRF 实体识别 电力行业 预训练 文本分类
下载PDF
基于BERT的电网现场作业风险自动评级方法 被引量:1
4
作者 虞佳淼 王慧芳 +3 位作者 张亦翔 费正明 周辉 王刘旺 《电网技术》 EI CSCD 北大核心 2023年第11期4746-4754,共9页
电网现场作业风险等级影响着作业的安全性和经济性,目前风险等级评级主要依赖于人工评级,存在一定的错误率。以国网公司的作业风险分级表与实际现场历史文本库作为研究对象,在充分分析各自文本特点的基础上,提出了基于BERT(bidirectiona... 电网现场作业风险等级影响着作业的安全性和经济性,目前风险等级评级主要依赖于人工评级,存在一定的错误率。以国网公司的作业风险分级表与实际现场历史文本库作为研究对象,在充分分析各自文本特点的基础上,提出了基于BERT(bidirectional encoder representations from transformers)模型的电网现场作业风险自动评级方法。考虑作业风险分级表的概括性,提出对作业风险分级表进行文本增强;考虑实际现场历史文本库中存在一定比例的冗余内容和错误评级,提出冗余文本去除方法和基于文本挖掘技术的风险等级纠错方法;以经过上述方法处理后的2类现场作业文本为样本,构建了基于BERT单文本主题分类微调模型的文本分类模型,实现了对电网现场作业风险的自动评级。算例对比了该文模型与其他分类模型在不同样本集下的评级效果,表明BERT模型能够更全面地获取作业文本的语义特征,分级表的文本增强方法和历史库的风险等级纠错方法能提升评级效果,而冗余文本去除会导致作业文本样本数量减少较多,反而降低评级效果。上述结果表明,该文方法能够实现电网现场作业文本的自动评级,并具有较高的准确性。 展开更多
关键词 电网现场作业 作业风险分级表 作业风险评级 BERT 文本增强 数据纠错
下载PDF
基于深度学习语言模型的心理学领域文本分类 被引量:2
5
作者 林子洛 《软件》 2023年第7期112-118,共7页
文本分类技术能够帮助心理咨询对话系统自动判别用户的心理状态,以便在聊天过程中正确对用户进行心理治疗及心理健康干预,在心理学领域中具有良好的应用前景。本文在近年提出的Emotional First Aid Dataset心理咨询语料库上依次构建了... 文本分类技术能够帮助心理咨询对话系统自动判别用户的心理状态,以便在聊天过程中正确对用户进行心理治疗及心理健康干预,在心理学领域中具有良好的应用前景。本文在近年提出的Emotional First Aid Dataset心理咨询语料库上依次构建了烦恼类型、心理疾病、伤害身体倾向三个文本多分类任务,提出了该语料库的数据预处理方案,同时研究了BERT、Ro BERTa等6个深度学习语言模型在这些多分类任务上的性能,并以这些模型作为基学习器构建了集成模型。实验结果表明,XLNet、RoBERTa、ERNIE模型在多个任务上的表现较为突出,同时集成学习能显著地提高分类模型的预测准确率,整体取得了良好的效果。 展开更多
关键词 深度学习语言模型 心理学领域文本分类 集成学习
下载PDF
不同特征下的学术文本结构功能自动识别研究 被引量:21
6
作者 王东波 高瑞卿 +2 位作者 叶文豪 周鑫 朱丹浩 《情报学报》 CSSCI CSCD 北大核心 2018年第10期997-1008,共12页
随着大量科研论文全文本的出现,如何从中挖掘相应的知识不仅有利于学术文献的深度知识组织而且有益于学术文献的精准检索。而识别学术文本的结构是进行上述探究的基础,因为结构的识别有助于从更深层次或者偏重语义的角度理解学术文本,... 随着大量科研论文全文本的出现,如何从中挖掘相应的知识不仅有利于学术文献的深度知识组织而且有益于学术文献的精准检索。而识别学术文本的结构是进行上述探究的基础,因为结构的识别有助于从更深层次或者偏重语义的角度理解学术文本,从而促进学术文本挖掘研究的发展。本文以学术文本的不同结构功能为研究对象,以Journal of the Association for Information Science and Technology(JASIST)上发表的1579篇论文为数据集,进行双向长短时记忆神经网络、支持向量机和条件随机场三种模型上的预实验,并对比实验结果的性能,最终确定利用条件随机场模型做进一步探究。利用条件随机场模型,本文将学术文本结构功能识别问题转化为对句子单元的序列标注问题,寻找最优识别模型并探究不同特征对结构功能识别的影响,最终获得开放测试的调和平均值为92.88%的结构整体识别效果。实验结果表明,章节标题中词汇信息和章节内容的特征词汇信息对学术文本的功能结构识别起到巨大作用,可以达到令人满意的效果,而结构的长度特征则干扰条件随机场方法的性能。在最后,本文对学术文本结构功能识别出错原因进行总结,指出进一步探讨的问题和方向。 展开更多
关键词 文本分类 条件随机场 篇章结构 深度学习
下载PDF
基于特定领域的Web文本信息获取系统的研究 被引量:3
7
作者 赵栓柱 陈俊杰 《太原理工大学学报》 CAS 北大核心 2006年第2期165-168,共4页
从特定领域用户获取Web文本信息的实际应用角度出发,在分析了系统相关开发理论基础上,通过从内容和语义上指导Web信息的搜索,尝试设计了一个基于特定领域的Web文本信息获取系统模型,并从实现技术上提出了开发这个系统的体系结构,分析了... 从特定领域用户获取Web文本信息的实际应用角度出发,在分析了系统相关开发理论基础上,通过从内容和语义上指导Web信息的搜索,尝试设计了一个基于特定领域的Web文本信息获取系统模型,并从实现技术上提出了开发这个系统的体系结构,分析了各组成模块的主要特点及其功能。着重研究了该系统的几项关键技术:Robot技术、Web页面内容的分析和站点结构的分析技术、中文文本的分类问题,包括中文的分词、特征提取、特征匹配及权值计算等的综合应用技术。 展开更多
关键词 Web文本信息 特定领域 分类系统 中文分词
下载PDF
论审美接受与意境的再生 被引量:4
8
作者 孙志宏 《西南大学学报(社会科学版)》 CSSCI 北大核心 2010年第2期140-143,共4页
古典诗歌意境是一个开放的整体,是一个不断生成的过程,由无限多相互作用的意境再生状态构成。意境再生状态即是读者在欣赏中生发的审美心意状态,以内视觉图景为标志。再生状态是诗人与读者的共同创造,由文本物理场与读者心理场相互作用... 古典诗歌意境是一个开放的整体,是一个不断生成的过程,由无限多相互作用的意境再生状态构成。意境再生状态即是读者在欣赏中生发的审美心意状态,以内视觉图景为标志。再生状态是诗人与读者的共同创造,由文本物理场与读者心理场相互作用而成。 展开更多
关键词 意境 文本再生 内视觉图景 物理场 心理场
下载PDF
图马尔可夫卷积神经网络半监督文本分类研究 被引量:2
9
作者 李社蕾 周波 杨博雄 《计算机仿真》 北大核心 2022年第9期288-292,共5页
随着卷积神经网络在图结构数据上的成功泛化,许多研究者将图卷积神经网络应用于文本分类;在上述方法中,以文档和单词为节点构造异构文本图网络,通过学习图节点的特征表示进行文本分类,未能有效利用节点标签的依赖关系。现提出了文本图... 随着卷积神经网络在图结构数据上的成功泛化,许多研究者将图卷积神经网络应用于文本分类;在上述方法中,以文档和单词为节点构造异构文本图网络,通过学习图节点的特征表示进行文本分类,未能有效利用节点标签的依赖关系。现提出了文本图马尔可夫卷积神经网络(TextGMCN)模型,模型利用异构图中未分类节点的条件联合分布建模节点标签的依赖性;模型利用图卷积神经网络通过端到端的训练,学习有效的文本节点表示。通过变分EM算法进行训练。在多个基准数据集上的实验结果表明,考虑文本节点标签依赖性的TextGMCN模型取得了更优的节点分类性能。 展开更多
关键词 图卷积神经网络 文本分类 条件随机场 变分最大期望算法
下载PDF
基于犯罪行为序列的法律条文预测方法 被引量:8
10
作者 陈文哲 秦永彬 +1 位作者 黄瑞章 陈艳平 《计算机工程与应用》 CSCD 北大核心 2019年第22期245-249,264,共6页
随着互联网技术和人工智能技术的飞速发展,如何将人工智能引入到司法领域得到了各大研究机构的密切关注。在传统的审判辅助工作中,主要依托的是对于独立的案情特征进行法条、量刑、罪名的确立。然而,这种情况下,案情特征的顺序容易被忽... 随着互联网技术和人工智能技术的飞速发展,如何将人工智能引入到司法领域得到了各大研究机构的密切关注。在传统的审判辅助工作中,主要依托的是对于独立的案情特征进行法条、量刑、罪名的确立。然而,这种情况下,案情特征的顺序容易被忽略,尤其是涉及到案件特征的时间序列、行为序列的分析时",顺序问题"可能影响最终的审判结果,如相同特征的案件可能导致审判结果的不同。对如何有效地利用这些信息提升法律条文预测的性能进行研究,用于改进在司法领域的表现,并辅助法官和律师等更加高效地进行法律判决。通过利用案情的事实描述和犯罪行为序列来预测案件涉及的相关法条,验证基于犯罪行为序列的法律条文预测的有效性。 展开更多
关键词 司法领域 犯罪行为序列 文本表示 文本分类 法律条文预测
下载PDF
面向审计领域的短文本分类技术研究 被引量:7
11
作者 伍洋 钟鸣 +1 位作者 姜艳 李石君 《微电子学与计算机》 CSCD 北大核心 2015年第1期5-10,共6页
针对审计问题这种短文本所具有的特征稀疏、问题类别界限模糊问题,提出了一种改进的面向审计领域的短文本分类方法.该方法首先为审计问题构造了专门的特征集,以审计领域的同义词词集和法规库为基础,并结合特定规则来调整特征权重,然后... 针对审计问题这种短文本所具有的特征稀疏、问题类别界限模糊问题,提出了一种改进的面向审计领域的短文本分类方法.该方法首先为审计问题构造了专门的特征集,以审计领域的同义词词集和法规库为基础,并结合特定规则来调整特征权重,然后以修改的SVM决策树作为多类分类器进行短文本分类.实验结果表明,该方法在对审计问题分类的应用上,具有较为满意的正确率,能满足实际的分类需求. 展开更多
关键词 审计问题分类 审计领域 信息增益 SVM决策树 短文本分类 审计报告
下载PDF
视觉类深度神经网络的自动标注 被引量:1
12
作者 李鸣 郭晨皓 陈星 《计算机应用》 CSCD 北大核心 2020年第6期1593-1600,共8页
针对开发人员难以快速从众多模型中找到自己所需的模型的问题,提出了一种基于自然语言处理技术的视觉类深度神经网络的自动标注方法。首先,划分视觉类神经网络的领域类别,根据词频等信息计算关键词及其对应的权值;其次,建立关键词提取... 针对开发人员难以快速从众多模型中找到自己所需的模型的问题,提出了一种基于自然语言处理技术的视觉类深度神经网络的自动标注方法。首先,划分视觉类神经网络的领域类别,根据词频等信息计算关键词及其对应的权值;其次,建立关键词提取器从论文摘要中提取出关键词;最后,将提取得到的关键词和已知权值进行相似度计算,从而得到模型的应用领域。从三大国际计算机视觉领域会议,即国际计算机视觉大会(ICCV)、IEEE国际计算机视觉与模式识别会议(CVPR)和欧洲计算机视觉国际会议(ECCV)发表的论文中选取实验数据进行实验。实验结果表明,所提方法能够提供宏平均值为0.89的高精度分类结果,验证了该方法的有效性。 展开更多
关键词 计算机视觉 深度神经网络 文本分类 关键词提取 自动标注 模型应用领域
下载PDF
专家研究领域自动识别研究 被引量:4
13
作者 赵红斌 陆伟 《现代图书情报技术》 CSSCI 北大核心 2010年第2期63-67,共5页
借鉴文本自动分类思想,基于文档权重归并法,采用N元语言模型,设计一个专家领域识别实验系统;并以"武汉大学"为例对专家研究领域自动识别的效果进行初步评测,实验结果表明该系统对专家研究领域的自动识别具有很高的查准率。
关键词 专家研究领域识别 专家检索 文本分类
原文传递
基于超图注意力网络的生物医学文本分类方法 被引量:5
14
作者 白思萌 牛振东 +3 位作者 何慧 时恺泽 易坤 马原驰 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第11期13-24,共12页
【目的】融合标签语义信息,采用文本级超图和交叉注意力机制捕捉文献文本的组织结构及语义语法信息,提高生物医学领域的文本分类效果。【方法】使用经微调的BioBERT模型从生物医学领域文本中获取向量特征,构建文本级超图捕获文本的语序... 【目的】融合标签语义信息,采用文本级超图和交叉注意力机制捕捉文献文本的组织结构及语义语法信息,提高生物医学领域的文本分类效果。【方法】使用经微调的BioBERT模型从生物医学领域文本中获取向量特征,构建文本级超图捕获文本的语序、语义及语法信息,通过提出的交叉注意力机制网络将文本级超图和标签语义信息进行特征融合实现文本分类任务。【结果】在数据集PM-Sentence数据集上的实验结果表明,所提模型相较于基线模型在综合评价F1指标上最大提高2.34个百分点。【局限】构建的数据集有待扩充,对所提模型用于该领域其他任务的适用性有待进一步研究。【结论】所提模型提升了生物医学文本的分类效果,为知识检索、知识挖掘等知识服务应用提供了有效支持。 展开更多
关键词 文本分类 文本级超图 交叉注意力机制 生物医学领域 标签信息融合
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部