期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
水电工程施工安全隐患多标签文本智能分类方法
1
作者 周佳一 郑霞忠 +1 位作者 田丹 陈云 《水力发电学报》 CSCD 北大核心 2024年第11期114-124,共11页
水利水电工程施工安全隐患体量大、形式多元、类型多样,同一隐患可能涉及多个类型,且隐患类型的界定存在模糊不清的现象。隐患分类多以人工经验为主导,极易导致隐患管理混淆,增加了隐患管理的难度。针对上述问题,本文提出了一种水电工... 水利水电工程施工安全隐患体量大、形式多元、类型多样,同一隐患可能涉及多个类型,且隐患类型的界定存在模糊不清的现象。隐患分类多以人工经验为主导,极易导致隐患管理混淆,增加了隐患管理的难度。针对上述问题,本文提出了一种水电工程施工安全隐患文本多标签智能分类方法。首先,利用ALBERT模型对文本信息进行编码,实现非结构化安全隐患文本的高精度量化;然后,以文本量化结果为基础,考虑安全隐患中文本内容权重,利用Attention机制改进的双向门控循环单元(Bi-GRU),构建安全隐患文本多标签智能分类模型,提升施工安全隐患识别效率;最后,利用水电工程施工安全隐患文本,测试方法性能,得到方法的F1值达到了92.11%,证明了该方法的适用性,有望为水电工程施工的安全管理、事故隐患排查和分析提供信息支撑。 展开更多
关键词 水电工程施工 安全隐患 文本多标签智能分类 ALBERT 双向GRU Attention机制
下载PDF
一种半监督金融事件多标签分类方法
2
作者 杨卓峰 李旸 李德玉 《数据采集与处理》 CSCD 北大核心 2024年第2期385-394,共10页
随着数字金融服务业的不断发展,互联网和金融服务系统积累了海量文本数据,对金融文本中描述的金融事件自动分类是金融科技的现实需求,也是自然语言处理和机器学习领域广泛关注的方向。目前,深度学习方法已在文本分类中广泛应用,针对文... 随着数字金融服务业的不断发展,互联网和金融服务系统积累了海量文本数据,对金融文本中描述的金融事件自动分类是金融科技的现实需求,也是自然语言处理和机器学习领域广泛关注的方向。目前,深度学习方法已在文本分类中广泛应用,针对文本数据中的金融事件多标签分类中存在的已标注数据缺少、已有深度学习方法消耗资源大以及现有方法未利用金融事件文本的具体特点等问题,通过采用ALBERT和TextCNN等表示工具,引入主体词注意力机制,提出了一种半监督金融事件多标签分类方法。首先,通过无监督数据增强(Unsupervised data augmentation,UDA)方法缓解标注数据量不足的问题;其次,引入了主体词注意力机制,使用ALBERT动态词向量表征方法对文本中的词进行表示;然后,利用TextCNN对文本进行综合语义表示;最后,分别采用交叉熵和KL散度度量标记数据和无标记数据的损失来训练模型。在金融文本数据集上验证了本文所提方法的有效性。 展开更多
关键词 金融文本 金融事件 多标签分类 半监督方法 注意力机制
下载PDF
基于粗糙集加权的文本分类方法研究 被引量:11
3
作者 胡清华 谢宗霞 于达仁 《情报学报》 CSSCI 北大核心 2005年第1期59-63,共5页
文本自动分类是当前智能信息处理中一类重要的研究课题.本文分析了基于统计理论的文本分类的基本特点,提出采用可变精度粗糙集模型中的分类质量构造新的特征词权重计算公式.这种新的加权方法,相对于广泛使用的逆文本频率加权方法,大大... 文本自动分类是当前智能信息处理中一类重要的研究课题.本文分析了基于统计理论的文本分类的基本特点,提出采用可变精度粗糙集模型中的分类质量构造新的特征词权重计算公式.这种新的加权方法,相对于广泛使用的逆文本频率加权方法,大大改进了文本样本在整个空间中的分布,使得类内距离减少,类间距离增大,在理论上将提高样本的可分性.最后利用支持向量机和K近邻两种分类器,验证了这种新的加权方法对分类效果确实有所提高. 展开更多
关键词 文本分类 变精度粗糙集模型 分类 文本自动分类 智能信息处理 支持向量机 特征词 加权方法 研究课题 基本特点
下载PDF
基于混合智能算法的网页文本分类仿真研究 被引量:5
4
作者 李建军 宋志章 《科技通报》 北大核心 2012年第6期152-154,共3页
网页文本特征数常高达上万个,无用和冗余特征相当多,为提高网页文本分类精度,提出一种混合智能算法的网页文本分类方法。首先采用遗传算法对网页文本特征初步选择,然后采用蚁群算法对初步选择特征进行精细选择,最后采用K近邻算法建立文... 网页文本特征数常高达上万个,无用和冗余特征相当多,为提高网页文本分类精度,提出一种混合智能算法的网页文本分类方法。首先采用遗传算法对网页文本特征初步选择,然后采用蚁群算法对初步选择特征进行精细选择,最后采用K近邻算法建立文本分类器。结果表明,混合智能算法很好消除无用和冗余特征,提高了网页文本分类的精度,加快分类速度。 展开更多
关键词 网页文本 智能算法 分类方法 文本特征
下载PDF
打造NLP文本分类深度学习方法库 被引量:2
5
作者 徐子淇 李煜 《机器人产业》 2017年第5期50-57,共8页
这个库的目的是探索用深度学习进行NLP文本分类的方法.它具有文本分类的各种基准模型.它还支持多标签分类,其中多标签与句子或文档相关联.
关键词 文本分类 NLP 学习 方法 基准模型 标签 文档
下载PDF
基于全文内容的学术论文研究方法自动分类研究 被引量:28
6
作者 章成志 李卓 储荷婷 《情报学报》 CSSCI CSCD 北大核心 2020年第8期852-862,共11页
对学术论文所采用的研究方法进行自动分类,有助于研究方法使用行为的分析与研究方法的评估,进而为科研人员推荐或选择合适的研究方法提供依据。相比于摘要信息,全文内容包含更多关于研究方法的上下文信息,因此探索基于全文内容的学术论... 对学术论文所采用的研究方法进行自动分类,有助于研究方法使用行为的分析与研究方法的评估,进而为科研人员推荐或选择合适的研究方法提供依据。相比于摘要信息,全文内容包含更多关于研究方法的上下文信息,因此探索基于全文内容的学术论文研究方法自动分类具有重要的意义。本研究以图书情报领域的820篇学术论文全文为研究对象,邀请专家对其研究方法进行标注得到研究方法训练语料;采用多标签分类任务中问题转换法和算法自适应法,将朴素贝叶斯与支持向量机作为问题转换法的底层分类器,构建6种不同的分类模型,同时选用算法自适应法中的ML-KNN模型,分别对论文中使用的研究方法进行自动分类。实验结果表明,相较于学术论文的摘要信息,全文内容在研究方法分类的性能上有较大的提升;朴素贝叶斯算法在问题转换法的分类器链策略中表现最佳,F1值达到0.705;另外结果也表明不同的学术论文研究方法的特征表征能力不同,训练集的规模较少会导致分类的泛化效果差。 展开更多
关键词 研究方法分类 文本分类 全文内容 多标签分类
下载PDF
基于智能信息处理的数字图书馆知识服务系统的研究与设计 被引量:10
7
作者 杨清 游星雅 蒋向红 《计算机工程与科学》 CSCD 2004年第10期11-14,共4页
随着网络信息的迅猛发展,自动信息处理已经成为人们获取有用信息不可缺少的工具,文本自动分类系统是信息处理的重要研究方向。本文介绍了数字图书馆的概念和主要特点,同时对自动信息处理的关键技术,包括文本的表示、特征提取、机器学习... 随着网络信息的迅猛发展,自动信息处理已经成为人们获取有用信息不可缺少的工具,文本自动分类系统是信息处理的重要研究方向。本文介绍了数字图书馆的概念和主要特点,同时对自动信息处理的关键技术,包括文本的表示、特征提取、机器学习方法,进行了研究和探讨,提出了一种基于信息处理的数字图书馆知识服务系统。 展开更多
关键词 智能信息处理 知识服务系统 文本自动分类 机器学习方法 特征提取 表示 设计 数字图书馆 网络信息 获取
下载PDF
基于知识图谱的涉毒案件法条预测方法 被引量:1
8
作者 杨通超 秦永彬 +3 位作者 黄瑞章 陈艳平 宋玉梅 唐向红 《计算机工程与设计》 北大核心 2023年第6期1899-1906,共8页
为解决涉毒案件法条预测中忽视案情结构信息导致精确性不足、解释性不强等问题,提出基于知识图谱的核方法法条预测模型。将复杂的案情描述结构化成为知识图谱,去除文本噪音的同时引入案情的结构信息以辅助法条预测,通过核方法将复杂的... 为解决涉毒案件法条预测中忽视案情结构信息导致精确性不足、解释性不强等问题,提出基于知识图谱的核方法法条预测模型。将复杂的案情描述结构化成为知识图谱,去除文本噪音的同时引入案情的结构信息以辅助法条预测,通过核方法将复杂的多标签分类问题转化为较简单的单标签分类问题,降低预测难度且实现细粒度法条(具体到法条款项)的预测。实验结果表明,所提方法有效提升了涉毒案件法条预测的性能,增强了法条预测的可解释性。 展开更多
关键词 法条预测 多标签分类 知识图谱 涉毒案件 方法 司法智能 知识图谱构建
下载PDF
基于知识图谱的中成药智能问答平台构建 被引量:2
9
作者 郭紫琴 谭智福 +1 位作者 王嘉俊 叶青 《电脑与信息技术》 2023年第4期52-57,共6页
近年来,中成药的使用和生产规模不断增大,产生了越来越多的中成药数据,中成药的普及与发展是一关键性问题。本项目结合知识图谱和多标签文本分类与命名实体识别的自然语言处理、语音识别等智能问答技术搭建中成药智能问答平台。在用户... 近年来,中成药的使用和生产规模不断增大,产生了越来越多的中成药数据,中成药的普及与发展是一关键性问题。本项目结合知识图谱和多标签文本分类与命名实体识别的自然语言处理、语音识别等智能问答技术搭建中成药智能问答平台。在用户文本提问或语音提问后,平台会根据提问在海量中成药信息中迅速准确地查询相关中成药信息,并呈现相关中成药的知识图谱辅助用户理解。知识图谱可以将中成药很好的存储起来,智能问答可以帮助用户了解中成药,使用知识图谱结合智能问答技术对中成药普及与发展具有一定的意义。 展开更多
关键词 中成药 知识图谱 多标签文本分类 命名实体识别 语音识别 智能问答
下载PDF
水利水电工程施工安全管理对策的研究与应用
10
作者 刘彦涛 《中文科技期刊数据库(全文版)工程技术》 2024年第10期0073-0076,共4页
水利水电工程施工中面临着复杂的环境以及较多的影响因素,施工中常常会存在高空坠物、机械伤人等安全问题。企业只有通过做好安全风险分析、控制安全问题,才能保证施工人员的人身财产安全。为了提高水利水电工程施工安全水平,本文以某... 水利水电工程施工中面临着复杂的环境以及较多的影响因素,施工中常常会存在高空坠物、机械伤人等安全问题。企业只有通过做好安全风险分析、控制安全问题,才能保证施工人员的人身财产安全。为了提高水利水电工程施工安全水平,本文以某水电项目为例,利用安全隐患多标签文本智能分类方法对工程项目的安全隐患进行总结,并且提出优化措施。 展开更多
关键词 水利水电 施工安全 多标签文本智能分类方法
下载PDF
基于学术论文全文的跨语言研究方法自动分类研究 被引量:7
11
作者 田亮 李博闻 章成志 《图书馆建设》 CSSCI 北大核心 2022年第1期75-86,共12页
自动识别学术论文所使用的研究方法对研究方法的评估、方法使用行为分析、方法检索等均具有重要意义。学术论文研究方法的自动分类离不开大量训练语料,但论文研究方法标注成本高昂,探讨如何充分利用现有标注数据对于降低标注成本具有重... 自动识别学术论文所使用的研究方法对研究方法的评估、方法使用行为分析、方法检索等均具有重要意义。学术论文研究方法的自动分类离不开大量训练语料,但论文研究方法标注成本高昂,探讨如何充分利用现有标注数据对于降低标注成本具有重要意义。以图书情报领域为研究对象,首先通过实验比较了基于英文摘要的单语言方法和基于全文的跨语言方法,进而说明了使用跨语言方法的必要性;其次比较了两种跨语言方法在跨语言研究方法分类中的效果;最后对本文提出的一种学术论文全文处理方法进行了验证。实验结果表明,基于学术论文全文的跨语言方法明显优于基于英文摘要的单语言方法,基于机器翻译的方法比基于跨语言预训练模型的方法更优。此外,实验表明针对学术论文全文的长文本处理方法相较于基线方法有明显提升。 展开更多
关键词 研究方法自动分类 跨语言文本分类 多标签分类 学术论文全文内容
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部