期刊文献+
共找到1,105篇文章
< 1 2 56 >
每页显示 20 50 100
基于提示学习混合模型的学术论文自动分类研究
1
作者 刘爱琴 贺玉斌 马茹茹 《数字图书馆论坛》 CSSCI 2024年第4期74-80,共7页
学术论文分类在知识管理、学术交流、研究导向和学术评估等方面都具有重要的意义。基于深度学习模型构建学术论文自动分类系统,相较于现有的文本分类方法,该系统融合提示学习思想,可较好地缩小预训练模型与下游任务的差距。结果表明,该... 学术论文分类在知识管理、学术交流、研究导向和学术评估等方面都具有重要的意义。基于深度学习模型构建学术论文自动分类系统,相较于现有的文本分类方法,该系统融合提示学习思想,可较好地缩小预训练模型与下游任务的差距。结果表明,该系统较好地提高了文本分类性能和规范性,为科研工作者提供了更好的管理、利用和挖掘信息的方式。 展开更多
关键词 学术论文 提示学习 自动分类
下载PDF
基于TRIZ发明原理的专利自动分类方案设计与实现
2
作者 张玉静 《电脑知识与技术》 2024年第15期88-90,共3页
TRIZ(Theory of the Solution of Inventive Problems)发明原理是发明问题的解决理论。基于TRIZ发明原理的专利自动分类方案具有成熟的软、硬件技术支撑,兼具可靠性、可扩充性、可维护性,可满足未来海量专利增加背景下的专利类型准确划... TRIZ(Theory of the Solution of Inventive Problems)发明原理是发明问题的解决理论。基于TRIZ发明原理的专利自动分类方案具有成熟的软、硬件技术支撑,兼具可靠性、可扩充性、可维护性,可满足未来海量专利增加背景下的专利类型准确划分需要。因此,设计了一个专利自动分类方案,采用TRIZ发明原理,实现了专利自动识别、分类、提取、搜索等功能。该专利自动分类方案能够分类整理专利信息,为专利信息的搜索、查阅、管理提供了线上载体。 展开更多
关键词 TRIZ发明原理 专利自动分类方案 朴素贝叶斯
下载PDF
基于深度学习的乳腺MRI图像自动分类研究
3
作者 马明明 秦乃姗 +3 位作者 姜原 张耀峰 张晓东 王霄英 《磁共振成像》 CAS CSCD 北大核心 2024年第1期55-60,共6页
目的 为了实现图像性质的自动甄别,通过深度学习技术和程序构建多参数乳腺MRI图像自动分类模型并验证其效能。材料与方法 回顾性收集我院2010年1月至2020年11月乳腺MRI图像质量合格数据862例(数据集Ⅰ),按序列分三类:T2WI、T2WI脂肪抑... 目的 为了实现图像性质的自动甄别,通过深度学习技术和程序构建多参数乳腺MRI图像自动分类模型并验证其效能。材料与方法 回顾性收集我院2010年1月至2020年11月乳腺MRI图像质量合格数据862例(数据集Ⅰ),按序列分三类:T2WI、T2WI脂肪抑制序列(fat-suppressed T2WI, FS T2WI)、表观扩散系数(apparent diffusion coefficient, ADC),训练序列分类模型。回顾性收集我院2013年2月至2020年4月乳腺MRI图像质量合格数据377例(数据集Ⅱ),按动态对比增强(dynamic contrast-enhanced, DCE)-MRI期相特征分三类:无对比剂期(no-contrast, NoC)、对比剂增强早期(contrast enhanced early,CEearly)、对比剂增强期(contrast enhanced, CE),训练DCE期相分类模型。回顾性收集我院2021年10月至2021年12月乳腺MRI图像质量合格数据95例(数据集Ⅲ),用于模型(序列和DCE期相)预测效能的独立验证,并通过程序对数据集Ⅲ中的扩散加权成像(diffusion weighted imaging, DWI)参数进行分类:DWI-high和DWI-low。以影像医师依据图像序列、强化特点及参数进行分类的结果为金标准,采用混淆矩阵的方法评价模型的分类效能。结果 在序列分类模型中,总体准确率为92.0%,对ADC、T2WI、FS T2WI各自分类的准确率为100.0%、84.9%、100.0%;在DCE期相分类模型中,总体准确率为90.4%,对NoC、CEearly、CE各自分类的准确率为89.7%、39.2%、95.7%;程序在DWI参数分类中,对DWI-high和DWI-low的分类结果与医师完全一致。结论 利用深度学习模型和程序技术对多参数乳腺MRI进行图像序列、期相和参数分类,输出结果与医师分类结果一致性高,基本满足临床需要。 展开更多
关键词 乳腺肿瘤 图像自动分类 深度学习 人工智能 磁共振成像
下载PDF
基于大语言模型的《四库全书》自动分类研究
4
作者 左亮 赵志枭 王东波 《信息资源管理学报》 CSSCI 2024年第5期23-35,共13页
在古籍研究掀起热潮以及古籍活化成为时代要求的背景下,古籍自动分类面临更高的要求。结合当下前沿的大语言模型,以《四库全书》史部和经部的25类语料作为输入语料,探究荀子古籍大语言系列模型在古籍自动分类上的分类效果。通过与其基... 在古籍研究掀起热潮以及古籍活化成为时代要求的背景下,古籍自动分类面临更高的要求。结合当下前沿的大语言模型,以《四库全书》史部和经部的25类语料作为输入语料,探究荀子古籍大语言系列模型在古籍自动分类上的分类效果。通过与其基座模型对比实验表明,荀子古籍大语言系列模型在古籍自动分类任务中具有明显优势,其中Xunzi-Baichuan2-7B大语言模型的优势最为显著,整体分类F1值达到96.90%;调整训练数据规模的实验表明,荀子古籍大语言模型仅需少量的数据就能够达到与基座模型相当的分类效果。因此,本研究提出的基于荀子古籍大语言模型的古籍自动分类模型,能够实现对古籍的高效细粒度分类,并为资源受限情境下的古籍分类开辟了新途径。 展开更多
关键词 《四库全书》 分类模型 荀子古籍大语言模型 文本自动分类
下载PDF
机器学习在地震事件自动分类中的应用
5
作者 刘甜甜 王禄军 张晖 《华北地震科学》 2024年第3期96-101,共6页
使用地震事件分类识别软件(SERS)对内蒙古地震台网2019—2022年编报的内蒙古东部地区20次分类存疑的地震事件进行类型识别,模型识别率为90.4%;通过对比其与人工编目结果发现,只有3次事件识别为天然地震,概率较低。对这3次地震事件记录... 使用地震事件分类识别软件(SERS)对内蒙古地震台网2019—2022年编报的内蒙古东部地区20次分类存疑的地震事件进行类型识别,模型识别率为90.4%;通过对比其与人工编目结果发现,只有3次事件识别为天然地震,概率较低。对这3次地震事件记录数据的振幅比和时频分析结果表明,震中距较近台站的波形记录具有明显的P波振幅大、能量高的特点,结合研究内蒙古东部地区地质构造及场地响应的相关文献,推测这些地震事件分类识别主要受场地影响,存在场地放大效应。 展开更多
关键词 机器学习 地震事件自动分类 SERS 场地放大效应
下载PDF
基于改进超点图的移动激光点云数据自动分类 被引量:1
6
作者 黄刚 侯燕 杨蒙蒙 《测绘与空间地理信息》 2024年第2期9-13,共5页
针对点云数据无序、无结构、数据量大、点云密度不均匀、数据处理难度较大等问题,将超点图三维语义分割网络模型应用于移动激光点云数据自动分类领域,并提出两点优化方法:1)在PointNet网络中引入多尺度网络结构,同时获取点云的局部特征... 针对点云数据无序、无结构、数据量大、点云密度不均匀、数据处理难度较大等问题,将超点图三维语义分割网络模型应用于移动激光点云数据自动分类领域,并提出两点优化方法:1)在PointNet网络中引入多尺度网络结构,同时获取点云的局部特征和全局特征,实现多尺度特征重用;2)使用Adam优化算法代替原有的梯度下降算法,提升深度学习性能。实验使用真实道路数据进行训练与验证,结果表明,相较于PointNet、PointNet++、PointSIFT及SPG等方法,在复杂道路情况下,精确性和均交并比有一定提高,且具有很好的鲁棒性。 展开更多
关键词 图像处理 深度学习 激光点云 自动分类 语义分割 移动测量系统
下载PDF
基于语音识别的机械零件自动分类回收系统的研究
7
作者 于洪波 邵娟 《电声技术》 2024年第2期36-38,共3页
针对传统机械零件自动分类回收系统因复杂噪声环境导致语音识别准确性不高的问题,文章提出一种混合语音降噪算法,利用谱减法、维纳滤波与小波阈值降噪对语音进行多级降噪处理。搭建实验环境对改进后的方式进行验证,实验结果表明改进后... 针对传统机械零件自动分类回收系统因复杂噪声环境导致语音识别准确性不高的问题,文章提出一种混合语音降噪算法,利用谱减法、维纳滤波与小波阈值降噪对语音进行多级降噪处理。搭建实验环境对改进后的方式进行验证,实验结果表明改进后的方式能够有效改善系统语音识别的准确性,提升系统分拣效率。 展开更多
关键词 机械零件 自动分类 语音识别 语音降噪
下载PDF
基于Local Cascade Ensemble方法的胎儿健康自动分类
8
作者 黄梅佳 李宗辉 郑博伟 《信息技术与信息化》 2024年第4期122-125,共4页
为更好地自动评估胎儿宫内状态,提出一种基于local cascade ensemble(LCE)方法的胎儿健康状态分类模型。选用UCI数据集,使用ADASYN方法对不平衡数据集进行填充平衡,接着结合随机森林算法对数据特征进行选择,最后使用LCE方法对胎儿状态... 为更好地自动评估胎儿宫内状态,提出一种基于local cascade ensemble(LCE)方法的胎儿健康状态分类模型。选用UCI数据集,使用ADASYN方法对不平衡数据集进行填充平衡,接着结合随机森林算法对数据特征进行选择,最后使用LCE方法对胎儿状态进行自动分类。实验结果表明,所提出模型使用的方法平均准确率、精确率、召回率和F1分数分别达到了0.9554、0.9054、0.9557和0.9290,对比传统的机器学习算法能得到更好的分类效果,有效降低了误判率。 展开更多
关键词 机器学习 胎儿监护 自动分类 Local Cascade Ensemble
下载PDF
基于改进KNN算法的档案信息文本自动分类方法研究
9
作者 潘国炀 《信息与电脑》 2024年第4期71-73,共3页
常规的档案信息文本自动分类方法主要使用Bloom二维分类矩阵标注分类特征,导致分类评价指标偏低。对此,提出基于改进K最近邻(K-Nearest Neighbor,KNN)算法的档案信息文本自动分类方法,即提取档案信息文本自动分类特征,再利用改进KNN算... 常规的档案信息文本自动分类方法主要使用Bloom二维分类矩阵标注分类特征,导致分类评价指标偏低。对此,提出基于改进K最近邻(K-Nearest Neighbor,KNN)算法的档案信息文本自动分类方法,即提取档案信息文本自动分类特征,再利用改进KNN算法优化信息文本自动分类流程,实现档案信息文本自动分类。实验结果表明,基于改进KNN算法的档案信息文本自动分类方法的加权精确率(weighted-P)、加权召回率(weighted-R)、加权F值(weighted-F)均较高,证明该方法的分类效果较好,有一定的应用价值。 展开更多
关键词 档案信息 文本 自动分类
下载PDF
智能识别技术在电子档案自动分类与检索中的应用
10
作者 唐梓乔 《机电兵船档案》 2024年第3期39-41,共3页
电子档案是现代科技蓬勃发展下的新时代产物。目前,为进一步优化电子档案应用效果,全面提升电子档案的操作便捷性、高效性、精准性,应与时俱进,将智能识别技术科学运用于电子档案的分类、检索中,推动电子档案管理智能化、自动化发展。... 电子档案是现代科技蓬勃发展下的新时代产物。目前,为进一步优化电子档案应用效果,全面提升电子档案的操作便捷性、高效性、精准性,应与时俱进,将智能识别技术科学运用于电子档案的分类、检索中,推动电子档案管理智能化、自动化发展。本文将围绕智能识别技术在电子档案自动分类与检索中的应用展开分析,即以探究电子档案管理中应用智能识别技术的意义为切入点,随后分别提出智能识别技术在分类、检索的应用策略。 展开更多
关键词 智能识别技术 电子档案 自动分类 智能检索
下载PDF
基于RF算法的中学图书馆馆藏文献自动分类方法研究
11
作者 刘徽 《中文科技期刊数据库(文摘版)图书情报》 2024年第8期0013-0016,共4页
本研究基于随机森林(RF)算法,探索了一种中学图书馆馆藏文献的自动分类方法。通过构建词袋模型和TF-IDF模型,将文献转化为数值特征表示,并利用RF算法进行分类。实验结果表明,RF算法在中学图书馆馆藏文献分类任务中表现出色,具有较高的... 本研究基于随机森林(RF)算法,探索了一种中学图书馆馆藏文献的自动分类方法。通过构建词袋模型和TF-IDF模型,将文献转化为数值特征表示,并利用RF算法进行分类。实验结果表明,RF算法在中学图书馆馆藏文献分类任务中表现出色,具有较高的准确率、精准度、召回率和F值。以期为相关学者及研究者提供参考及建议。 展开更多
关键词 RF算法 中学图书馆 馆藏文献 自动分类
下载PDF
基于概念相似度的档案数据自动分类算法
12
作者 何庆 《办公自动化》 2024年第14期54-56,共3页
针对现有分类算法存在的分类准确性差,并且分类过程中造成档案数据缺失的问题,引入概念相似度,开展档案数据自动分类算法研究。通过档案资源标记矩阵的建立,采集档案数据;结合概念相似度,对不确定分类数据进行聚类;引入融合学习技术,实... 针对现有分类算法存在的分类准确性差,并且分类过程中造成档案数据缺失的问题,引入概念相似度,开展档案数据自动分类算法研究。通过档案资源标记矩阵的建立,采集档案数据;结合概念相似度,对不确定分类数据进行聚类;引入融合学习技术,实现自动化分类档案数据。通过对比实验证明,文章算法的应用可保证档案数据分类的准确性,并且在分类过程中不会出现数据丢失的问题。 展开更多
关键词 概念相似度 档案数据 自动分类 数据聚类
下载PDF
基于Bloom分类法的CS1试题数据集的构建及其自动分类 被引量:1
13
作者 董荣胜 卫晨雨 +2 位作者 胡杰 乔宇澄 李凤英 《计算机科学》 CSCD 北大核心 2023年第6期175-182,共8页
课程评估是教学改革的一个关键环节,涉及教学案例、试题以及课堂教学等方面的内容。针对计算课程的试题评估,引入Bloom分类法,以普林斯顿大学和桂林电子科技大学“计算机科学导论”课程(CS1)的试题为语料库,给出针对CS1的Bloom分类法认... 课程评估是教学改革的一个关键环节,涉及教学案例、试题以及课堂教学等方面的内容。针对计算课程的试题评估,引入Bloom分类法,以普林斯顿大学和桂林电子科技大学“计算机科学导论”课程(CS1)的试题为语料库,给出针对CS1的Bloom分类法认知过程维度和知识维度的相应动词种子库和名词种子库,对试题所能达到的Bloom分类法二维矩阵的位置进行标注,构建CS1试题分类数据集。采用机器学习技术,给出CS1试题自动分类模型TFERNIE-LR,该模型由CSTFPOS-IDF算法、ERNIE模型和LR分类器3部分组成。CSTFPOS-IDF算法是在TFPOS-IDF算法的基础上,通过计算课程关键词权重因子,来提高模型对计算课程关键词的关注程度,生成词权重。同时,基于实体知识增强预训练模型ERNIE进行试题词语级向量嵌入,组合词权重和词语级向量生成用于自动分类的试题文本向量。最后,采用LR分类器将试题自动分类到Bloom分类法二维矩阵。实验结果表明,TFERNIE-LR模型具有良好的性能,在认知过程维度和知识维度上的加权精确率分别达到了83.3%和96.1%。 展开更多
关键词 Bloom分类 课程评估 CS1试题分类数据集 动词种子库 名词种子库 自动分类
下载PDF
基于LDA模型融合Catboost算法的文本自动分类系统设计与实现 被引量:2
14
作者 刘爱琴 郭少鹏 张卓星 《国家图书馆学刊》 CSSCI 北大核心 2023年第5期84-92,共9页
互联网的蓬勃发展使得文本数据呈指数型增长态势,如何实现文本内容的高效分类成为信息资源管理工作面临的紧要问题。本文以维普学术期刊资源与百度新闻网页作为基础语料集,基于LDA模型抽取文档主题、切分文本内容,融合集成学习Catboost... 互联网的蓬勃发展使得文本数据呈指数型增长态势,如何实现文本内容的高效分类成为信息资源管理工作面临的紧要问题。本文以维普学术期刊资源与百度新闻网页作为基础语料集,基于LDA模型抽取文档主题、切分文本内容,融合集成学习Catboost算法获得文档在主题上的概率分布,然后利用训练集提取出的隐含主题-文本矩阵进行分类器训练,最终构建文本分类系统。研究结果显示,该系统能够有效完成文本混合自动分类,分类误差率较低,分类性能明显优于传统的文本分类方法。 展开更多
关键词 隐含狄利克雷分布(LDA) 文本自动分类 SVM算法 Catboost算法
下载PDF
基于脑电的精神疾病自动分类研究进展 被引量:3
15
作者 李懿 吴凯 +5 位作者 李文豪 彭润霖 陈超敏 邓泽亚 周静 林岚(审校) 《生物医学工程与临床》 CAS 2023年第2期238-246,共9页
临床上精神疾病的诊断大多依赖于精神科医生的主观评价,缺少客观有效的生物学指标。脑电信号分析与机器学习方法相结合,在精神疾病辅助诊断领域的应用发展迅速,采用传统机器学习算法和深度学习算法,对脑电信号特征进行学习,从而实现精... 临床上精神疾病的诊断大多依赖于精神科医生的主观评价,缺少客观有效的生物学指标。脑电信号分析与机器学习方法相结合,在精神疾病辅助诊断领域的应用发展迅速,采用传统机器学习算法和深度学习算法,对脑电信号特征进行学习,从而实现精神疾病的分类研究。文章介绍了脑电信号的基本概念、处理流程及其常用特征,笔者总结了脑电信号在抑郁症、双相情感障碍、精神分裂症等精神疾病自动分类的研究进展,最后展望了机器学习方法在该领域的发展趋势。采用传统的机器学习方法仍然是用于自动分类主流的工具。但深度学习内部复杂的体系结构及训练过程阻碍了对其内部的理解,难以解释其在医学领域的作用,因此深度学习也是脑电研究发展方向之一。此外,单独对脑电图进行分析难以囊括患者所有的特征,需与其他模态的生理参数结合进行多生理参数融合分析,使得疾病诊断更加智能化。 展开更多
关键词 脑电信号 精神疾病 自动分类 机器学习 深度学习
下载PDF
基于人工智能的课堂师生对话分析:IRE的自动分类与分水平构建 被引量:3
16
作者 杨晓哲 王晴晴 蒋佳龙 《电化教育研究》 CSSCI 北大核心 2023年第10期79-86,共8页
已有大量研究关注课堂中的师生对话,并对其进行了不同类型的编码与分析,但目前的编码仍受到专业人员的水平与时间限制。为提高课堂对话编码速度,实现自动化的课堂对话分类与即时反馈,采用人工智能技术,利用神经网络分析模型对课堂中的... 已有大量研究关注课堂中的师生对话,并对其进行了不同类型的编码与分析,但目前的编码仍受到专业人员的水平与时间限制。为提高课堂对话编码速度,实现自动化的课堂对话分类与即时反馈,采用人工智能技术,利用神经网络分析模型对课堂中的提问、回答、反馈进行自动编码。研究发现:该模型实现了基于语义的课堂对话质量评估,能够在短时间内实现课堂师生对话中IRE模型的分水平评估,即对提问层次水平、回答层次水平和反馈层次水平进行评估与分类;构建了全面、快速、准确的课堂对话评估方式,成为进一步理解课堂中学习发生过程的关键环节,为大规模课堂智能分析奠定重要基础。 展开更多
关键词 师生对话 机器学习 自动分类 人工智能
下载PDF
基于Sentinel-2A时序谐波分析的山区林草资源遥感自动分类 被引量:2
17
作者 谢婕 张涛 +2 位作者 朱长明 罗敏玄 张新 《测绘与空间地理信息》 2023年第5期38-42,共5页
文章提出了基于Sentinel-2A密集时序的山区林草资源自动分类方法。在GEE云计算平台支持下,首先基于Sentinel-2A影像计算年度NDVI密集时间序列;然后利用HANTS谐波分析对年度NDVI进行时序重构,获得年度完整的NDVI时序特征谱;在此基础上构... 文章提出了基于Sentinel-2A密集时序的山区林草资源自动分类方法。在GEE云计算平台支持下,首先基于Sentinel-2A影像计算年度NDVI密集时间序列;然后利用HANTS谐波分析对年度NDVI进行时序重构,获得年度完整的NDVI时序特征谱;在此基础上构建随机森林分类模型,通过特征计算和优选,完成影像分类和精度评价;并以大别山西麓麻城市为研究区开展了实验研究。实验结果表明:时序谐波分析方法能够有效地区分林草资源及森林亚类,时序谐波特征支持下Sentinel-2A密集时序林草资源遥感分类总体精度较高,相比传统多期分类、现有的全球30 m GLC_FCS30-2020分类产品,OA和Kappa均有了一定的提高。 展开更多
关键词 林草资源 自动分类 Sentinel-2A 时序分析 GEE
下载PDF
基于WordBERT和BiLSTM的政策工具自动分类方法研究 被引量:9
18
作者 霍朝光 霍帆帆 +2 位作者 王婉如 余芊蓉 杨冠灿 《图书情报知识》 CSSCI 北大核心 2023年第3期129-138,共10页
[目的/意义]政策工具是政府为实现政策目标,将其行政理念转为切实行动的手段和方法,是政策分析的重要维度。鉴于当前政策工具分析仍停留在手工分类阶段,存在标准不统一、难以复现、规模小、成本高等一系列问题,提出构建政策工具自动分... [目的/意义]政策工具是政府为实现政策目标,将其行政理念转为切实行动的手段和方法,是政策分析的重要维度。鉴于当前政策工具分析仍停留在手工分类阶段,存在标准不统一、难以复现、规模小、成本高等一系列问题,提出构建政策工具自动分类模型。[研究设计/方法]系统梳理了现有的政策工具分类框架,在Rothwell和Zegveld政策工具分类体系基础上,提出基于WordBERT和BiLSTM构建政策工具自动分类模型,以数据治理和数字经济政策数据集为例,自主构建数据集,进行三组实验,验证模型优劣。[结论/发现]研究结果表明提出的政策工具自动分类模型效果最好,准确率达到73.91%,为繁琐的政策工具分类提供了一种相对高效的自动分类方法。[创新/价值]针对政策工具自动分类这一学科难题,提出利用无监督表示学习和有监督机器学习等算法,进行政策工具自动分类,以锻造政策工具自动量化分析新模块。 展开更多
关键词 政策工具 自动分类 WordBERT BiLSTM 政策计量
下载PDF
光纤激光网络故障大数据自动分类方法 被引量:2
19
作者 汪滢 熊璐 刘晓 《激光杂志》 CAS 北大核心 2023年第5期102-106,共5页
光纤激光网络通信受噪声影响,导分类效果较差,提出了光纤激光网络故障大数据自动分类方法。对数据进行噪处理,将源域中的样本和目标领域的样本配对处理,采用非线性变换提供故障特征,通过K-means算法和最近邻算法分析数据扰动性,将、征... 光纤激光网络通信受噪声影响,导分类效果较差,提出了光纤激光网络故障大数据自动分类方法。对数据进行噪处理,将源域中的样本和目标领域的样本配对处理,采用非线性变换提供故障特征,通过K-means算法和最近邻算法分析数据扰动性,将、征输入到机器学习分类器中分类处理,最终完成故障大数据自动分类处理。经测试证明,所提方法对于不同类型的故障大数据分类时间低于20 s,并且分类正确率、召回率以及F值高于80%、90%和95%,可以快速准确完成故障大数据自动分类处理。 展开更多
关键词 光纤激光网络 故障大数据 自动分类 K-MEANS算法 机器学习
下载PDF
基于多源信息融合的学位论文自动分类标引 被引量:2
20
作者 谢庆恒 《情报工程》 2023年第3期70-80,共11页
[目的/意义]学位论文是图书馆的特色馆藏文献,实现学位论文的自动分类标引对智慧图书馆建设具有积极意义。[方法/过程]首先基于BERT分别获取题名和摘要的词向量表示,然后将二者进行加权代数和计算得到融合向量,最后将其输入到基于Pytorc... [目的/意义]学位论文是图书馆的特色馆藏文献,实现学位论文的自动分类标引对智慧图书馆建设具有积极意义。[方法/过程]首先基于BERT分别获取题名和摘要的词向量表示,然后将二者进行加权代数和计算得到融合向量,最后将其输入到基于Pytorch框架构建的Softmax经典分类器进行学位论文的自动分类标引实践探讨。[局限]在数据信息源和学科内容的多样性方面尚需进一步加强。[结果/结论]模型分类F1值达到了79.55%,优于基于单一信息的题名或摘要的分类效果,能较好满足实际应用要求。 展开更多
关键词 学位论文 自动分类 信息融合 BERT
下载PDF
上一页 1 2 56 下一页 到第
使用帮助 返回顶部