期刊文献+
共找到220,302篇文章
< 1 2 250 >
每页显示 20 50 100
旅游自动问答系统中多任务问句分类研究 被引量:1
1
作者 陈千 冯子珍 +1 位作者 王素格 郭鑫 《计算机应用与软件》 北大核心 2024年第1期336-342,共7页
目前旅游产业信息化建设需要构建旅游自动问答系统,其中问句分类是问答系统的重要组成部分,传统问句类别体系角度单一,且传统分类模型对不平衡的问句数据集表现欠佳。针对这一问题,该文从问题主题和问句答案类型两个角度构建了旅游领域... 目前旅游产业信息化建设需要构建旅游自动问答系统,其中问句分类是问答系统的重要组成部分,传统问句类别体系角度单一,且传统分类模型对不平衡的问句数据集表现欠佳。针对这一问题,该文从问题主题和问句答案类型两个角度构建了旅游领域的问句类别体系架构,并提出多任务问句分类模型MT-Bert,在BERT上进行多任务训练,并加入自注意力机制,使用Softmax分类器,并设计了多任务融合损失函数。在山西旅游数据集的结果表明,MT-Bert在两种类别体系的微平均F1值分别为97.6%、91.7%,且避免了非平衡数据的预测失败问题,可以有效处理非平衡数据。 展开更多
关键词 旅游问答 问句分类 分类体系 BERT 自注意力 多任务
下载PDF
中国大健康产业统计分类与产业规模再测算 被引量:1
2
作者 陶春海 熊琦哲 《统计与决策》 北大核心 2024年第5期33-38,共6页
由于产业间深度融合,新业态、新模式持续涌现,健康产业的边界不断拓展,原有的健康产业统计分类已不能满足大健康产业的统计需要,官方统计也未测算出健康产业增加值,无法全面、及时反映大健康产业的发展状况。因此,文章首先在健康产业基... 由于产业间深度融合,新业态、新模式持续涌现,健康产业的边界不断拓展,原有的健康产业统计分类已不能满足大健康产业的统计需要,官方统计也未测算出健康产业增加值,无法全面、及时反映大健康产业的发展状况。因此,文章首先在健康产业基础上从供给和需求角度界定并拓展大健康产业的内涵及外延;其次,在《健康产业统计分类(2019)》的基础上,基于国民经济核算理论,引入“大健康总产品”概念,聚焦“全生命周期”和“全人群”两个着力点,从全产业链产品供给及全口径人群健康需求两个视角探讨大健康产业统计分类标准,补充和完善大健康产业统计分类;最后,依据现有的投入产出表、经济普查及统计年鉴数据,计算各行业的大健康分离系数,据此推算我国大健康产业及健康服务业增加值。结果显示:2018年我国大健康产业增加值为10.27万亿元,其中健康服务业增加值为7.04万亿元,预测2020年、2030年健康服务业增加值分别为8.46万亿元、21.27万亿元,基本符合《“健康中国2030”规划纲要》对健康服务业发展规模的预期。 展开更多
关键词 大健康产业 统计分类标准 统计分类 增加值测算
下载PDF
数据分类分级确权对数据要素价值实现的影响 被引量:7
3
作者 马费成 熊思玥 +1 位作者 孙玉姣 王文慧 《信息资源管理学报》 2024年第1期4-12,共9页
数据确权是释放数据要素价值的基础,同时也是数据要素市场正常运行和不断发展的关键支撑。研究梳理了数据确权相关概念以及如何建立产权体系以实现数据确权的路径。在此基础上,本研究明晰了数据分类分级确权的具体方式,并基于价值链分... 数据确权是释放数据要素价值的基础,同时也是数据要素市场正常运行和不断发展的关键支撑。研究梳理了数据确权相关概念以及如何建立产权体系以实现数据确权的路径。在此基础上,本研究明晰了数据分类分级确权的具体方式,并基于价值链分析其对数据价值实现中各个环节的影响。研究结果表明,在数据采集环节数据分类分级确权制度能够激励数据供给,提高数据质量,同时激发市场活力;在数据组织环节,它细分了技术工作,保护隐私数据,并挖掘潜在价值;在数据流通环节,它能调节负外部性、降低交易成本、优化资源配置;最后,在数据利用环节,它在数据合规监管和数据价值再开发方面发挥了关键作用。 展开更多
关键词 数据分类分级 确权 价值链 数据要素 价值实现
下载PDF
基于荧光光镊与机器学习的单细胞血液分类方法
4
作者 周哲海 熊涛 +2 位作者 赵爽 张帆 朱桂贤 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第4期1081-1087,共7页
利用物种间血液成分的差异来识别物种,对生物医学、医疗健康、海关、刑侦、食品安全、野生动物保护等工作十分重要。但目前的研究都是针对群体细胞展开,忽略了单细胞的异质性,开展基于单细胞的血液光谱分类方法研究非常迫切。在此提出... 利用物种间血液成分的差异来识别物种,对生物医学、医疗健康、海关、刑侦、食品安全、野生动物保护等工作十分重要。但目前的研究都是针对群体细胞展开,忽略了单细胞的异质性,开展基于单细胞的血液光谱分类方法研究非常迫切。在此提出了一种基于荧光光镊和机器学习的单细胞血液分类方法,利用光镊实现了单细胞捕获,通过荧光光谱检测系统获得了单细胞荧光光谱数据,并基于机器学习方法实现了准确分类。首先,设计并搭建了一套荧光光镊系统,实现了单细胞捕获和荧光光谱检测。然后,制备了马、猪、犬、鸡四种动物的红细胞稀释液,以440 nm激光作为荧光激发光源,获得了四个物种每种100条、共计400条荧光光谱数据,并进行了背景去除、平滑、归一化的预处理,消除了信号中的噪声干扰。随后,建立了随机森林分类模型,分析了当抽取特征数k=20时,模型中树的棵数与预测准确率之间的关系,当决策树m=500时,分类正确率趋于稳定,有很高的分类正确率和运行效率。进一步地,设定样本数据的30%作为测试集、70%为训练集,计算不同波长与特征重要性之间的关系,得到了10个分类准确率,并取平均值作为模型分类的准确率,测试集最终准确率达到93.1%,方差为0.31%。最后,计算了混淆矩阵,对模型预测精度进行了评价,鸡的分类正确率最高,马的分类正确率最低。分析表明,对分类有重要贡献的物质分别是卟啉类物质、血红素和黄素腺嘌呤二核苷酸。总之,研究表明,将荧光光镊与机器学习方法相结合,可实现单细胞水平的血液分类,较高的分类正确率验证了这种方法的可行性和有效性。同时,该方法不需要过多样品就能满足建模需求,避免了因浓度低带来的荧光自吸收强度过低等问题,具有快速、准确分类的优点,具有非常重要的潜在应用价值。 展开更多
关键词 血液分类 荧光光镊 机器学习 单细胞 随机森林分类模型
下载PDF
多区域注意力的细粒度图像分类网络 被引量:2
5
作者 白尚旺 王梦瑶 +1 位作者 胡静 陈志泊 《计算机工程》 CSCD 北大核心 2024年第1期271-278,共8页
目前细粒度图像分类的难点在于如何精准定位图像中高度可辨的局部区域以及其他辅助判别特征。提出一种多区域注意力的细粒度图像分类网络来解决这个问题。首先使用Inception-V3对图像特征进行提取,通过重复使用注意力擦除的方法使模型... 目前细粒度图像分类的难点在于如何精准定位图像中高度可辨的局部区域以及其他辅助判别特征。提出一种多区域注意力的细粒度图像分类网络来解决这个问题。首先使用Inception-V3对图像特征进行提取,通过重复使用注意力擦除的方法使模型关注次要特征;然后通过背景去除以及上采样的方法获取图像更精准的局部图像,对提取到的局部特征进行位置统计,并以矩形框的方式获取图像整体,减少细节信息丢失;最后对局部与整体图像进行更加细致的学习。此外,设计联合损失函数,通过动态平衡难易样本和缩小类内差距的方法改善模型的识别效果。实验结果表明,该方法在公开的细粒度图像数据集CUB-200-2011、Stanford-Cars和FGVC-Aircraft上的准确率分别达到89.2%、94.8%、94.0%,相较于对比方法性能更优。 展开更多
关键词 多区域注意力 细粒度图像分类 擦除策略 联合损失 深度学习 卷积神经网络
下载PDF
引入激活扩散的类分布关系近邻分类器
6
作者 董飒 欧阳若川 +4 位作者 徐海啸 刘杰 刘大有 李婷婷 王鑫禄 《吉林大学学报(理学版)》 CAS 北大核心 2024年第4期915-922,共8页
针对同质性关系分类器基于一阶Markov假设简化处理的局限性,在类分布关系近邻分类器构建类向量和参考向量时,引入局部图排序激活扩散方法,并结合松弛标注的协作推理方法,通过适当扩大分类时邻居节点的范围增加网络数据中待分类节点的同... 针对同质性关系分类器基于一阶Markov假设简化处理的局限性,在类分布关系近邻分类器构建类向量和参考向量时,引入局部图排序激活扩散方法,并结合松弛标注的协作推理方法,通过适当扩大分类时邻居节点的范围增加网络数据中待分类节点的同质性,从而降低分类错误率.对比实验结果表明,该方法扩大了待分类节点的邻域,在网络数据上分类精度较好. 展开更多
关键词 人工智能 网络数据分类 激活扩散 类分布关系近邻分类 协作推理
下载PDF
面向类不均衡数据的多任务博弈概率分类向量机
7
作者 潘海洋 李丙新 +1 位作者 郑近德 童靳于 《机电工程》 CAS 北大核心 2024年第3期430-437,共8页
在工程实际中获取的故障样本往往会呈现不均衡特点,同时传统的分类模型也会存在局限性。针对这些问题,基于稀疏贝叶斯理论、模糊隶属度等理论,提出了一种多任务博弈概率分类向量机(MGPCVM)分类方法。首先,在MGPCVM的目标函数中,设计了... 在工程实际中获取的故障样本往往会呈现不均衡特点,同时传统的分类模型也会存在局限性。针对这些问题,基于稀疏贝叶斯理论、模糊隶属度等理论,提出了一种多任务博弈概率分类向量机(MGPCVM)分类方法。首先,在MGPCVM的目标函数中,设计了博弈因子,将不同类样本质心间的博弈信息赋予每个样本特定的样本质心敏感值,以解决传统分类器对不平衡数据集分类表现较差的问题;然后,在贝叶斯框架理论下,采用截断高斯先验分布的方法,使样本参数的正负与对应的标签信息相一致,且使样本质心敏感值产生了稀疏估计;最后,将MGPCVM方法应用于两种不同实验平台采集的滚动轴承实验数据处理,进行了故障诊断有效性验证。研究结果表明:在不同的不平衡比(IR)下,MGPCVM方法的准确率均保持在95%以上,相对于支持向量机(SVM)、概率分类向量机(PCVM)等方法提升了4%~8%;与典型向量式分类方法相比,MGPCVM方法可以在不平衡数据条件下表现出优越的分类性能,适用于实际工况中数据失衡的分类问题。 展开更多
关键词 滚动轴承 故障诊断 多任务博弈概率分类向量机 支持向量机 概率分类向量机 不均衡比 故障分类模型
下载PDF
社区生活垃圾分类:国外研究述评及启示 被引量:1
8
作者 薛立强 王鹏 《上海城市管理》 2024年第1期69-76,共8页
生活垃圾分类是美丽中国建设的重要一环,也是近年来学界关注的焦点之一。通过梳理1995—2022年国外学界关于社区生活垃圾分类的相关文献发现,国外学界围绕生活垃圾分类政策法规、社区居民参与生活垃圾分类行为及其影响因素、社区生活垃... 生活垃圾分类是美丽中国建设的重要一环,也是近年来学界关注的焦点之一。通过梳理1995—2022年国外学界关于社区生活垃圾分类的相关文献发现,国外学界围绕生活垃圾分类政策法规、社区居民参与生活垃圾分类行为及其影响因素、社区生活垃圾分类治理主体多元化等主题,形成了一批颇有价值的理论成果。国外研究对于推进国内相关研究的启示在于:应重视生活垃圾分类研究的公共治理视角,应重视多种社会科学研究方法的并举应用和创新,应加强多元主体的协同共治研究,可以探索“工具—制度—文化”三个层面的生活垃圾分类阐释体系。 展开更多
关键词 生活垃圾分类 社区 研究述评
下载PDF
论客体对数据基本产权和分类确权的决定作用 被引量:1
9
作者 刘士国 《政法论丛》 北大核心 2024年第1期69-80,共12页
数据二十条构建了基本数据产权,但要进一步确权立法,必须依据数据关系客体的不同对数据基本产权作出总体规定,并应根据客体类型作出分别规定。数据及其产品是新型民事关系客体,可被多人同时使用,其财产关系依合同产生具有相对性,这一客... 数据二十条构建了基本数据产权,但要进一步确权立法,必须依据数据关系客体的不同对数据基本产权作出总体规定,并应根据客体类型作出分别规定。数据及其产品是新型民事关系客体,可被多人同时使用,其财产关系依合同产生具有相对性,这一客观规律决定数据产权为不同于所有权的有限产权。数据产权包括人格性权利和财产性权利,财产性权利以人格性权利为基础。数据确权立法的基本框架包括数据流通中当事人享有的数据持有权、加工使用权、数据产品经营权等基本数据财产权,著作类电子产品当事人的权利,数据直接生成产品当事人的权利,货币结算与比特币的规定,法院管辖、涉外法律适用、仲裁等内容。 展开更多
关键词 数据关系客体 基本产权 分类确权 决定作用
下载PDF
功能语篇写作:一种统整性阐释和分类教学框架 被引量:1
10
作者 荣维东 《语文建设》 北大核心 2024年第3期4-9,共6页
《义务教育语文课程标准(2022年版)》中出现了很多不同类型的写作。本文拟提出“功能语篇写作”的概念,对它们予以统整。“功能语篇写作”认为,写作是基于特定的情境任务,面对特定读者,基于特定目的,围绕特定话题,以一定角色和口吻,采... 《义务教育语文课程标准(2022年版)》中出现了很多不同类型的写作。本文拟提出“功能语篇写作”的概念,对它们予以统整。“功能语篇写作”认为,写作是基于特定的情境任务,面对特定读者,基于特定目的,围绕特定话题,以一定角色和口吻,采用合宜的体式和语言进行的语篇构建和意义交流活动。它可以涵盖从基础写作到实用写作、创意写作、思辨写作,再到跨学科写作、跨媒介写作、项目化写作等多种不同的类型。“功能语篇写作”旨在建立一个统整性阐释框架,倡导基于不同的任务类型,遵循其各自语篇赋形规律,开展多功能、多类型语篇写作教学,以培养学生在真实情境中进行多类型写作的能力。 展开更多
关键词 功能语篇写作 统整阐释 分类教学
下载PDF
基于审美分析的口腔美容修复分类诊疗方案(一):基本概念、决策树及临床路径 被引量:2
11
作者 于海洋 赵俊颐 孙蔓琳 《华西口腔医学杂志》 CAS CSCD 北大核心 2024年第1期19-27,共9页
当前美容修复临床方案多基于欧美国家提出的口腔美感指标(简称欧美审美)制定,但机械地照搬欧美口腔美容修复方案,忽视了其与中国人口腔美感指标(简称中式审美)的差别,是无法有效支撑国人个性化口腔美容修复诊治的。另外,近年发展迅猛的... 当前美容修复临床方案多基于欧美国家提出的口腔美感指标(简称欧美审美)制定,但机械地照搬欧美口腔美容修复方案,忽视了其与中国人口腔美感指标(简称中式审美)的差别,是无法有效支撑国人个性化口腔美容修复诊治的。另外,近年发展迅猛的美容修复新技术、新方案层出不穷,但不少热门概念的内涵混淆不清,也缺乏应有的分级诊疗规范,急需讨论明晰。本文从服务好口腔美容修复临床运用出发,探讨了中译词“美学”的不足与误用,美学与美容的区别与联系,美容修复与固定修复的相关关系,还讨论了前牙区、美学区与暴露区的差别、口腔审美分析的诊疗价值,以及脱敏、暗示等疗法在口腔疑难美容修复病例中的运用方法。进一步介绍了审美分析引导的暴露区牙位修复重建的决策树及临床路径,并案析介绍了审美分析评估临床流程、口腔美容修复临床三分类及相应的临床分类诊疗要点。 展开更多
关键词 口腔美容修复 审美分析 分类诊疗临床路径 决策树 脱敏疗法 暗示疗法
下载PDF
一种基于多分类器和证据理论融合的水质分类方法
12
作者 项新建 颜超龙 +2 位作者 费正顺 郑永平 李可晗 《人民黄河》 CAS 北大核心 2024年第1期109-113,共5页
针对单分类器对不同水质类别识别不均衡、水质分类准确率较低、适应性较差的问题,提出一种基于多分类器和证据理论融合的水质分类方法。选取深度神经网络分类器、改进支持向量机分类器和贝叶斯分类器3种分类器,通过全概率公式构建信度函... 针对单分类器对不同水质类别识别不均衡、水质分类准确率较低、适应性较差的问题,提出一种基于多分类器和证据理论融合的水质分类方法。选取深度神经网络分类器、改进支持向量机分类器和贝叶斯分类器3种分类器,通过全概率公式构建信度函数,基于证据理论对信度函数进行融合,获得多分类器融合模型。从国家地表水水质自动站发布的2022年3月1—22日水质数据中选取3 558条数据为样本集,采用DNN水质分类模型、PSO-SVM水质分类模型、贝叶斯水质分类模型和多分类器融合模型对待测样本进行测试。结果表明:多分类器融合模型对水质类别判定的平均准确率、精确率、召回率和F1值分别为94.2%、93.8%、94.2%和94.0%。相较于DNN水质分类模型、PSO-SVM水质分类模型、贝叶斯水质分类模型,多分类器融合模型准确率分别提高5.6%、9.8%和13.6%,精确率分别提高5.2%、10.0%和10.9%,召回率分别提高5.6%、9.8%和13.6%,F1值分别提高5.4%、10.2%和12.3%,多分类器融合模型在水质分类方面的准确性和适应性更高。 展开更多
关键词 水质分类 分类 神经网络 证据理论融合
下载PDF
京都胃炎分类评分在胃镜下识别未分化型与分化型胃癌的价值
13
作者 李超 崔立红 +5 位作者 王晓辉 于兰 王巍 刘新尧 李晓伟 闫志辉 《中国内镜杂志》 2024年第7期71-76,共6页
目的探讨京都胃炎分类评分对未分化型和分化型胃癌的区分价值,并基于此,建立内镜下区分未分化型胃癌的预测评分系统。方法回顾性分析该院第六医学中心确诊的183例胃癌患者的临床资料,根据病理分为分化组(95例)和未分化组(88例)。比较两... 目的探讨京都胃炎分类评分对未分化型和分化型胃癌的区分价值,并基于此,建立内镜下区分未分化型胃癌的预测评分系统。方法回顾性分析该院第六医学中心确诊的183例胃癌患者的临床资料,根据病理分为分化组(95例)和未分化组(88例)。比较两组患者年龄、性别和京都胃炎分类评分等,通过二元Logistic回归分析筛选未分化型胃癌相关因素,并基于得到的比值比(OR),建立未分化型胃癌预测评分系统,绘制受试者操作特征曲线(ROC curve)。结果与分化组比较,未分化组萎缩评分、肠上皮化生评分、弥漫性发红评分和京都胃炎分类评分总分较低(P<0.01)。年龄<55岁(P<0.05)、女性(P<0.05)和胃黏膜C1萎缩或无萎缩(P<0.01)与未分化型胃癌独立相关。建立的未分化型胃癌预测评分系统,区分未分化型胃癌的曲线下面积(AUC)为0.881(95%CI:0.828~0.934),最佳截断值的敏感度为80.70%,特异度为90.50%。结论未分化型和分化型胃癌患者京都胃炎分类评分有差异,建立的未分化型胃癌预测评分系统,对区分未分化型胃癌有一定的价值。 展开更多
关键词 胃癌 内镜 京都胃炎分类 未分化癌
下载PDF
面向遥感图像场景分类的LAG-MANet模型
14
作者 王威 郑薇 王新 《测绘学报》 EI CSCD 北大核心 2024年第7期1371-1383,共13页
遥感图像分类过程中,局部信息与全局信息至关重要。目前,遥感图像分类的方法主要包括卷积神经网络(CNN)及Transformer。CNN在局部信息提取方面具有优势,但在全局信息提取方面有一定的局限性。相比之下,Transformer在全局信息提取方面表... 遥感图像分类过程中,局部信息与全局信息至关重要。目前,遥感图像分类的方法主要包括卷积神经网络(CNN)及Transformer。CNN在局部信息提取方面具有优势,但在全局信息提取方面有一定的局限性。相比之下,Transformer在全局信息提取方面表现出色,但计算复杂度高。为提高遥感图像场景分类性能,降低复杂度,设计了LAG-MANet纯卷积网络。该网络既关注局部特征,又关注全局特征,并且考虑了多尺度特征。输入图像被预处理后,首先采用多分支扩张卷积模块(MBDConv)提取多尺度特征;然后依次进入网络的4个阶段,在每个阶段采用并行双域特征融合模块(P2DF)分支路提取局部、全局特征并进行融合;最后先经过全局平均池化、再经过全连接层输出分类标签。LAG-MANet在WHU-RS19数据集、SIRI-WHU数据集及RSSCN7数据集上的分类准确率分别为97.76%、97.04%、97.18%。试验结果表明,在3个具有挑战性的公开遥感数据集上,LAG-MANet更具有优越性。 展开更多
关键词 遥感图像 场景分类 CNN LAG-MANet
下载PDF
基于BERT模型的医疗安全事件智能分类研究与实践
15
作者 赵从朴 袁达 +3 位作者 朱溥珏 周炯 陈政 彭华 《医学信息学杂志》 CAS 2024年第1期27-32,38,共7页
目的/意义改进医疗安全事件分类评估模式,提升工作效率和时效性。方法/过程选取既往医疗安全事件数据进行预处理,利用BERT模型进行训练、测试、迭代优化,构建医疗安全事件智能分类预测模型。结果/结论利用该模型对2022年1-11月临床科室... 目的/意义改进医疗安全事件分类评估模式,提升工作效率和时效性。方法/过程选取既往医疗安全事件数据进行预处理,利用BERT模型进行训练、测试、迭代优化,构建医疗安全事件智能分类预测模型。结果/结论利用该模型对2022年1-11月临床科室上报的466例医疗安全事件进行分类,F1值达0.66。将BERT模型应用于医疗安全事件分类评估辅助,可提升工作效率和时效性,有助于及时干预医疗安全风险隐患。 展开更多
关键词 医疗安全事件 BERT 深度学习 智能分类
下载PDF
基于多频带路径签名特征的癫痫脑电图信号分类方法
16
作者 郭礼华 杨辉 +1 位作者 吴倩仪 茅海峰 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第7期9-18,共10页
基于脑电图(EEG)信号的癫痫自动检测对癫痫的临床诊断和治疗有很大的帮助。由于大部分癫痫识别算法忽略了EEG信号的时序关系,为此,文中提出了一种基于多频带路径签名特征的癫痫EEG信号分类方法。此方法首先将EEG信号分解成5个不同频段... 基于脑电图(EEG)信号的癫痫自动检测对癫痫的临床诊断和治疗有很大的帮助。由于大部分癫痫识别算法忽略了EEG信号的时序关系,为此,文中提出了一种基于多频带路径签名特征的癫痫EEG信号分类方法。此方法首先将EEG信号分解成5个不同频段的频带信号,再通过路径签名算法进行特征提取,然后采用局部主成分分析去除特征相关性并进行特征融合,最后将融合特征送入集成分类器中进行预测分类。由于路径签名可以更深入地挖掘EEG信号的相关关系,结合局部主成分分析后,文中方法可以获取更有鉴别性的癫痫分类特征。分别在时长超过2 000 s癫痫发作片段的本地医院私有数据集和开源的CHB-MIT癫痫数据集上,选用10折交叉进行实验验证,结果表明:在私有数据集上,文中方法的平均分类准确率达到97.25%,比经典的基于经验模态分解(EMD)的方法提高了3.44个百分点,比最新的基于长短期记忆网络(LSTM)+卷积神经网络(CNN)的方法提高了1.35个百分点;在CHB-MIT数据集上,文中方法的平均分类准确率达到98.11%,比经典的基于EMD的方法提高了5.20个百分点,比最新的基于LSTM+CNN的方法提高了2.64个百分点;在两个数据集上文中方法的分类准确率均优于其他对比方法。 展开更多
关键词 脑电图分析 癫痫发作分类 路径签名 信号分析
下载PDF
文本分类算法及其应用场景研究综述
17
作者 刘晓明 李丞正旭 +7 位作者 吴少聪 张宇辰 白红艳 程泽华 陈卓 李永峰 兰钰 沈超 《计算机学报》 EI CAS CSCD 北大核心 2024年第6期1244-1287,共44页
随着大数据时代的到来,互联网中的文本信息迎来了井喷式的增长.文本分类作为自然语言处理中最重要的技术之一,其广泛应用于多个领域,如情感分析、新闻分类、自然语言推理、主题标记、抽取式问答、虚假内容检测等.从传统机器学习分类方... 随着大数据时代的到来,互联网中的文本信息迎来了井喷式的增长.文本分类作为自然语言处理中最重要的技术之一,其广泛应用于多个领域,如情感分析、新闻分类、自然语言推理、主题标记、抽取式问答、虚假内容检测等.从传统机器学习分类方法理论的深入到深度学习分类方法探索的兴起,相关研究模型与思路也在不断演变,各类新的方法、数据集和评价指标层出不穷,丰富了文本分类领域的研究,取得了卓越的理论成就和应用效果.尽管如此,新技术不断发展和业务应用场景不断丰富,同时,也为文本分类研究带来了许多新的问题与挑战,如数据约束场景中不均衡数据的文本表征学习、小样本场景下的文本分类等.针对当前研究难题与挑战,本文对文本分类方法进行了系统性调研,并对当前方法在实际应用场景中面临的技术挑战和未来的研究方向进行了综合探讨.具体而言,本文主要综述了七部分内容,分别是:(1)对文本分类技术的相关基础知识进行了全面介绍,包括文本分类的常见符号定义、计算范式和文本预处理技术;(2)对基于传统机器学习的文本分类方法进行了详细总结;同时,为了方便读者针对不同的应用场景选择合适的分类模型,本文对不同分类器擅长处理的文本分类难题及方法优劣进行了总结;(3)对基于新兴深度学习的文本分类方法进行了周详梳理,根据领域内代表性技术的核心思想进行分类,在此基础上对不同类别下的主要方法进行描述,同时对其技术的优劣进行了总结;(4)为了方便读者对文本分类模型的有效性进行验证,针对文本分类技术应用最为广泛的七大场景,本文对相关数据集进行了系统性的总结;(5)本文对不同任务目标下的常用的模型评价方法进行详尽介绍,以便对模型性能进行合理的定量评估;(6)基于上述内容,本文对典型应用场景中不同种类文本分类算法进行了性能总结对比;(7)本文分别从数据约束与模型计算两个层面对当前文本分类技术所面临的挑战和未来的重要研究方向进行了总结.本文通过梳理文本分类研究发展脉络,对涉及的代表性技术进行了详细总结和对比分析,有效填补了文本分类领域前沿技术的应用综述空白. 展开更多
关键词 文本分类 机器学习 深度学习 评价指标 数据约束
下载PDF
价值、分类与治理:一种自下而上的治理观念
18
作者 张乾友 《理论与改革》 北大核心 2024年第3期96-106,159,160,共13页
治理是一个自上而下的过程,也包含自下而上的根源。从自下而上的视角出发,每一个人都是一个价值主体,希望通过自己的价值创造行为来寻找自己在社会中的位置。在这个过程中,他们发现,自己的社会位置只能通过社会的分类体系而得到定位,于... 治理是一个自上而下的过程,也包含自下而上的根源。从自下而上的视角出发,每一个人都是一个价值主体,希望通过自己的价值创造行为来寻找自己在社会中的位置。在这个过程中,他们发现,自己的社会位置只能通过社会的分类体系而得到定位,于是,个体性的价值创造行为就转化成了群体性的分类斗争。分类斗争是社会中自发的秩序建构行为,它需要得到国家的确认,而治理的过程就表现为国家通过对分类体系的制度调整来回应作为价值主体的人们所发起的分类斗争的过程,其结果则是将作为价值主体的人们变成了分类权力的客体。这样一种关于治理的理解让我们既得以正视人作为价值主体的存在,又得以发现作为价值主体的人变成权力客体的不可避免性。 展开更多
关键词 价值主体 权力客体 分类权力 分类斗争 治理
下载PDF
基于Gaofen-2影像和面向对象的椰子林分类研究
19
作者 罗红霞 戴声佩 +4 位作者 李茂芬 李海亮 胡盈盈 郑倩 禹萱 《热带作物学报》 CSCD 北大核心 2024年第5期1021-1030,共10页
椰子是重要的热带经济作物,海南椰子种植面积占全国的90%以上。快速获取椰子种植面积及其空间分布信息对热带作物产业规划具有十分重要的作用。本研究基于国产Gaofen-2高分辨率卫星影像,以文昌市东郊镇为试验区,开展椰子林遥感分类研究... 椰子是重要的热带经济作物,海南椰子种植面积占全国的90%以上。快速获取椰子种植面积及其空间分布信息对热带作物产业规划具有十分重要的作用。本研究基于国产Gaofen-2高分辨率卫星影像,以文昌市东郊镇为试验区,开展椰子林遥感分类研究。基于最优分割尺度的面向对象分类方法,选取4个光谱特征、5个植被指数和32个纹理特征为辅助参量,构建了4种不同的面向对象分类组合(光谱特征、光谱特征+纹理特征组合、光谱特征+植被指数组合、光谱特征+纹理特征+植被指数特征组合)进行椰子林分类提取,并与基于像元的椰子林分类结果进行对比分析。结果表明:(1)仅采用基于像元分类方法,椰子林的总体分类精度(overall accuracy,OA)和用户精度(user’s accuracy,UA)分别达到87.05%和85.21%。(2)相比基于像元分类,4种面向对象分类组合的OA值提高了5.51%~8.72%。(3)光谱特征和纹理特征组合提取椰子林分类结果最优,OA值和UA值分别达到95.77%和97.15%;光谱特征和植被指数的组合也得到了较好的分类结果,OA值和UA值分别为94.88%和94.42%;所有的光谱特征、植被指数和纹理特征全部参与分类得到的OA值和UA值分别为94.67%和94.17%,低于仅使用光谱特征或者植被指数的组合。综上,国产高分辨率Gaofen-2影像在椰子林遥感精准识别中具有很大的潜力,结合纹理特征的面向对象分类方法可以更准确地提取椰子林分类信息,研究结果可为多云多雨地区大尺度椰子林遥感识别提供技术参考。 展开更多
关键词 椰子林 面向对象分类 分割尺度 Gaofen-2影像
下载PDF
基于语义引导层次化分类的雷达地面目标HRRP识别方法
20
作者 李阳 刘艺辰 +1 位作者 张亮 王彦华 《信号处理》 CSCD 北大核心 2024年第1期126-137,共12页
高分辨距离像(HRRP)反映了目标空间散射结构在雷达视线方向的投影,近年来被认为是地面目标识别的重要途径。现有的HRRP识别方法采用手工特征加传统机器学习分类器,均属于平面分类方法,即采用统一标准不加区别的优选特征并单次决策最终... 高分辨距离像(HRRP)反映了目标空间散射结构在雷达视线方向的投影,近年来被认为是地面目标识别的重要途径。现有的HRRP识别方法采用手工特征加传统机器学习分类器,均属于平面分类方法,即采用统一标准不加区别的优选特征并单次决策最终类别。然而该方法在实际应用中面临种类繁杂、数据不平衡、HRRP姿态敏感性等诸多问题,难以获取最佳的应用效果。层次化方法采取分而治之思想,将一个复杂的细粒度识别任务拆解为多个简单的识别子任务。本文采用层次化识别的思路,提出了一种基于语义引导层次化分类的雷达地面目标识别方法。该方法以联合语义和数据构建的树形结构将一个复杂的细粒度识别任务拆解为多个简单的识别子任务,并针对每一个识别子任务匹配一套优选特征集和一个局部分类器。本方法在仿真数据和实测数据上完成了验证。实验结果表明了本文方法处理地面目标识别任务的有效性。 展开更多
关键词 雷达目标识别 高分辨距离像 层次化分类
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部