针对学术论文在学科领域内进行层次标签分类问题,提出了一种基于知识增强的语义表示与图注意力网络的文本层次标签分类(text hierarchical label classification based on enhanced representation through knowledge integration and g...针对学术论文在学科领域内进行层次标签分类问题,提出了一种基于知识增强的语义表示与图注意力网络的文本层次标签分类(text hierarchical label classification based on enhanced representation through knowledge integration and graph attention networks, GETHLC)模型。首先,通过层次标签抽取模块提取学科领域下层次标签的结构特征,并通过预训练模型对学术论文的摘要、标题和抽取后的层次标签结构特征进行嵌入;然后,在分类阶段基于层次标签的结构分层构造层次分类器,将学术论文逐层分类至最符合的类别中。在大规模中文科学文献数据集CSL上进行的实验结果表明,与基准的ERNIE模型相比,GETHLC模型的准确率、召回率和F1值分别提升了5.78、4.31和5.02百分点。展开更多
针对传统的群组推荐预定义策略过于单一,忽视用户与项目之间的交互性,无法捕捉时间推移所造成的用户偏好迁移等问题,提出一种融合时间序列和注意力机制的群组推荐模型TAGR(time-attitation group rememdation)。首先通过层次聚类划分出...针对传统的群组推荐预定义策略过于单一,忽视用户与项目之间的交互性,无法捕捉时间推移所造成的用户偏好迁移等问题,提出一种融合时间序列和注意力机制的群组推荐模型TAGR(time-attitation group rememdation)。首先通过层次聚类划分出高相似度群组,其次引入时间序列模型来捕捉用户偏好迁移过程,获取每个时刻用户行为的兴趣偏好,并聚合各时刻兴趣偏好作为用户偏好。最后结合注意力机制,获得用户权重进行偏好融合来表示群组偏好,最终作为推荐模型的输入。通过在Goodbook与MovieLens数据集上与NCF、AGREE等模型进行对比,TAGR在归一化折扣累计增益和命中率2个指标上都得到了显著提高。展开更多
[目的/意义]针对当前玫瑰鲜切花分级仍依赖人工进行简单分级,造成效率低、准确率低等问题,提出一种新的模型Flower-YOLOv8s来实现玫瑰鲜切花的分级检测。[方法]以单一背景下单支玫瑰花的花头作为检测目标,将鲜切花分为A、B、C、D四个等...[目的/意义]针对当前玫瑰鲜切花分级仍依赖人工进行简单分级,造成效率低、准确率低等问题,提出一种新的模型Flower-YOLOv8s来实现玫瑰鲜切花的分级检测。[方法]以单一背景下单支玫瑰花的花头作为检测目标,将鲜切花分为A、B、C、D四个等级,对YOLOv8s(You Only Look Once version 8 small)模型进行了优化改进。首先,构建了一个全新的玫瑰鲜切花分级检测数据集。其次,在YOLOv8s的骨干网络分别添加CBAM(Con⁃volutional Block Attention Module)和SAM(Spatial Attion Module)两个注意力机制模块进行对比实验;选择SAM模块并对其进一步优化,针对模型轻量化需求,再结合深度可分离卷积模块一起添加到C2f结构中,形成Flower-YOLOv8s模型。[结果和讨论]从实验结果来看YOLOv8s添加SAM的模型具有更高的检测精度,mAP@0.5达到86.4%。Flower-YOLOv8s相较于基线模型精确率提高了2.1%,达到97.4%,平均精度均值(mAP)提高了0.7%,同时降低了模型参数和计算量,分别降低2.26 M和4.45 MB;最后使用相同的数据集和预处理方法与Fast-RCNN、Faster-RCNN、SSD、YOLOv3、YOLOv5s和YOLOv8s进行对比实验,证明所提出的实验方法综合强于其他经典YOLO模型。[结论]提出的基于改进YOLOv8s的玫瑰鲜切花分级方法研究能有效提升玫瑰鲜切花分级检测的精准度,为玫瑰鲜切花分级检测技术提供一定的参考价值。展开更多
针对目前自动ICD(international classification of diseases)编码任务存在标签空间大、诊断代码分布不均衡与临床文本表征差的问题,提出一种融合Longformer与标签注意力的分层ICD自动编码模型。借助Clinical-Longformer预训练语言模型...针对目前自动ICD(international classification of diseases)编码任务存在标签空间大、诊断代码分布不均衡与临床文本表征差的问题,提出一种融合Longformer与标签注意力的分层ICD自动编码模型。借助Clinical-Longformer预训练语言模型获得融合长文本语境的词向量表征。通过将标签的语义表示与注意力机制相结合,捕捉临床文本中与诊断代码相关的关键特征信息,获取更精准的文本表示。引入分层联合学习机制,建立分层预测层解码输出ICD编码。实验结果表明,该模型的准确率、召回率与F1值均高于现有模型,验证了该方法进行自动ICD编码的有效性,为实施疾病诊断相关分组提供高质量的数据支撑。展开更多
文摘针对学术论文在学科领域内进行层次标签分类问题,提出了一种基于知识增强的语义表示与图注意力网络的文本层次标签分类(text hierarchical label classification based on enhanced representation through knowledge integration and graph attention networks, GETHLC)模型。首先,通过层次标签抽取模块提取学科领域下层次标签的结构特征,并通过预训练模型对学术论文的摘要、标题和抽取后的层次标签结构特征进行嵌入;然后,在分类阶段基于层次标签的结构分层构造层次分类器,将学术论文逐层分类至最符合的类别中。在大规模中文科学文献数据集CSL上进行的实验结果表明,与基准的ERNIE模型相比,GETHLC模型的准确率、召回率和F1值分别提升了5.78、4.31和5.02百分点。
文摘针对传统的群组推荐预定义策略过于单一,忽视用户与项目之间的交互性,无法捕捉时间推移所造成的用户偏好迁移等问题,提出一种融合时间序列和注意力机制的群组推荐模型TAGR(time-attitation group rememdation)。首先通过层次聚类划分出高相似度群组,其次引入时间序列模型来捕捉用户偏好迁移过程,获取每个时刻用户行为的兴趣偏好,并聚合各时刻兴趣偏好作为用户偏好。最后结合注意力机制,获得用户权重进行偏好融合来表示群组偏好,最终作为推荐模型的输入。通过在Goodbook与MovieLens数据集上与NCF、AGREE等模型进行对比,TAGR在归一化折扣累计增益和命中率2个指标上都得到了显著提高。
文摘[目的/意义]针对当前玫瑰鲜切花分级仍依赖人工进行简单分级,造成效率低、准确率低等问题,提出一种新的模型Flower-YOLOv8s来实现玫瑰鲜切花的分级检测。[方法]以单一背景下单支玫瑰花的花头作为检测目标,将鲜切花分为A、B、C、D四个等级,对YOLOv8s(You Only Look Once version 8 small)模型进行了优化改进。首先,构建了一个全新的玫瑰鲜切花分级检测数据集。其次,在YOLOv8s的骨干网络分别添加CBAM(Con⁃volutional Block Attention Module)和SAM(Spatial Attion Module)两个注意力机制模块进行对比实验;选择SAM模块并对其进一步优化,针对模型轻量化需求,再结合深度可分离卷积模块一起添加到C2f结构中,形成Flower-YOLOv8s模型。[结果和讨论]从实验结果来看YOLOv8s添加SAM的模型具有更高的检测精度,mAP@0.5达到86.4%。Flower-YOLOv8s相较于基线模型精确率提高了2.1%,达到97.4%,平均精度均值(mAP)提高了0.7%,同时降低了模型参数和计算量,分别降低2.26 M和4.45 MB;最后使用相同的数据集和预处理方法与Fast-RCNN、Faster-RCNN、SSD、YOLOv3、YOLOv5s和YOLOv8s进行对比实验,证明所提出的实验方法综合强于其他经典YOLO模型。[结论]提出的基于改进YOLOv8s的玫瑰鲜切花分级方法研究能有效提升玫瑰鲜切花分级检测的精准度,为玫瑰鲜切花分级检测技术提供一定的参考价值。
文摘针对目前自动ICD(international classification of diseases)编码任务存在标签空间大、诊断代码分布不均衡与临床文本表征差的问题,提出一种融合Longformer与标签注意力的分层ICD自动编码模型。借助Clinical-Longformer预训练语言模型获得融合长文本语境的词向量表征。通过将标签的语义表示与注意力机制相结合,捕捉临床文本中与诊断代码相关的关键特征信息,获取更精准的文本表示。引入分层联合学习机制,建立分层预测层解码输出ICD编码。实验结果表明,该模型的准确率、召回率与F1值均高于现有模型,验证了该方法进行自动ICD编码的有效性,为实施疾病诊断相关分组提供高质量的数据支撑。