期刊文献+
共找到16,532篇文章
< 1 2 250 >
每页显示 20 50 100
领域大语言模型下的古籍词性标注应用研究 被引量:2
1
作者 朱丹浩 赵志枭 +3 位作者 胡蝶 赵文华 孙光耀 王东波 《科技情报研究》 CSSCI 2024年第2期21-29,共9页
[目的/意义]大语言模型的发展为古籍文本挖掘带来了新的思路,将大语言模型与古籍数字化、智能化相结合是新时代古籍工作的必经之路。[方法/过程]文章使用《左传》词性标注语料,通过数据清洗和预处理,构建了一批高质量的词性标注指令数据... [目的/意义]大语言模型的发展为古籍文本挖掘带来了新的思路,将大语言模型与古籍数字化、智能化相结合是新时代古籍工作的必经之路。[方法/过程]文章使用《左传》词性标注语料,通过数据清洗和预处理,构建了一批高质量的词性标注指令数据,在此基础上,分别使用500、1 000、2 000、5 000条数据对大语言模型进行指令微调,并在另外1 000条数据上进行性能测试。[结果/结论]实验结果表明,“荀子”系列模型在古籍文本词性标注任务上性能优于通用领域模型,在微调数据量达到5 000时,Xunzi-Baichuan2-7B模型表现出了最优性能,F1值达到81.67%。 展开更多
关键词 大语言模型 “荀子”大模型 《左传》 词性标 指令微调
下载PDF
基于大语言模型的中文科技文献标注方法 被引量:2
2
作者 杨冬菊 黄俊涛 《计算机工程》 CAS CSCD 北大核心 2024年第9期113-120,共8页
高质量的标注数据是中文科技文献领域自然语言处理任务的重要基石。针对目前缺乏中文科技文献的高质量标注语料以及人工标注质量参差不齐且效率低下的问题,提出一种基于大语言模型的中文科技文献标注方法。首先,制定适用于多领域中文科... 高质量的标注数据是中文科技文献领域自然语言处理任务的重要基石。针对目前缺乏中文科技文献的高质量标注语料以及人工标注质量参差不齐且效率低下的问题,提出一种基于大语言模型的中文科技文献标注方法。首先,制定适用于多领域中文科技文献的细粒度标注规范,明确标注实体类型以及标注粒度;其次,设计结构化文本标注提示模板和生成解析器,将中文科技文献标注任务设置成单阶段单轮问答过程,将标注规范和带标注文本填充至提示模板中相应的槽位以构建任务提示词;然后,将提示词注入到大语言模型中生成包含标注信息的输出文本,经由解析器解析得到结构化的标注数据;最后,利用基于大语言模型的提示学习生成中文科技文献实体标注数据集ACSL,其中包含分布在48个学科的10000篇标注文档以及72536个标注实体,并在ACSL上提出基于RoBERTa-wwm-ext的3个基准模型。实验结果表明,BERT+Span模型在长跨度的中文科技文献实体识别任务中表现最佳,F1值为0.335。上述结果可作为后续研究的测试基准。 展开更多
关键词 文本标方法 中文科技文献 大语言模型 提示学习 信息抽取
下载PDF
基于知识标注平台的水利枢纽工程知识图谱构建及应用
3
作者 张军珲 昝红英 +2 位作者 欧佳乐 阎子悦 张坤丽 《计算机科学》 CSCD 北大核心 2024年第11期255-264,共10页
大量水利异构数据的产生,为领域知识图谱的构建及应用提供了场景,但也导致了水利知识图谱构建过程的差异。针对现有水利知识图谱构建流程复杂的问题,提出了一套有效的基于知识标注平台的水利知识图谱构建流程。以小浪底水利枢纽工程知... 大量水利异构数据的产生,为领域知识图谱的构建及应用提供了场景,但也导致了水利知识图谱构建过程的差异。针对现有水利知识图谱构建流程复杂的问题,提出了一套有效的基于知识标注平台的水利知识图谱构建流程。以小浪底水利枢纽工程知识的智能应用为例,使用该枢纽的工程数据,应用提出的流程在水利领域构建水利枢纽工程知识图谱(Water Conservancy Hub Project Knowledge Graph,WCHP-KG)。首先以小浪底水利枢纽工程为中心,依据行业术语标准和现有词汇表,制定了概念分类和关系描述体系,形成了WCHP-KG的模式层。通过BiLSTM-CRF和序列标注模型,在水利专家的指导下,使用知识标注平台对非结构化文本进行了半自动标注和人工校对,实现了知识融合,进而构建了WCHP-KG的数据层。结果表明WCHP-KG涵盖了43种水利实体以及110种实体关系。经过实践验证,构建的WCHP-KG为小浪底水利枢纽工程的相关应用提供了有力的结构化知识基础,为工程决策和管理提供了可靠的参考依据,进而证明了所提构建流程的有效性。未来将进一步扩展WCHP-KG和完善水利知识图谱的构建流程,以适应更多的应用场景和领域需求。 展开更多
关键词 异构数据 领域知识图谱 知识图谱构建 水利枢纽 知识标平台
下载PDF
基于多层优选卷积的水声信号样本自动标注方法
4
作者 王红滨 张帅 +1 位作者 何鸣 陈夏可 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第4期758-763,共6页
针对深度学习在水声研究领域的应用中面临大数据量要求和现有样本量限制的问题,本文提出了一种多层优选卷积网络模型。通过基于相似度的优选方法选出最佳卷积核,以提取更具代表性的特征。利用探索层特征融合策略,叠加多层卷积输出,获取... 针对深度学习在水声研究领域的应用中面临大数据量要求和现有样本量限制的问题,本文提出了一种多层优选卷积网络模型。通过基于相似度的优选方法选出最佳卷积核,以提取更具代表性的特征。利用探索层特征融合策略,叠加多层卷积输出,获取更全面的特征信息。采用约减策略优化模型,有效缩短运算时间。通过优选、特征融合和注意力机制,有效解决此类问题。实验结果表明,该模型在数据集上取得的最好的标注准确率为高基线模型1.12%;同时运行时间减少了43.5%。因此,该模型的使用提高了水声信号标注的准确率和效率。 展开更多
关键词 水声信号 自动标 声纹识别 多层优选卷积模型 时间优化 意力机制 特征融合
下载PDF
基于可调场景语义标注范围的家庭室内语义地图构建
5
作者 张淑珍 何镇 +2 位作者 查富生 侯致远 马玉祥 《中国惯性技术学报》 EI CSCD 北大核心 2024年第4期371-378,共8页
针对家庭室内环境语义地图建图速度较慢和在门口场景语义标注易出现错误等问题,提出一种基于可调场景语义标注范围的家庭室内语义地图构建方法。首先根据YOLOv5s识别的物体大小赋予相应的场景置信度,基于该场景置信度设置阈值使得语义... 针对家庭室内环境语义地图建图速度较慢和在门口场景语义标注易出现错误等问题,提出一种基于可调场景语义标注范围的家庭室内语义地图构建方法。首先根据YOLOv5s识别的物体大小赋予相应的场景置信度,基于该场景置信度设置阈值使得语义标注范围限制在机器人当前所在区域,确保场景切换时语义标注范围不会立即改变。然后基于人工势场虚拟力“引力斥力”原理,实现语义标注范围的扩大或缩小。最后结合阈值和动态语义标注范围,避免在门口场景中出现语义标注错误。实验结果表明:与Places205-VGG16神经网络建立家庭室内语义地图相比,所提方法平均效率和平均精准率分别提升了11.0%和7.8%,在家庭室内环境中具有一定的优越性。 展开更多
关键词 家庭室内环境 语义地图 场景识别模型 场景置信度 变语义标范围
下载PDF
基于自然标注的跨平台虚拟账号关联方法研究
6
作者 季铎 敬少杰 +1 位作者 彭如香 孔华锋 《计算机应用与软件》 北大核心 2024年第9期190-194,共5页
随着大数据时代的到来,跨平台虚拟账号的关联成为网络监管领域亟待解决的问题。该文以微博、微信等用户文本数据为研究对象,通过对数据的抽样和人工标注,开展开放式社交平台中跨平台账号自然标注行为的量化分析,并由此提出基于用户自然... 随着大数据时代的到来,跨平台虚拟账号的关联成为网络监管领域亟待解决的问题。该文以微博、微信等用户文本数据为研究对象,通过对数据的抽样和人工标注,开展开放式社交平台中跨平台账号自然标注行为的量化分析,并由此提出基于用户自然标注的跨平台虚拟账号的关联方法。该方法针对自然标注特点,构建基于上下字词特征的虚拟账号识别的模型,并利用二分类的深度学习模型进行昵称和用户的同一认证,最终实现对跨平台虚拟账号的识别,识别准确率达到85%以上。 展开更多
关键词 虚拟账号 自然标 账号关联
下载PDF
基于注意时序网络的中文词性标注方法
7
作者 张鹏 周志强 《计算机仿真》 2024年第5期378-382,共5页
针对传统的基于统计与规则的词性标注模型存在的人工特征依赖、字向量表征单一、特征提取不全面等问题,提出一种有效的基于注意时序网络的中文词性标注模型。对原始的TCN模型结构进行三点改进,并提出将注意时序网络与BiLSTM模型融合到... 针对传统的基于统计与规则的词性标注模型存在的人工特征依赖、字向量表征单一、特征提取不全面等问题,提出一种有效的基于注意时序网络的中文词性标注模型。对原始的TCN模型结构进行三点改进,并提出将注意时序网络与BiLSTM模型融合到词性标注方法中。上述模型首先通过XLNet模型获取字级别的上下文表示,利用注意时序网络的因果卷积结构获取更高层次的文本序列特征并通过注意力机制优化特征,最后通过BiLSTM进一步学习序列上下文特征,提高词性标注的准确度。实验表明,上述模型性能相较于其它模型有明显提升。 展开更多
关键词 词性标 时序卷积网络 意力机制 深度学习
下载PDF
某院抗肿瘤药物说明书信息标注情况调查与分析
8
作者 张裴 李欢欢 沈静 《临床合理用药杂志》 2024年第7期138-141,共4页
目的 调查分析抗肿瘤药物说明书中用药信息标注情况,为医务工作者与患者合理用药提供参考。方法 收集2021年新疆医科大学第五附属医院使用的抗肿瘤药物说明书,统计分析标注信息完整性及存在的问题。结果 52份抗肿瘤药物说明书中,适应证... 目的 调查分析抗肿瘤药物说明书中用药信息标注情况,为医务工作者与患者合理用药提供参考。方法 收集2021年新疆医科大学第五附属医院使用的抗肿瘤药物说明书,统计分析标注信息完整性及存在的问题。结果 52份抗肿瘤药物说明书中,适应证、用法用量的标注率为100.00%,辅料标注率为55.77%;不良反应的发生率、临床症状、处理措施的标注率分别为84.62%、100.00%、21.15%;特殊人群用药的肝肾功能不全者、儿童、老年人、妊娠期或哺乳期女性的标注率分别为82.69%、100.00%、82.69%、76.92%;药物相互作用的标注率为98.08%;药理作用和毒理作用的标注率分别为82.69%和67.31%。结论 抗肿瘤药物说明书标注项目需要进一步规范、完善,建议生产企业及时修订说明书,药监部门加强完善说明书的审批流程。 展开更多
关键词 抗肿瘤药物 药品说明书 用药信息
下载PDF
建筑行业三维标注(MBD)技术研究和应用展望
9
作者 范华冰 朱卓晖 林晶 《土木建筑工程信息技术》 2024年第2期95-99,共5页
随着建筑业数字化、工业化的大力发展,业内对三维标注技术(MBD)的需求日益提升。然而在目前的工作流程中,设计、模拟以及生产的数据一体化框架仍不完善,难以满足实际建筑工程的需要。现阶段BIM技术缺乏关于MBD技术的方法与标准,导致即... 随着建筑业数字化、工业化的大力发展,业内对三维标注技术(MBD)的需求日益提升。然而在目前的工作流程中,设计、模拟以及生产的数据一体化框架仍不完善,难以满足实际建筑工程的需要。现阶段BIM技术缺乏关于MBD技术的方法与标准,导致即便设计流程采用全三维设计方式,但最终仍需转换为二维图纸交付生产,其与传统设计流程在本质上并未产生明显区别。本文主要围绕建筑行业MBD技术进行研究与应用展望,包括MBD技术发展历程、相关标注标准的体系构建以及应用的潜在方向,旨在为建筑产品全生命周期管理(PLM)提供基础理论技术支持,也为建筑行业发展提供新的发展思路。 展开更多
关键词 三维标技术 产品全生命周期管理 BIM技术 基于模型的定义
下载PDF
数据标注治理:可信人工智能的后台风险与治理转向
10
作者 胡泳 张文杰 《云南社会科学》 CSSCI 北大核心 2024年第6期29-36,共8页
在人工智能模型训练前,须先对数据进行人工识别与标注,因此处于“后台”的数据标注成为引致人工智能“前台”幻觉与偏见风险的重要环节。近年来,隐蔽于人工智能后台的数据标注劳动者随着政策文件、媒体报道和调查报告的公布而逐渐浮现,... 在人工智能模型训练前,须先对数据进行人工识别与标注,因此处于“后台”的数据标注成为引致人工智能“前台”幻觉与偏见风险的重要环节。近年来,隐蔽于人工智能后台的数据标注劳动者随着政策文件、媒体报道和调查报告的公布而逐渐浮现,进一步推动学界警惕与反思技术革新的神秘化倾向。然而,从风险治理的角度来看,参与数据标注实践的多元主体仍然处于权责模糊的灰色地带,阻碍了可信人工智能目标的实现。全球主要经济体的数据标注治理路线显示,当前针对数据标注的治理对象以“人工智能服务提供者”为主,且倾向于将数据置于私人个体秩序中。通往可信人工智能的风险治理亟须将治理范围从“提供者”拓展至“数据供应链”,建设一种多元主体共同参与的集体性治理制度,进而更为细致地关照人工智能生产中的相关群体利益,为不稳定的数据劳动者提供具体的社会保障。 展开更多
关键词 数据标 数据治理 幻觉 偏见 幽灵工作
下载PDF
词类标注对词典释义的促进作用
11
作者 谭景春 《汉语学报》 CSSCI 北大核心 2024年第4期80-91,共12页
词类标注和词典释义有着密切的关系。从词类标注的视角来审视词典释义,更容易发现释义中以前不易发现的问题,可以使释义更加严谨、更加精细化,从而促进词典释义的质量提高。本文从词目和释义词语的语法属性的一致性、动词和形容词义项... 词类标注和词典释义有着密切的关系。从词类标注的视角来审视词典释义,更容易发现释义中以前不易发现的问题,可以使释义更加严谨、更加精细化,从而促进词典释义的质量提高。本文从词目和释义词语的语法属性的一致性、动词和形容词义项的增补、虚词释义的修改、冗余义项的删除四个方面对此予以阐述。每个方面选取若干条目,这些条目都是因词类标注而发现释义存在问题,从而对释义做出了相应的修订。通过对它们的修订来具体说明词类标注对词典释义的促进作用。 展开更多
关键词 词类标 词典释义 词典修订 《现代汉语词典》
下载PDF
《现代汉语词典》数量词标注相关问题考察
12
作者 殷树林 王婷婷 《汉语学习》 CSSCI 北大核心 2024年第5期13-23,共11页
文章对《现代汉语词典》(第7版)中标注的42个数量词进行考察,主要从意义和结构的六个方面区分了词和短语,根据功能、参考意义归纳出名词8个、形容词8个、代词3个、副词和助词各1个。文章最后认为数量词不宜单独立类,数量词应归入现代汉... 文章对《现代汉语词典》(第7版)中标注的42个数量词进行考察,主要从意义和结构的六个方面区分了词和短语,根据功能、参考意义归纳出名词8个、形容词8个、代词3个、副词和助词各1个。文章最后认为数量词不宜单独立类,数量词应归入现代汉语现有词类,而数量短语不应做类型标注。 展开更多
关键词 《现代汉语词典》 数量词 词类标
下载PDF
社会协作标注探究法:一种促进研究生文献阅读核心能力的教学模式探索
13
作者 李海峰 李广鑫 《现代教育技术》 CSSCI 2024年第6期53-62,共10页
文献阅读是研究生的核心科学研究能力,然而阅读无深度、问题难提出、创新鲜生成以及教学模式难支撑等问题,制约着研究生的科学研究能力培养。针对这些问题,文章基于社会建构主义、知识创造理论和翻转教学模式,利用社会协作标注技术,构... 文献阅读是研究生的核心科学研究能力,然而阅读无深度、问题难提出、创新鲜生成以及教学模式难支撑等问题,制约着研究生的科学研究能力培养。针对这些问题,文章基于社会建构主义、知识创造理论和翻转教学模式,利用社会协作标注技术,构建了社会协作标注探究法教学模式。同时,文章采用基于设计的研究方法开展教学实验,使研究生利用钉钉的文档协作标注功能进行文献协作标注学习。实验表明,该模式能显著提升研究生的文献阅读深度学习、批判性思维能力、创造性思维能力和学习体验。为确保协作标注学习效果,教师需精心设计学习资源、学习支架、学习型组织和翻转学习活动。文章通过研究,旨在为提升研究生的文献阅读能力提供教学模式参考。 展开更多
关键词 社会标 文献阅读 教学模式 研究生培养 教学改革
下载PDF
基于无监督学习的抽油机井示功图自动聚类与批量标注方法
14
作者 王相 邵志伟 +2 位作者 张雷 张中慧 肖姝 《中国科技论文》 CAS 2024年第1期63-69,共7页
为充分利用大量未标注样本、节约人力与时间,提出了基于无监督学习的抽油机井示功图自动聚类与批量标注方法。首先,将抽油机驴头往复运动产生的位移、载荷数据转化为示功图图片样本,其中,示功图的横坐标为位移,纵坐标为载荷;其次,加载在... 为充分利用大量未标注样本、节约人力与时间,提出了基于无监督学习的抽油机井示功图自动聚类与批量标注方法。首先,将抽油机驴头往复运动产生的位移、载荷数据转化为示功图图片样本,其中,示功图的横坐标为位移,纵坐标为载荷;其次,加载在ImageNet上训练过的带有一系列权重参数、具有强特征提取能力的卷积神经网络模型;然后,去除该网络模型的全连接层,利用该网络模型提取示功图图片样本的特征;最后,利用k-means聚类算法对提取到的特征进行聚类分析,将具有相似特征的示功图聚到同一文件夹中。批量的对示功图聚类结果进行快速标注,从而形成抽油机井故障诊断的示功图样本集。实验随机搜集了100口抽油机井的20 000条示功图数据,结果表明,基于无监督学习的抽油机井示功图自动聚类与批量标注方法耗时短、准确率高,为示功图样本集标注提供了一种高效方法,对于充分挖掘油田大数据的应用价值具有示范意义。 展开更多
关键词 抽油机 示功图 故障诊断 K-MEANS聚类 样本标
下载PDF
电磁大数据自动化标注补全算法
15
作者 王娜 杨君子 邵怀宗 《电讯技术》 北大核心 2024年第10期1705-1710,共6页
针对实际应用中电子侦察数据存在的数据质量差、标注率低等问题,将多传感器数据自动化标注问题抽象为稀疏矩阵恢复问题,在多平台多类型待标注监测数据与低秩稀疏矩阵之间建立正确的语义映射,进而转化为求解优化问题,并基于凸秩最小化算... 针对实际应用中电子侦察数据存在的数据质量差、标注率低等问题,将多传感器数据自动化标注问题抽象为稀疏矩阵恢复问题,在多平台多类型待标注监测数据与低秩稀疏矩阵之间建立正确的语义映射,进而转化为求解优化问题,并基于凸秩最小化算法对目标函数进行迭代以求得最优解。仿真实验结果表明,算法模型在目标特征信息缺失率40%~50%的恶劣情况下,恢复矩阵与原始矩阵的的最小均方根误差维持在0.06左右,能够有效实现矩阵恢复与数据的自动化标注。 展开更多
关键词 电子侦察 电磁大数据 自动化标 稀疏矩阵 低秩矩阵恢复
下载PDF
基于平行交互注意力网络的中文电子病历实体及关系联合抽取
16
作者 李丽双 王泽昊 +1 位作者 秦雪洋 袁光辉 《中文信息学报》 CSCD 北大核心 2024年第6期108-118,共11页
基于电子病历构建医学知识图谱对医疗技术的发展具有重要意义,实体和关系抽取是构建知识图谱的关键技术。该文针对目前实体关系联合抽取中存在的特征交互不充分的问题,提出了一种平行交互注意力网络(PIAN)以充分挖掘实体与关系的相关性... 基于电子病历构建医学知识图谱对医疗技术的发展具有重要意义,实体和关系抽取是构建知识图谱的关键技术。该文针对目前实体关系联合抽取中存在的特征交互不充分的问题,提出了一种平行交互注意力网络(PIAN)以充分挖掘实体与关系的相关性,在多个标准的医学和通用数据集上取得最优结果;当前中文医学实体及关系标注数据集较少,该文基于中文电子病历构建了实体和关系抽取数据集(CEMRIE),与医学专家共同制定了语料标注规范,并基于该文所提出的模型实验得出基准结果。 展开更多
关键词 实体关系联合抽取 双向特征交互模块 意力机制 中文电子病历 数据集标与构建
下载PDF
基于双分支注意力机制的图像自动标注研究
17
作者 张国有 崔永强 《计算机技术与发展》 2024年第9期167-173,共7页
图像自动标注技术能够将图像低层视觉特征转化为人类理解的高层语义信息,增强图像的可理解性和可搜索性,在图像检索和图像分类领域具有重要的应用价值。目前,基于卷积神经网络模型的图像自动标注技术,仍存在浅层网络无法捕捉足够的特征... 图像自动标注技术能够将图像低层视觉特征转化为人类理解的高层语义信息,增强图像的可理解性和可搜索性,在图像检索和图像分类领域具有重要的应用价值。目前,基于卷积神经网络模型的图像自动标注技术,仍存在浅层网络无法捕捉足够的特征信息、容易忽视标签之间的相互关系以及标注时难以确定标签数量的问题。该文提出的基于双分支注意力机制的图像自动标注模型,首先使用双分支注意力网络,增强图像特征和标签的相关性以及学习标签之间的相关性;其次在空间注意力分支增加多尺度特征提取模块,以提取图像的多尺度特征,解决浅层网络特征提取不充分的问题;再次通过融合模块,融合两个分支的输出,将图像特征进一步增强;最后通过标签数量预测模块,预测待标注图像的标签数量,进一步提高标注的准确性。该模型分别在三个基准数据集Corel 5K、ESP Game和IAPR-TC-12上进行实验分析,实验结果表明该模型可以有效解决上述问题,提高标注的有效性与准确性。 展开更多
关键词 图像自动标 卷积神经网络 多尺度特征 意力机制 特征融合
下载PDF
可见、遮蔽与调适:“幽灵劳工”的社会技术想象及其纠偏——以数据标注员为例
18
作者 郑素侠 张莹 《新媒体与网络》 2024年第3期1-12,共12页
伴随人工智能的深度应用,技术与劳动的结合更加紧密,辅助技术介入劳动已经成为当下劳动市场的重要变革。作为智能技术系统中的“幽灵劳工”,数据标注员在社会技术想象中逐渐“被看见”。对微博平台“数据标注员”话题下的原创发帖分析发... 伴随人工智能的深度应用,技术与劳动的结合更加紧密,辅助技术介入劳动已经成为当下劳动市场的重要变革。作为智能技术系统中的“幽灵劳工”,数据标注员在社会技术想象中逐渐“被看见”。对微博平台“数据标注员”话题下的原创发帖分析发现,社会行动者从待遇、身份、未来三个层面建构了标注员的职业想象,赋予该职业以积极意义。深度访谈发现,数据标注员在劳动场域中受到线上流水线工作模式、系统算法控制和劳动分层的影响;面对想象与现实间的偏差,数据标注员通过再技能化、去平台化与个体脱域三种策略完成对主流社会想象的自我纠偏。 展开更多
关键词 人工智能 “幽灵劳工” 社会技术想象 数据标
下载PDF
基于超像素标注的岩石薄片图像训练数据
19
作者 程国建 邓文华 符宇龙 《信息技术与信息化》 2024年第6期93-95,102,共4页
图像标注在计算机视觉中起着至关重要的作用。鉴于岩石薄片图像的复杂性,长期以来,为岩石薄片图像手动创建语义标签是一项耗时、耗力的事。为了加快岩石薄片图像像素级标注速度,提出了一种基于超像素标注的方法生成岩石薄片图像的机器... 图像标注在计算机视觉中起着至关重要的作用。鉴于岩石薄片图像的复杂性,长期以来,为岩石薄片图像手动创建语义标签是一项耗时、耗力的事。为了加快岩石薄片图像像素级标注速度,提出了一种基于超像素标注的方法生成岩石薄片图像的机器学习训练数据集。首先,使用超像素算法进行预分割处理;然后,进行区域合并,提取到岩石颗粒的边界;最后,通过交互式的标注工具,人为给岩石颗粒包含的超像素区域分配指定标签。结果表明,所提出的方法能够避免人为标注岩石颗粒的边界决策问题,可以对薄片图像进行快速标注并生成高质量的语义图像数据,推动岩石薄片图像在深度学习领域的研究。 展开更多
关键词 图像标 岩石薄片图像 语义标签 像素级标 超像素分割
下载PDF
基于词性标注的启发式在线日志解析方法 被引量:2
20
作者 蒋金钊 傅媛媛 徐建 《计算机应用研究》 CSCD 北大核心 2024年第1期217-221,共5页
为了解决现有启发式日志解析方法中日志特征表示区分能力不足导致解析精度低、泛化差的问题,提出了一种启发式在线日志解析方法PosParser。该方法使用来源于触发词概念的功能词序列作为特征表示,包含解决复杂日志易过度解析问题的两阶... 为了解决现有启发式日志解析方法中日志特征表示区分能力不足导致解析精度低、泛化差的问题,提出了一种启发式在线日志解析方法PosParser。该方法使用来源于触发词概念的功能词序列作为特征表示,包含解决复杂日志易过度解析问题的两阶段检测方法和处理变长参数日志的后处理流程。PosParser在16个真实日志数据集上取得了0.952的平均解析准确率,证明了功能词序列具有良好区分性、PosParser有良好的解析效果和鲁棒性。 展开更多
关键词 日志分析 日志解析 触发词提取 词性标 系统运维
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部