期刊文献+
共找到5,272篇文章
< 1 2 250 >
每页显示 20 50 100
1株猪源动物联合乳杆菌S7全基因组测序及生物信息学分析
1
作者 刘辉 季海峰 +2 位作者 王四新 陈美霞 张董燕 《中国畜牧兽医》 北大核心 2025年第1期25-38,共14页
[目的]旨在对1株具有较强耐酸耐胆盐特性的猪源动物联合乳杆菌S7进行全基因组测序及生物信息学分析。[方法]结合三代PacBio RSⅡ和二代Illumina HiSeq 2000测序技术对动物联合乳杆菌S7进行了全基因组测序,在此基础上使用GO、EggNOG、KEG... [目的]旨在对1株具有较强耐酸耐胆盐特性的猪源动物联合乳杆菌S7进行全基因组测序及生物信息学分析。[方法]结合三代PacBio RSⅡ和二代Illumina HiSeq 2000测序技术对动物联合乳杆菌S7进行了全基因组测序,在此基础上使用GO、EggNOG、KEGG、CAZy、VFDB和CARD等数据库注释功能基因,利用TYGS(Type Strain Genome Server)构建系统发育树,并与2株同源模式菌株进行了共线性分析。[结果]动物联合乳杆菌S7的基因组大小为2.03 Mb, GC含量为44.14%,共预测到1 993个编码基因,包含65个tRNA、19个rRNA、35个sRNA、29个持家基因、11个基因组岛、6个前噬菌体、4个CRISPR-Cas、8个插入序列和10个转座子;分别有1 521、1 567、1 185和60个基因在GO、EggNOG、KEGG和CAZy数据库中得到注释;在VFDB和CARD数据库中注释到181个毒力基因和110个耐药基因;另外有14个基因参与耐酸,2个基因参与耐胆盐,22个基因参与黏附和聚集;基因组中还包括与温度应激、氧化应激和细菌素合成等多种与益生功能相关的基因。系统发育树和共线性分析发现,该菌株与模式菌株Ligilactobacillus animalis P38的进化关系最近。[结论]动物联合乳杆菌S7基因组中具有与耐酸、耐胆盐、黏附和聚集、温度应激、氧化应激和细菌素等相关的功能基因,可为菌株在饲料添加剂中的科学应用提供理论依据。 展开更多
关键词 动物联合乳杆菌 全基因组测序 基因注释
下载PDF
亡佚的经典:试论《苍颉篇》的经典化及经典地位
2
作者 白军鹏 《东北师大学报(哲学社会科学版)》 北大核心 2025年第1期99-106,共8页
《苍颉篇》的经典地位问题以往学者均未论及,它是秦代“书同文”政策的产物,也是这一活动的重要组成,在文字编排及结构两个方面都深刻地影响了《说文解字》的编纂。在汉代,《苍颉篇》不仅与入仕息息相关,从同墓葬的伴出文献可推知它也... 《苍颉篇》的经典地位问题以往学者均未论及,它是秦代“书同文”政策的产物,也是这一活动的重要组成,在文字编排及结构两个方面都深刻地影响了《说文解字》的编纂。在汉代,《苍颉篇》不仅与入仕息息相关,从同墓葬的伴出文献可推知它也是深受贵族重视的典籍,尤其值得重视的是它对汉代辞赋家产生过重要影响。通过官方所组织的两次文字会议均以之为核心来看,除表明《苍颉篇》的特殊地位,还可知其与古文经学有重要的关联。经过扬雄、杜林、张揖、郭璞等的注释工作后,《苍颉篇》的身份在南北朝隋唐时期发生了转换,它开始成为学者注释古书的重要参考。本文所论也提示我们应该重新审视对虽已亡佚却在历史上产生过深远影响的古书的评价。 展开更多
关键词 《苍颉篇》 经典 文本 注释
下载PDF
文献信息资源用户泛在化标注模式研究
3
作者 叶光辉 吴兰琦 +2 位作者 毕崇武 李松烨 梁博 《图书馆杂志》 北大核心 2025年第1期44-60,共17页
文献资源是数字图书馆最重要的信息资源,然而当前文献信息资源泛在服务能力不足问题凸显。研究以学术论文为文献信息资源代表,提出用户泛在化标注体系。首先,基于文献调研法和德尔菲法构建用户泛在化标注体系,设计用户泛在化标注系统收... 文献资源是数字图书馆最重要的信息资源,然而当前文献信息资源泛在服务能力不足问题凸显。研究以学术论文为文献信息资源代表,提出用户泛在化标注体系。首先,基于文献调研法和德尔菲法构建用户泛在化标注体系,设计用户泛在化标注系统收集标注者、标注行为和标注内容数据;然后,使用统计分析、时间序列分析等方法进行特征揭示,根据用户标注数据分析标注者个体特征、标注内容分布及演化特征;最后,研究采用用户实验和问卷相结合的方法开展用户阅读实验,验证用户泛在化标注体系的有效性,评估用户泛在化标注、传统分类主题标注的学术论文阅读效果是否存在差异。研究发现:用户泛在化标注体系多维揭示了学术论文的内容特征与形式特征,获得较高用户满意度。用户泛在化标注是对传统分类主题标注的重要补充,探索用户泛在化标注模式有助于改善用户阅读体验,提升学术资源泛在服务能力。 展开更多
关键词 文献信息资源 用户泛在化标注 传统分类主题标注 泛在服务 资源组织
下载PDF
顾宸《辟疆园杜诗注解》笺注特点考论——以《秋兴八首》为中心
4
作者 李牧 《邢台学院学报》 2025年第1期118-126,共9页
清初顾宸所著《辟疆园杜诗注解》借鉴钱谦益诗史互证的诠释方法,在钩沉史事进行诠释的同时,亦注重立足诗歌文本进行诠释,善于剖析诗作章法结构,于诗情、诗意能在时代大背景下结合杜甫的经历、心境作设身处地的分析与阐发。以《秋兴八首... 清初顾宸所著《辟疆园杜诗注解》借鉴钱谦益诗史互证的诠释方法,在钩沉史事进行诠释的同时,亦注重立足诗歌文本进行诠释,善于剖析诗作章法结构,于诗情、诗意能在时代大背景下结合杜甫的经历、心境作设身处地的分析与阐发。以《秋兴八首》为中心考察《辟疆园杜诗注解》的笺注特点,从以史证诗、注重章法和以情作注三个方面展开讨论,探究其对钱谦益诗史互证方法的继承与运用,能够发掘顾宸笺注杜诗之优长,认识其不足,从而对这一杜诗注本的笺注方法与特点有更为具体深入的认知。 展开更多
关键词 《辟疆园杜诗注解》 《秋兴八首》 顾宸 杜诗注本 笺注特点
下载PDF
卞圜及其杜诗注发微
5
作者 王晓彤 《杜甫研究学刊》 2025年第1期34-45,共12页
卞大亨、卞圜父子均为南宋前期著名的文学家,然《宋史》无传。卞圜生平事迹史料多自地方志及目录史志中钩沉,其著述均散佚,惟有杜诗注释若干条有赖各家集注传抄,得以保存。蔡梦弼《杜工部草堂诗笺》保存“卞圜注”最多,南宋校订本《文... 卞大亨、卞圜父子均为南宋前期著名的文学家,然《宋史》无传。卞圜生平事迹史料多自地方志及目录史志中钩沉,其著述均散佚,惟有杜诗注释若干条有赖各家集注传抄,得以保存。蔡梦弼《杜工部草堂诗笺》保存“卞圜注”最多,南宋校订本《文苑英华》引用部分异文,《集千家注批点杜工部诗集》《钱注杜诗》亦有征引,结合选本、诗话笔记所载,可集腋以观。“卞圜注”在校刊异字、地理名物辨析、诗史互证、辑佚及辨伪等方面价值颇高。亦能反映南渡基层文人注杜的身份认同与情感共鸣。 展开更多
关键词 杜甫 卞大亨 卞圜 注释 身份认同
下载PDF
《说文解字》段注古今字、正俗字研究
6
作者 殷晟 《南京理工大学学报(社会科学版)》 2025年第1期71-77,88,共8页
古文字学是“强基计划”重要的组成部分,古文字研究对于增强文化自信具有重要意义。段玉裁所著《说文解字注》是研究《说文解字》的集大成之作,为后人的研究提供了丰富的文字实证材料和许多具有启发性的思想。书中将汉字的发展,尤其是... 古文字学是“强基计划”重要的组成部分,古文字研究对于增强文化自信具有重要意义。段玉裁所著《说文解字注》是研究《说文解字》的集大成之作,为后人的研究提供了丰富的文字实证材料和许多具有启发性的思想。书中将汉字的发展,尤其是字体、字形、字音作详要注释。以其中古今字、正俗字为例,分析书中对于其界定方式和注释用语,有助于重新认识文字演化的规律。 展开更多
关键词 《说文解字》 段注 古今字 正俗字
下载PDF
基于DBNet-CST的文本检测模型
7
作者 邓伟超 俞鑫春 +5 位作者 朱建宝 马青山 陈宇 叶超 张才智 葛春燕 《通信与信息技术》 2025年第1期100-103,共4页
光学字符识别(Optical Character Recognition,OCR)能够从图像数据中自动检测和识别文本区域,将其转换成可编辑和可搜索的数字化文本,在提升工作效率、缩短人力成本中扮演重要角色。文本检测是OCR技术的前提,目前已有许多成功的研究。然... 光学字符识别(Optical Character Recognition,OCR)能够从图像数据中自动检测和识别文本区域,将其转换成可编辑和可搜索的数字化文本,在提升工作效率、缩短人力成本中扮演重要角色。文本检测是OCR技术的前提,目前已有许多成功的研究。然而,现有方法在训练过程中未充分利用人工标注信息,导致监督信号的精度受限,进而影响文本检测模型的检测精度。针对此问题,提出了一种基于完备监督训练的可微分二值化文本检测模型(Differentiable Binarized Net based on Complete Supervised Training,DBNet-CST),它能够充分利用人工标注的文本区域信息,优化监督信号的精度,从而提高文本检测模型的性能。实验证明,该方法在自然场景文本检测任务中能够取得更为精确的结果。 展开更多
关键词 文本检测 可微分二值化 完备监督训练 人工标定 光学字符识别
下载PDF
The History of the Former Han Dynasty:A Critical Translation with Annotations Translated by Homer Hasenpflug Dubs
8
作者 JIANG Yuan-yuan 《Journal of Literature and Art Studies》 2018年第7期1051-1057,共7页
Translation is an important medium of cultural communication.It is not a mere transfer of two languages,but the interaction of two cultures.Cultural misreading,which results from cultural discrepancy and translator’s... Translation is an important medium of cultural communication.It is not a mere transfer of two languages,but the interaction of two cultures.Cultural misreading,which results from cultural discrepancy and translator’s subjectivity,truly reflects where the blockade and conflict in the cultural communication is.Cultural misreading is an objective phenomenon that exists in the entire process of translation.This paper intends to make a comprehensive analysis and discussion on The History of the Former Han Dynasty:a Critical Translation with Annotations translated by Homer Hasenpflug Dubs.As for the reasons of cultural misreading,this paper divides them into three types—language,thinking habit,traditional culture.It is to be hoped that this paper will draw more attention from the translation circle to the phenomena,and make contribution to the development of literary translation. 展开更多
关键词 The HISTORY of the FORMER Han Dynasty a CRITICAL TRANSLATION with annotations TRANSLATION cultural MISREADING
下载PDF
A Study on Annotations Under the Theory of Paratext in Translation
9
作者 PAN Li-na GUO Xiao-chun 《Cultural and Religious Studies》 2022年第8期454-456,共3页
This paper mainly studies the basic types of annotation and the analysis of its effective functional usage,so as to pay more attention to annotation in the translation of poetry and Fu.The annotation of this study bel... This paper mainly studies the basic types of annotation and the analysis of its effective functional usage,so as to pay more attention to annotation in the translation of poetry and Fu.The annotation of this study belongs to the category of paratext.Annotation is attributed to the paratext,undertakes its special function,enriches and perfects the paratext system. 展开更多
关键词 PARATEXT thick translation ANNOTATION
下载PDF
ASE-ERNIE:一种基于ERNIE的中文指令动作序列生成方法 被引量:1
10
作者 赵逢达 郭凡 +2 位作者 李贤善 门旭静 王彬 《计算机集成制造系统》 EI CSCD 北大核心 2024年第5期1745-1753,共9页
中文结构灵活多样,同样的语义有多种表达方式,在中文指令过长或存在多组动作的情况下,家庭服务机器人很难正确理解并做出响应。此外,家庭环境的中文指令解析研究在数据方面仍然稀缺。现有的方法不能准确提取出指令中包含的全部动作序列... 中文结构灵活多样,同样的语义有多种表达方式,在中文指令过长或存在多组动作的情况下,家庭服务机器人很难正确理解并做出响应。此外,家庭环境的中文指令解析研究在数据方面仍然稀缺。现有的方法不能准确提取出指令中包含的全部动作序列。由此提出一种基于ERNIE方法的动作序列提取(ASE-ERNIE)模型来提取中文指令中的可执行动作序列,该模型通过动作类型和参数之间的关系提取指令信息,将动作序列的提取工作转化为序列标注任务。在指令中存在多组动作并且存在多个参数的情况下,依然能够提取出全部动作序列。通过实验验证了所提方法的有效性,动作序列提取任务的F 1值达到了80.37%。 展开更多
关键词 指令解析 动作序列 ERNIE方法 序列标注
下载PDF
BIM模型三维出图关键技术研究与应用 被引量:1
11
作者 吕彬 傅志浩 《水电能源科学》 北大核心 2024年第6期78-82,共5页
为解决BIM模型三维正向设计出图问题,基于MicroStation三维设计平台,通过二次开发方式系统研究成图及标注关键技术。通过提取剖切位置处模型切面、剖视范围内三维模型,实现剖面图底图绘制;通过将材料属性信息和剖面图关联,并配合预定义... 为解决BIM模型三维正向设计出图问题,基于MicroStation三维设计平台,通过二次开发方式系统研究成图及标注关键技术。通过提取剖切位置处模型切面、剖视范围内三维模型,实现剖面图底图绘制;通过将材料属性信息和剖面图关联,并配合预定义填充符号库,实现剖面图自动填充;通过将自定义数据结构在模型和图纸之间关联,实现图纸与模型联动更新;通过修改剖视图中前视范围内不可见边显示样式,实现二维剖视图中不可见边虚线显示;研发二、三维图面高程、坡比、桩号等快速标注、图框快速调用工具,实现快速成图。实例应用结果表明,该方法可明显提升基于BIM模型的二维图纸生成效率,适用直线型、折线型等不同剖面位置线图纸批量剖切,满足结构模型、地形模型、地质模型等同时剖切需求、不同出图比例图纸剖切要求、模型修改后图纸批量更新需求,研究方法和软件开发思路可为同类项目提供参考。 展开更多
关键词 MicroStation平台 二次开发 二维出图 图纸标注
下载PDF
领域大语言模型下的古籍词性标注应用研究 被引量:3
12
作者 朱丹浩 赵志枭 +3 位作者 胡蝶 赵文华 孙光耀 王东波 《科技情报研究》 CSSCI 2024年第2期21-29,共9页
[目的/意义]大语言模型的发展为古籍文本挖掘带来了新的思路,将大语言模型与古籍数字化、智能化相结合是新时代古籍工作的必经之路。[方法/过程]文章使用《左传》词性标注语料,通过数据清洗和预处理,构建了一批高质量的词性标注指令数据... [目的/意义]大语言模型的发展为古籍文本挖掘带来了新的思路,将大语言模型与古籍数字化、智能化相结合是新时代古籍工作的必经之路。[方法/过程]文章使用《左传》词性标注语料,通过数据清洗和预处理,构建了一批高质量的词性标注指令数据,在此基础上,分别使用500、1 000、2 000、5 000条数据对大语言模型进行指令微调,并在另外1 000条数据上进行性能测试。[结果/结论]实验结果表明,“荀子”系列模型在古籍文本词性标注任务上性能优于通用领域模型,在微调数据量达到5 000时,Xunzi-Baichuan2-7B模型表现出了最优性能,F1值达到81.67%。 展开更多
关键词 大语言模型 “荀子”大模型 《左传》 词性标注 指令微调
下载PDF
基于大语言模型的中文科技文献标注方法 被引量:2
13
作者 杨冬菊 黄俊涛 《计算机工程》 CAS CSCD 北大核心 2024年第9期113-120,共8页
高质量的标注数据是中文科技文献领域自然语言处理任务的重要基石。针对目前缺乏中文科技文献的高质量标注语料以及人工标注质量参差不齐且效率低下的问题,提出一种基于大语言模型的中文科技文献标注方法。首先,制定适用于多领域中文科... 高质量的标注数据是中文科技文献领域自然语言处理任务的重要基石。针对目前缺乏中文科技文献的高质量标注语料以及人工标注质量参差不齐且效率低下的问题,提出一种基于大语言模型的中文科技文献标注方法。首先,制定适用于多领域中文科技文献的细粒度标注规范,明确标注实体类型以及标注粒度;其次,设计结构化文本标注提示模板和生成解析器,将中文科技文献标注任务设置成单阶段单轮问答过程,将标注规范和带标注文本填充至提示模板中相应的槽位以构建任务提示词;然后,将提示词注入到大语言模型中生成包含标注信息的输出文本,经由解析器解析得到结构化的标注数据;最后,利用基于大语言模型的提示学习生成中文科技文献实体标注数据集ACSL,其中包含分布在48个学科的10000篇标注文档以及72536个标注实体,并在ACSL上提出基于RoBERTa-wwm-ext的3个基准模型。实验结果表明,BERT+Span模型在长跨度的中文科技文献实体识别任务中表现最佳,F1值为0.335。上述结果可作为后续研究的测试基准。 展开更多
关键词 文本标注方法 中文科技文献 大语言模型 提示学习 信息抽取
下载PDF
基于特征图网络和多种生物信息预测关键蛋白质的深度学习框架 被引量:1
14
作者 刘桂霞 曹心恬 赵贺 《吉林大学学报(理学版)》 CAS 北大核心 2024年第3期593-605,共13页
针对生物实验识别关键蛋白质费时费力,使用计算方法预测关键蛋白质无法有效整合生物信息的问题,提出一个深度学习框架.首先利用网络拓扑结构、基因表达数据和GO(gene ontology)注释数据构建加权蛋白质相互作用网络;然后分别使用特征图... 针对生物实验识别关键蛋白质费时费力,使用计算方法预测关键蛋白质无法有效整合生物信息的问题,提出一个深度学习框架.首先利用网络拓扑结构、基因表达数据和GO(gene ontology)注释数据构建加权蛋白质相互作用网络;然后分别使用特征图网络和双向长短期记忆细胞从亚细胞定位数据、蛋白质复合物数据和基因表达数据中提取特征向量;最后将这些特征向量输入到任务学习层预测关键蛋白质.实验结果表明,相比于现有的计算方法,该方法预测性能更好. 展开更多
关键词 关键蛋白质 特征图网络 亚细胞定位 基因表达 GO注释 蛋白质复合物
下载PDF
基于自然标注的跨平台虚拟账号关联方法研究
15
作者 季铎 敬少杰 +1 位作者 彭如香 孔华锋 《计算机应用与软件》 北大核心 2024年第9期190-194,共5页
随着大数据时代的到来,跨平台虚拟账号的关联成为网络监管领域亟待解决的问题。该文以微博、微信等用户文本数据为研究对象,通过对数据的抽样和人工标注,开展开放式社交平台中跨平台账号自然标注行为的量化分析,并由此提出基于用户自然... 随着大数据时代的到来,跨平台虚拟账号的关联成为网络监管领域亟待解决的问题。该文以微博、微信等用户文本数据为研究对象,通过对数据的抽样和人工标注,开展开放式社交平台中跨平台账号自然标注行为的量化分析,并由此提出基于用户自然标注的跨平台虚拟账号的关联方法。该方法针对自然标注特点,构建基于上下字词特征的虚拟账号识别的模型,并利用二分类的深度学习模型进行昵称和用户的同一认证,最终实现对跨平台虚拟账号的识别,识别准确率达到85%以上。 展开更多
关键词 虚拟账号 自然标注 账号关联
下载PDF
花椒根腐病拮抗菌株W-1基因组测序及抑菌机理研究
16
作者 田凤鸣 陈强 +2 位作者 何九军 张晓娜 王国斌 《南方农业学报》 CAS CSCD 北大核心 2024年第6期1639-1652,共14页
【目的】分析贝莱斯芽孢杆菌(Bacillus velezensis)W-1的全基因组序列信息,探究其对花椒根腐病的生防机理,为该菌的高效开发和应用提供生物信息学基础,并为该菌开发为生物农药提供理论支持。【方法】采用三代PacBio平台测序技术对菌株W-... 【目的】分析贝莱斯芽孢杆菌(Bacillus velezensis)W-1的全基因组序列信息,探究其对花椒根腐病的生防机理,为该菌的高效开发和应用提供生物信息学基础,并为该菌开发为生物农药提供理论支持。【方法】采用三代PacBio平台测序技术对菌株W-1进行全基因组测序,并对测序结果进行基因功能注释和比较基因组学分析;采用菌丝生长速率法测定菌株W-1发酵液乙酸乙酯提取物对花椒根腐病病原菌菌丝形态、病原菌孢子悬浮液电导率和核酸含量的影响。【结果】菌株W-1基因组全长4166284 bp,GC含量为46.32%,其中编码蛋白基因4037个;GO、eggNOG和KEGG数据库中注释到的基因数分别为2935、3087和2185个;预测到菌株W-1能产生14种次级代谢产物合成基因簇,包括sur‐factin、butirosin A/butirosin B、planttazolicin、macrolactin H、bacilaene、fengycin、diffcidin、bacillibactin和bacilysin等9种已知基因簇及5种未知基因簇;菌株W-1特有的基因家族53个,特有基因414个,与模式菌株B.velezensis FZB42的亲缘关系较近。菌株W-1提取物对花椒根腐病病原菌菌丝生长具有明显的抑制作用,最小抑菌浓度(MIC)为4.50 mg/mL、最小杀菌浓度(MFC)为9.00 mg/mL。菌株W-1提取物可造成病原菌菌丝内含物外渗,在提取物浓度9.00 mg/mL处理10 h后,病原菌孢子悬浮液相对电导率比空白对照高57.63%、核酸含量比空白对照高64.91%。【结论】贝莱斯芽孢杆菌W-1能产生多种抗菌物质,其发酵液乙酸乙酯提取物可破坏花椒根腐病病原菌菌丝细胞膜的完整性,具有开发成生物农药的潜力,在花椒根腐病的绿色防控中具有良好的应用前景。 展开更多
关键词 花椒根腐病 贝莱斯芽孢杆菌 基因组测序 基因注释 抑菌机理
下载PDF
基于Transformer的司法文书命名实体识别方法
17
作者 王颖洁 张程烨 +1 位作者 白凤波 汪祖民 《计算机科学》 CSCD 北大核心 2024年第S01期113-121,共9页
命名实体识别是自然语言处理领域的关键任务之一,是实现下游任务的基础。目前针对司法领域的相关研究相对较少,司法系统的信息化和智能化转型仍有许多问题亟需解决。相比其他领域的文本,司法文书存在专业性强、语料资源少等局限,导致现... 命名实体识别是自然语言处理领域的关键任务之一,是实现下游任务的基础。目前针对司法领域的相关研究相对较少,司法系统的信息化和智能化转型仍有许多问题亟需解决。相比其他领域的文本,司法文书存在专业性强、语料资源少等局限,导致现有的司法文书识别结果较低。因此,从以下3方面开展研究:首先,提出了一种多标签层级迭代的文本标注方式,可以对原始司法文书文本进行自动化标注,同时有效地提升司法文书命名实体识别任务的实体识别效果;其次,提出了一种交融式的Transformer神经网络模型,对汉字固有属性的深层特征进行了充分利用,用于对司法文书进行命名实体识别;最后,对所提出的标注方法和模型与其他神经网络模型进行了对比实验。所提出的文本标注方式可以较为准确地实现司法文书的标注任务;同时,所提出的模型在通用数据集中相对于对照模型有较大的提高,并在司法领域数据集中取得了良好的效果。 展开更多
关键词 自然语言处理 数据标注 Transformer模型 深度学习 司法信息化
下载PDF
基于平行交互注意力网络的中文电子病历实体及关系联合抽取 被引量:1
18
作者 李丽双 王泽昊 +1 位作者 秦雪洋 袁光辉 《中文信息学报》 CSCD 北大核心 2024年第6期108-118,共11页
基于电子病历构建医学知识图谱对医疗技术的发展具有重要意义,实体和关系抽取是构建知识图谱的关键技术。该文针对目前实体关系联合抽取中存在的特征交互不充分的问题,提出了一种平行交互注意力网络(PIAN)以充分挖掘实体与关系的相关性... 基于电子病历构建医学知识图谱对医疗技术的发展具有重要意义,实体和关系抽取是构建知识图谱的关键技术。该文针对目前实体关系联合抽取中存在的特征交互不充分的问题,提出了一种平行交互注意力网络(PIAN)以充分挖掘实体与关系的相关性,在多个标准的医学和通用数据集上取得最优结果;当前中文医学实体及关系标注数据集较少,该文基于中文电子病历构建了实体和关系抽取数据集(CEMRIE),与医学专家共同制定了语料标注规范,并基于该文所提出的模型实验得出基准结果。 展开更多
关键词 实体关系联合抽取 双向特征交互模块 自注意力机制 中文电子病历 数据集标注与构建
下载PDF
基于知识标注平台的水利枢纽工程知识图谱构建及应用
19
作者 张军珲 昝红英 +2 位作者 欧佳乐 阎子悦 张坤丽 《计算机科学》 CSCD 北大核心 2024年第11期255-264,共10页
大量水利异构数据的产生,为领域知识图谱的构建及应用提供了场景,但也导致了水利知识图谱构建过程的差异。针对现有水利知识图谱构建流程复杂的问题,提出了一套有效的基于知识标注平台的水利知识图谱构建流程。以小浪底水利枢纽工程知... 大量水利异构数据的产生,为领域知识图谱的构建及应用提供了场景,但也导致了水利知识图谱构建过程的差异。针对现有水利知识图谱构建流程复杂的问题,提出了一套有效的基于知识标注平台的水利知识图谱构建流程。以小浪底水利枢纽工程知识的智能应用为例,使用该枢纽的工程数据,应用提出的流程在水利领域构建水利枢纽工程知识图谱(Water Conservancy Hub Project Knowledge Graph,WCHP-KG)。首先以小浪底水利枢纽工程为中心,依据行业术语标准和现有词汇表,制定了概念分类和关系描述体系,形成了WCHP-KG的模式层。通过BiLSTM-CRF和序列标注模型,在水利专家的指导下,使用知识标注平台对非结构化文本进行了半自动标注和人工校对,实现了知识融合,进而构建了WCHP-KG的数据层。结果表明WCHP-KG涵盖了43种水利实体以及110种实体关系。经过实践验证,构建的WCHP-KG为小浪底水利枢纽工程的相关应用提供了有力的结构化知识基础,为工程决策和管理提供了可靠的参考依据,进而证明了所提构建流程的有效性。未来将进一步扩展WCHP-KG和完善水利知识图谱的构建流程,以适应更多的应用场景和领域需求。 展开更多
关键词 异构数据 领域知识图谱 知识图谱构建 水利枢纽 知识标注平台
下载PDF
数据标注治理:可信人工智能的后台风险与治理转向
20
作者 胡泳 张文杰 《云南社会科学》 CSSCI 北大核心 2024年第6期29-36,共8页
在人工智能模型训练前,须先对数据进行人工识别与标注,因此处于“后台”的数据标注成为引致人工智能“前台”幻觉与偏见风险的重要环节。近年来,隐蔽于人工智能后台的数据标注劳动者随着政策文件、媒体报道和调查报告的公布而逐渐浮现,... 在人工智能模型训练前,须先对数据进行人工识别与标注,因此处于“后台”的数据标注成为引致人工智能“前台”幻觉与偏见风险的重要环节。近年来,隐蔽于人工智能后台的数据标注劳动者随着政策文件、媒体报道和调查报告的公布而逐渐浮现,进一步推动学界警惕与反思技术革新的神秘化倾向。然而,从风险治理的角度来看,参与数据标注实践的多元主体仍然处于权责模糊的灰色地带,阻碍了可信人工智能目标的实现。全球主要经济体的数据标注治理路线显示,当前针对数据标注的治理对象以“人工智能服务提供者”为主,且倾向于将数据置于私人个体秩序中。通往可信人工智能的风险治理亟须将治理范围从“提供者”拓展至“数据供应链”,建设一种多元主体共同参与的集体性治理制度,进而更为细致地关照人工智能生产中的相关群体利益,为不稳定的数据劳动者提供具体的社会保障。 展开更多
关键词 数据标注 数据治理 幻觉 偏见 幽灵工作
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部