期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
国内外物联网研究进展与对比分析
1
作者 邓三鸿 章学周 刘昱琪 《江苏科技信息》 2024年第13期1-4,9,共5页
文章借助CiteSpace可视化分析软件,系统梳理并比较了2010—2023年间国内外物联网技术研究的进展与差异。通过对比分析中国知网与Web of Science中核心期刊文献的关键词聚类与研究热点,揭示了国内外物联网研究的侧重点与存在的差距。研... 文章借助CiteSpace可视化分析软件,系统梳理并比较了2010—2023年间国内外物联网技术研究的进展与差异。通过对比分析中国知网与Web of Science中核心期刊文献的关键词聚类与研究热点,揭示了国内外物联网研究的侧重点与存在的差距。研究发现:国外研究更加注重跨学科的融合与创新,物联网技术创新优势显著,应用领域广泛且深入,涵盖了多个行业和领域;国内研究更侧重于物联网技术的实际应用和产业化推广。虽然国内物联网技术的应用领域相对集中,但在技术创新层面仍有待提升。 展开更多
关键词 物联网 聚类分析 CITESPACE
下载PDF
融合学习扩展的非遗陶瓷工艺领域术语库构建及应用 被引量:2
2
作者 汪琳 王昊 +1 位作者 李晓敏 邓三鸿 《图书馆论坛》 北大核心 2024年第2期66-78,共13页
文章通过学习扩展的机器学习和深度学习,提出针对非物质文化遗产项目语料的术语抽取及新词发现方法,形成领域术语库并探讨在数字人文领域的应用。首先使用自然语言处理方法对非遗陶瓷语料进行预处理,结合领域术语词表对语料进行标注;然... 文章通过学习扩展的机器学习和深度学习,提出针对非物质文化遗产项目语料的术语抽取及新词发现方法,形成领域术语库并探讨在数字人文领域的应用。首先使用自然语言处理方法对非遗陶瓷语料进行预处理,结合领域术语词表对语料进行标注;然后针对Random-CRFs模型,研究词表特征(DICT)、词性特征(POS)、部首特征(Radical)、拼音特征(Pinyin)对术语抽取效果的影响,再对比Random-CRFs、Random-BiLSTM、Random-BiLSTM-CRFs、BERT-BiLSTMCRFs等4个模型对术语抽取效果的影响;最后使用训练完成的模型对测试集语料进行新词识别,对抽取出的候选词进行人工判断,构建包含1,173个术语的非物质文化遗产陶瓷工艺领域术语库,将其应用于非遗项目画像、非遗陶瓷工艺知识图谱和非遗陶瓷工艺术语检索。 展开更多
关键词 非物质文化遗产 领域术语 新词发现 数字人文
下载PDF
生成式情报学术语自动抽取与多维关联知识挖掘研究
3
作者 胡昊天 邓三鸿 +4 位作者 孔玲 闫晓慧 杨文霞 王东波 沈思 《情报学报》 CSCD 北大核心 2024年第5期588-600,共13页
情报学术语承载了情报学科基础知识与核心概念。从概念维度梳理与分析情报学术语对推动学科发展、助力下游知识挖掘任务具有重要意义。面对数量快速增长的科技文献,自动术语抽取替代了人工筛选,但现有方法严重依赖大规模标注数据集,难... 情报学术语承载了情报学科基础知识与核心概念。从概念维度梳理与分析情报学术语对推动学科发展、助力下游知识挖掘任务具有重要意义。面对数量快速增长的科技文献,自动术语抽取替代了人工筛选,但现有方法严重依赖大规模标注数据集,难以迁移至低资源场景。本文设计了一种生成式情报学术语抽取方法(generative term extraction for information science,GTX-IS),将传统基于序列标注的抽取式任务转化为序列到序列的生成式任务。结合小样本学习策略与有监督微调,提升面向特定任务的文本生成能力,能够在低资源有标签数据集场景下较为精准地抽取情报学术语。对于抽取结果,本文进一步开展了情报学领域术语发现及多维知识挖掘。综合运用全文科学计量与信息计量方法,从术语自身、术语间关联、时间信息等维度,对术语的出现频次、生命周期、共现信息等进行统计分析与知识挖掘。采用社会网络分析方法,结合时间维度特征,从术语角度出发,完善期刊的动态简介,探究情报学研究热点、演变历程和未来发展趋势。本文方法在术语抽取实验中的表现超越了全部13种主流生成式和抽取式模型,展现出较强的小样本学习能力,为领域信息抽取提供了新的思路。 展开更多
关键词 情报学术语 术语自动抽取 文本生成 科学计量 热点分析
下载PDF
基于参考文献的论文跨学科性、跨时域性及其影响力研究
4
作者 杨杰 王左戎 +2 位作者 邓三鸿 王昊 章学周 《情报学报》 CSCD 北大核心 2024年第9期1003-1014,共12页
本文在跨学科性概念的基础上,提出了跨时域性的测度框架,并将其量化为时域丰富性、时域非均衡性、时域差异性和时域深度4个维度。本文对微软学术数据库中1950—2020年38879575篇论文的跨学科性和跨时域性的时间趋势、分布特征以及科学... 本文在跨学科性概念的基础上,提出了跨时域性的测度框架,并将其量化为时域丰富性、时域非均衡性、时域差异性和时域深度4个维度。本文对微软学术数据库中1950—2020年38879575篇论文的跨学科性和跨时域性的时间趋势、分布特征以及科学家的生涯演化模式进行了细致分析,并进一步研究了跨学科性、跨时域性与科学影响力的关系。研究发现:①论文的跨学科性和跨时域性呈现一致的增长趋势和不一致的领域分布;②跨学科性和跨时域性指标具有无标度分布等异质性分布特征,且跨学科性和跨时域性的相关性并不强;③科学家生涯中后期的跨学科性和跨时域性明显增强,这种趋势在很大程度上可以归因于其引用行为的变化;④跨学科性和跨时域性对科学影响力有着相反的作用效应,即跨学科性显著促进科学影响力,跨时域性显著抑制科学影响力,较强的跨学科性和较弱的跨时域性组合成为颠覆性热点论文的概率最高。本文提出的跨时域性测度框架丰富了知识融合和跨学科理论,并为科技政策和学术评价提供了启示。 展开更多
关键词 跨学科性 跨时域性 引文网络 科学家生涯
下载PDF
三角引用关系中文献位置的差异对比研究
5
作者 杨文霞 邓三鸿 +2 位作者 胡昊天 孔嘉 闫晓慧 《信息资源管理学报》 2024年第1期131-145,共15页
三角引用是一种融合直接引用关系、耦合关系和共被引关系的特殊引用结构,具有较高的研究价值与拓展意义。为了解同一篇文章在三角引用中不同位置的表现,提出正向三角引用、双向三角引用和逆向三角引用。以Web of Science核心合集数据库... 三角引用是一种融合直接引用关系、耦合关系和共被引关系的特殊引用结构,具有较高的研究价值与拓展意义。为了解同一篇文章在三角引用中不同位置的表现,提出正向三角引用、双向三角引用和逆向三角引用。以Web of Science核心合集数据库中LIS学科作为数据来源,从存在概率、数据特征、引用时间、跨语言引用、跨学科引用、文献类型和作者自引等方面分析了三种三角引用。研究发现,三种三角引用各有特点,在文献类型和作者自引中,三种三角引用表现一致;在存在概率、文献数量特征,以及引用时间、跨语言引用和跨学科引用上存在区别。此外,三角引用结构结合文本相似度与耦合引用强度为分析文献漏引与非相关引用提供了可能。 展开更多
关键词 引用关系 正向三角引用 双向三角引用 逆向三角引用 引用特征
下载PDF
多源异构数据视角下的学术评价:内涵、进展与展望 被引量:4
6
作者 邓三鸿 杨杰 +1 位作者 王昊 沈健威 《科技情报研究》 2023年第4期42-56,共15页
[目的/意义]综合多源异构数据的学术评价与科学计量方法逐渐发展成为领域热点,目前对于多源异构数据视角下的学术评价缺乏系统的理论探讨。[方法/过程]针对多源异构数据利用不充分、研究方法不妥当、研究目标不明确等问题,文章梳理多源... [目的/意义]综合多源异构数据的学术评价与科学计量方法逐渐发展成为领域热点,目前对于多源异构数据视角下的学术评价缺乏系统的理论探讨。[方法/过程]针对多源异构数据利用不充分、研究方法不妥当、研究目标不明确等问题,文章梳理多源异构数据视角下的学术评价发展状况、厘清领域内涵及外延、分析领域前沿和热点。[结果/结论]研究发现,在多源异构数据视角下,学术评价领域呈现出数据维度增加、数据粒度细化、评价指标复杂化等趋势。多源异构数据视角下的学术评价内涵界定、现状分析与未来展望,对于澄清领域认知、辨析相关概念、明确研究路径与方法论基础,以及构建中国特色的学术评价体系有着重大意义。 展开更多
关键词 学术评价 科学计量 多源异构数据
下载PDF
融合专利与论文信息的内容挖掘和引用基础的企校创新合作推荐研究 被引量:4
7
作者 闫晓慧 马博闻 +1 位作者 邓三鸿 王蔚萍 《现代情报》 2023年第3期13-25,共13页
[目的/意义]随着科技发展,创新成为企业的立身之本,推进企校合作有助于企业在市场竞争中占有一席之地。[方法/过程]构建了融合专利与论文信息的内容挖掘和引用基础的组合相似度计算的企校合作推荐模型,组合相似度计算包括细分领域分类... [目的/意义]随着科技发展,创新成为企业的立身之本,推进企校合作有助于企业在市场竞争中占有一席之地。[方法/过程]构建了融合专利与论文信息的内容挖掘和引用基础的组合相似度计算的企校合作推荐模型,组合相似度计算包括细分领域分类代码、关键词和引用基础3个维度。并利用我国人工智能领域前50强企业同高校之间的合作推荐做实证分析,且从比较研究和结果分析两个角度进行验证。[结果/结论]企校创新合作机构推荐模型能够取得较好的结果,有助于企业寻找具体研究领域的恰当高校合作机构,在一定程度上能够促进我国企校机构间深度合作,推动企校机构创新共赢。 展开更多
关键词 专利 论文 内容挖掘 引用基础 人工智能 企校合作 企业 学校 推荐模型
下载PDF
科学研究的颠覆性创新测度——相对颠覆性指数 被引量:1
8
作者 杨杰 邓三鸿 王昊 《情报学报》 CSCD 北大核心 2023年第9期1052-1064,共13页
在破“五唯”的背景下,科学研究的创新性测度尤为重要,创新性较高的论文往往会对既有研究领域的学科范式产生颠覆性影响,甚至开创新的范式。颠覆性指数是近几年被提出的可以直接测度论文颠覆性创新程度的计量指标,基于网络中论文节点的... 在破“五唯”的背景下,科学研究的创新性测度尤为重要,创新性较高的论文往往会对既有研究领域的学科范式产生颠覆性影响,甚至开创新的范式。颠覆性指数是近几年被提出的可以直接测度论文颠覆性创新程度的计量指标,基于网络中论文节点的深层引用关系,在一定程度上破除了单一维度评价的缺点,引起了文献计量学、信息科学和网络科学等多领域学者的广泛关注。本文对颠覆性指数的最新研究进行了总结和拓展,深入剖析了指标局限性及因素,并提出了新的计量指标——相对颠覆性指数(relative disruptive index,RDI),它在颠覆性指数的基础上,涵盖了引文网络的深层引用比例,在一定程度上解决了颠覆性指数分布不均匀、评价不一致的问题,能够对科学研究的颠覆性创新程度进行更为精确和客观的衡量。实证结果表明,颠覆性指数的参数量级不一致,相对颠覆性指数可以更有效地衡量科学研究的创新性,且相比于原始颠覆性指数以及Bornmann等学者提出的修正颠覆性指数(DI5)具有更佳的评价一致性,巩固性论文的相对颠覆性指数较低,创新性论文的相对颠覆性指数较高。 展开更多
关键词 科学计量 引文网络 创新性 颠覆性指数
下载PDF
融合母评论文本信息的评论短文本情感分析研究--以短视频评论文本为例 被引量:2
9
作者 潘苏楠 邓三鸿 王蔚萍 《情报探索》 2023年第4期1-7,共7页
[目的/意义]提出融合母评论文本信息的评论短文本情感分类模型以提高互联网环境下短文本评论情感分析效果,适应舆情工作中的实际应用需求。[方法/过程]以短视频平台舆情事件的评论数据为实验对象,利用GRU提取母评论文本特征和直接提取... [目的/意义]提出融合母评论文本信息的评论短文本情感分类模型以提高互联网环境下短文本评论情感分析效果,适应舆情工作中的实际应用需求。[方法/过程]以短视频平台舆情事件的评论数据为实验对象,利用GRU提取母评论文本特征和直接提取评论区特征,分别将这些特征与CNN提取原评论文本特征并行融合进行情感分类。[结果/结论]相较于传统深度学习方法,引入的母评论文本特征使两个数据集的情感分类效果都获得了一定提升,F1值等均分别提升了2%和1%,说明本文提出的特征引入方案能够提升评论短文本的分类效果,为舆情工作中的情感监测实际应用提供了思路,验证了舆情相关理论研究对实际技术应用有借鉴和指导意义。 展开更多
关键词 情感分析 短文本 沉默的螺旋理论
下载PDF
基于深度学习的情报学理论及方法术语识别研究 被引量:20
10
作者 王昊 邓三鸿 +1 位作者 苏新宁 官琴 《情报学报》 CSSCI CSCD 北大核心 2020年第8期817-828,共12页
理论、方法的研究是学科不断发展前行的动力,了解掌握学科领域当前理论及方法的应用、发展情况是一项十分重要的工作。本文利用命名实体识别任务的分支——术语识别,对情报学理论方法进行研究,通过采集我国近20年来情报学领域相关文献20... 理论、方法的研究是学科不断发展前行的动力,了解掌握学科领域当前理论及方法的应用、发展情况是一项十分重要的工作。本文利用命名实体识别任务的分支——术语识别,对情报学理论方法进行研究,通过采集我国近20年来情报学领域相关文献20000篇左右,应用深度学习模型——Bi-LSTM-CRFs进行大规模语料训练与测试,通过实验验证其可行性并探究各实验变量对模型效果的影响,以求最大限度提高模型识别的效果。实验结果表明,对于理论方法术语等复杂实体,基于词切分的语料识别效果要优于基于字切分的语料;术语实体的长度对于识别效果也有一定影响,术语长度过大时(字数≥6),识别效果下降明显;同时,训练语料量与识别效果呈正相关关系,语料量越大,识别效果越好;实体的类型和数量直接影响识别结果,具有明显构词特征的实体识别效果较好;在特征引入实验中发现除拼音特征外,词性、词长以及词向量特征均能够对F1值有所提高,其中词向量和词性特征的提升效果最为明显。 展开更多
关键词 情报学 术语识别 深度学习 Bi-LSTM-CRFs模型
下载PDF
古文自动处理研究现状与新时代发展趋势展望 被引量:25
11
作者 邓三鸿 胡昊天 +1 位作者 王昊 王东波 《科技情报研究》 2021年第1期1-20,共20页
[目的/意义]随着数字化古籍文献的普及,利用自然语言处理与大数据分析技术,在古代典籍上开展文本挖掘与知识发现,逐渐成为数字人文在古文信息处理领域的重要研究方向,也是体现文化自信的重要途径。[方法/过程]文章定义了古文自动处理的... [目的/意义]随着数字化古籍文献的普及,利用自然语言处理与大数据分析技术,在古代典籍上开展文本挖掘与知识发现,逐渐成为数字人文在古文信息处理领域的重要研究方向,也是体现文化自信的重要途径。[方法/过程]文章定义了古文自动处理的概念,从古文自动处理的领域划分与模型算法、语料资源与现有工具、知识库与平台系统3个方面,梳理古文自动处理领域的内涵和外延,整体把握该领域研究现状与发展趋势。[结果/结论]较全面地归纳总结了当前古文自动处理研究现状,分析了存在的问题与不足。 展开更多
关键词 古文自动处理 数字人文 传统文化 文化自信 古文信息处理
下载PDF
面向数字人文的《四库全书》子部自动分类研究——以SikuBERT和SikuRoBERTa预训练模型为例 被引量:15
12
作者 胡昊天 张逸勤 +4 位作者 邓三鸿 王东波 冯敏萱 刘浏 李斌 《图书馆论坛》 CSSCI 北大核心 2022年第12期138-148,共11页
文章基于面向古文自然语言处理的SikuBERT和SikuRoBERTa预训练语言模型,在《四库全书》子部14个类别的古籍文本上开展典籍自动分类模型的构建,并与BERT、BERT-wwm、RoBERTa和RoBERTa-wwm基线模型进行对比。文章提出的两种分类模型效果... 文章基于面向古文自然语言处理的SikuBERT和SikuRoBERTa预训练语言模型,在《四库全书》子部14个类别的古籍文本上开展典籍自动分类模型的构建,并与BERT、BERT-wwm、RoBERTa和RoBERTa-wwm基线模型进行对比。文章提出的两种分类模型效果均优于基线模型,SikuBERT模型取得90.39%的整体分类F值,在天文算法类古籍上的分类F值达98.83%。在类别自动识别任务中,SikuRoBERTa的预测正确率达95.30%。基于SikuBERT和SikuRoBERTa预训练语言模型的四库自动分类体系可以将典籍文本划分为所属子部类别,构建的分类工具为高效自动化典籍分类提供了新途径。 展开更多
关键词 预训练模型 SikuBERT 文本分类 数字人文 《四库全书》子部
下载PDF
面向数字人文的古诗文本情感术语抽取与应用研究 被引量:22
13
作者 张卫 王昊 +1 位作者 邓三鸿 张宝隆 《中国图书馆学报》 CSSCI 北大核心 2021年第4期113-131,共19页
在跨学科知识范式下,数字人文的研究范畴随着自身学科体系的拓展而不断泛化,采取关键语义技术解析文化对象中的人文内涵与情感知识对于重拾学科"人文性"与"计算性"特质具有重要意义。本文以古诗文本为例,面向汉语... 在跨学科知识范式下,数字人文的研究范畴随着自身学科体系的拓展而不断泛化,采取关键语义技术解析文化对象中的人文内涵与情感知识对于重拾学科"人文性"与"计算性"特质具有重要意义。本文以古诗文本为例,面向汉语诗文及其鉴赏实现大规模人文情感术语的自动化抽取与分析。首先在无标注集环境下提出一种基于"冷启动"的字序列自动标引方法来获取学习语料,随后在字向量(Char2Vec)指导下将汉字特征(部首、拼音等)和BERT语言学模型分别引入机器学习与深度学习模型,并从知识发现的角度定义新术语识别规则。研究发现,将现代鉴赏融入古诗原文显著优化了情感知识的广度与深度,领域术语能够被有效标引。训练的BERT-BiLSTM-CRFs深度学习模型的效果明显优于CRFs机器学习,最佳F1与F1distinct可分别达到95.63%和85.43%;同时汉字特征的引入也有效提升了传统CRFs效果,以领域特征和基于"竖心旁""心字底"部首约束特征为最优。相较于机器学习抽取出的长篇幅新术语,深度学习能够拓展出更多寄托情感知识的新意象词。源于诗文与鉴赏的情感术语为文学信息资源的情感分析与知识服务提供了参考(人文性),基于汉字语言特征的抽取方案为中文领域自然语言处理技术的深化提供了启迪(计算性)。 展开更多
关键词 数字人文 古诗 情感术语抽取 汉字语言特征 Char2Vec BERT
下载PDF
电子政务领域中文术语层次关系识别研究 被引量:7
14
作者 张卫 王昊 +1 位作者 邓三鸿 张宝隆 《情报学报》 CSSCI CSCD 北大核心 2021年第1期62-76,共15页
数据驱动下,与日俱增的电子政务信息资源愈发表现出多源异构的特性,基于大规模语料设计一套电子政务领域内中文术语深度层次关系的自动化识别方案,不仅有利于从内容与结构层面弥补人工构建领域词表的不足,且对于我国政务信息资源的开放... 数据驱动下,与日俱增的电子政务信息资源愈发表现出多源异构的特性,基于大规模语料设计一套电子政务领域内中文术语深度层次关系的自动化识别方案,不仅有利于从内容与结构层面弥补人工构建领域词表的不足,且对于我国政务信息资源的开放共享与后续应用更具有重大现实意义。因此,本文分别基于内容与结构双重视角识别电子政务主题词表内术语间的深层关联,通过谱聚类生成的基于内容的层次关系为初步框架,凭借形式概念分析生成的基于结构的层次关系为后期修正指导,以期构成兼顾关联术语召回率与准确率的电子政务领域术语本体。研究结果显示,电子政务术语本体的层次结构合理有效,且术语层次关系的评价结果表明知识本体具备良好的扩展性和延伸性。 展开更多
关键词 电子政务术语 层次关系 本体 谱聚类 形式概念分析
下载PDF
基于差异性视角的期刊区分性测度及分析研究 被引量:6
15
作者 张宝隆 王昊 +1 位作者 邓三鸿 苏新宁 《情报学报》 CSSCI CSCD 北大核心 2020年第3期284-296,共13页
当前的期刊评价研究主要集中在影响力、声誉、质量等方面,针对期刊内容差异性的定量研究相对较少。本文从差异性视角来对期刊进行评价分析,提出期刊区分度指标来对期刊内容的差异程度进行度量。以LIS (library and information science)... 当前的期刊评价研究主要集中在影响力、声誉、质量等方面,针对期刊内容差异性的定量研究相对较少。本文从差异性视角来对期刊进行评价分析,提出期刊区分度指标来对期刊内容的差异程度进行度量。以LIS (library and information science)等5个学科的各20种核心期刊为研究对象,首先对LIS期刊的内容差异性进行定量分析与评价,然后从时间维度对LIS学科期刊区分度的变化规律进行了探测,最后从学科维度对不同学科期刊个体和总体区分度的特征进行了分析和探讨。实验结果表明,利用该指标能够很好地度量期刊研究内容差异性,期刊区分度在时间维度上呈现出明显的变化规律,不同学科期刊个体和总体的区分度均具有显著的学科特征。 展开更多
关键词 期刊区分度 差异性 期刊评价 层次聚类分析 PCA降维
下载PDF
基于有用性排序的在线评论与销量的关系研究 被引量:7
16
作者 张梦莹 邓三鸿 +1 位作者 王昊 王丽娟 《现代情报》 CSSCI 2019年第2期152-160,共9页
[目的/意义]从海量的购物评价筛选出高效用的评论文本,既能为潜在用户的购买决策提供有价值的参考,也能为电子商务经营者提供巨大的商业价值。[方法/过程]通过量化在线评论的有用性指标,以模糊层次分析法确定属性权重,依据灰色关联分析... [目的/意义]从海量的购物评价筛选出高效用的评论文本,既能为潜在用户的购买决策提供有价值的参考,也能为电子商务经营者提供巨大的商业价值。[方法/过程]通过量化在线评论的有用性指标,以模糊层次分析法确定属性权重,依据灰色关联分析法进行在线评论有用性排序,并基于有用性过滤评论,探究在线评论对销售绩效的影响。[结果/结论]差评的各项指标相比好评来说具有明显优势,有用性更高。评论总数、评论时效性显著促进产品销售。情感倾向对搜索型商品的销量的影响并不显著。 展开更多
关键词 在线评论 产品销量 评论有用性 模糊层次分析法 灰色关联分析法
下载PDF
数字人文视角下的非物质文化遗产文本自动分词及应用研究 被引量:8
17
作者 胡昊天 邓三鸿 +3 位作者 张逸勤 张琪 孔嘉 王东波 《图书馆杂志》 CSSCI 北大核心 2022年第8期76-83,共8页
文本自动分词是非物质文化遗产相关数字人文研究的基础与关键步骤,是深度发掘非遗内在信息的前提。文章构建了国家级非物质文化遗产项目申报文本自动分词模型,探究了融入领域知识的机器学习模型CRF、深度学习模型Bi-LSTM-CRF和预训练语... 文本自动分词是非物质文化遗产相关数字人文研究的基础与关键步骤,是深度发掘非遗内在信息的前提。文章构建了国家级非物质文化遗产项目申报文本自动分词模型,探究了融入领域知识的机器学习模型CRF、深度学习模型Bi-LSTM-CRF和预训练语言模型BERT、RoBERTa、ALBERT在非遗文本上的分词性能,并对比了通用分词工具HanLP、Jieba、NLPIR的效果。在全部14种模型中,RoBERTa模型效果最佳,F值达到了97.28%,预训练模型中ALBERT在同等条件下训练速度最快。调用分词模型,构建了非遗文本领域词表和全文分词语料库,对非遗文本词汇分布情况进行了分析挖掘。开发了中国非物质文化遗产文本自动分词系统(CITS),为非遗文本自动分词及分词结果的多维可视化分析提供了工具。 展开更多
关键词 非物质文化遗产 数字人文 预训练模型 中文分词 RoBERTa ALBERT
下载PDF
时间维度下的史籍全文自动重组研究--数字人文视角下的探索 被引量:2
18
作者 张琪 王东波 +3 位作者 黄水清 李斌 孟凯 邓三鸿 《图书情报知识》 CSSCI 北大核心 2022年第1期51-60,147,共11页
[目的/意义]本文从数字人文的视角出发,试图探究一套具体的技术方法解决古汉语时间描述所存在的省略、共指、歧义、模糊等问题,使得读者可以跨越纪传体、国别体、纪事本末体等体裁壁垒,获取不同史书中关于某一时间段的所有史料。[研究设... [目的/意义]本文从数字人文的视角出发,试图探究一套具体的技术方法解决古汉语时间描述所存在的省略、共指、歧义、模糊等问题,使得读者可以跨越纪传体、国别体、纪事本末体等体裁壁垒,获取不同史书中关于某一时间段的所有史料。[研究设计/过程]在梳理古汉语时间描述类型与特征的基础上,提出一套以时间为线索自动重组史书全文的方法。该方法首先识别古汉语时间描述并进行语义解析,继而识别事件句并将事件句关联至时间描述,最后将提出的方法应用于纪传体史书《史记》和国别体史书《国语》的重组中,检验方法的有效性。[结论/发现]本研究所提出的方法能够有效实现纪传体、国别体史书以时间为线索的重组问题,在有效减少人工标注的前提下达到了较高的准确率。[创新/价值]针对古汉语时间描述存在的歧义与共指等问题,提出一套完整的以时间为线索自动重组史书全文的方法,并通过实验验证了方法的有效性。 展开更多
关键词 数字人文 史书 古汉语时间信息处理 古汉语时间表达式消歧 事件时间语义关联
下载PDF
面向事件本体的医学文本语义关联化研究 被引量:4
19
作者 李跃艳 王昊 +1 位作者 邓三鸿 陈艳 《情报学报》 CSSCI CSCD 北大核心 2022年第5期497-511,共15页
随着互联网医疗的快速发展,数字经济和智能经济成为未来必然发展趋势,医学知识的语义化和规范化是实现智慧医疗和数字医学的重要手段。但现阶段较为成熟的医学本体仅仅描述了一些既定的静态知识,无法揭示医学知识之间的动态关联。因此,... 随着互联网医疗的快速发展,数字经济和智能经济成为未来必然发展趋势,医学知识的语义化和规范化是实现智慧医疗和数字医学的重要手段。但现阶段较为成熟的医学本体仅仅描述了一些既定的静态知识,无法揭示医学知识之间的动态关联。因此,以知识表示和知识组织为出发点,构建符合叙事性文本特征的医学知识结构化表示方法具有十分重要的意义。本文在梳理叙事学理论、事件知识表示的基础上,按照是否具有叙事性特征,将医学文本分为叙事性文本和概念性文本;然后,分别对概念性医学文本和叙事性医学文本进行语义建模与表示,构建基于事件本体的医学知识本体模型;最后,根据本文提出的概念模型,实现SARS-CoV-2病毒入侵过程的语义结构化表示。初步标注的实验结果表明,将事件本体模型迁移到医学文本语义结构化描述中,有助于实现医学文本的深层次表示和知识发现,能更好地描述医学知识之间的动态关联,更好地表征医学对象在时间和空间的动态发展特点。 展开更多
关键词 叙事性文本 事件本体 语义化 规范化
下载PDF
技术创新中的知识融合:“科学—技术”二元知识对专利影响研究 被引量:3
20
作者 孔嘉 邓三鸿 +2 位作者 张佳锐 康乐乐 吴杰 《情报学报》 CSSCI CSCD 北大核心 2022年第11期1161-1173,共13页
探究技术创新过程中专利对“科学—技术”二元知识的吸收模式及其对专利创新的影响,对技术创新管理具有重要价值。本研究选择申请时间在1979—2013年的2589039项专利及其引用的4047758篇论文和6868547项专利为数据来源,对施引专利、被... 探究技术创新过程中专利对“科学—技术”二元知识的吸收模式及其对专利创新的影响,对技术创新管理具有重要价值。本研究选择申请时间在1979—2013年的2589039项专利及其引用的4047758篇论文和6868547项专利为数据来源,对施引专利、被引论文与被引专利进行领域分析,并对施引专利吸收“科学—技术”二元知识的强度和广度进行测度,利用零膨胀—负二项回归模型分析知识强度、知识广度等因素对专利影响力的影响。结果表明,本研究提出的SI(science intensity)、TI(technology intensity)、STI(science-technology intensity)和知识广度等指标可以有效测度专利对科学知识和技术知识的吸收强度与广度;生物技术与食品化学等领域专利的科学强度更大,信息技术管理方法与医疗技术等领域专利的技术强度更大;被吸收的科学知识较多分布在生物医学、化学、计算机科学等领域,被吸收的技术知识较多分布在计算机技术、医疗技术等领域。回归模型显示,专利影响力与科学知识广度之间存在倒U形关系,与技术知识广度存在正U形关系。 展开更多
关键词 技术创新 知识融合 科学—技术 知识强度 知识广度
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部