期刊文献+
共找到80篇文章
< 1 2 4 >
每页显示 20 50 100
数智赋能信息资源管理新路径:指令工程的概念、内涵和发展 被引量:5
1
作者 陆伟 汪磊 +2 位作者 程齐凯 刘家伟 黄永 《图书情报知识》 CSSCI 北大核心 2024年第1期6-11,共6页
新一轮科技革命和产业变革方兴未艾,大数据、人工智能等系列数智技术对信息资源管理学科产生了深远影响。在大模型背景下,指令工程通过高质量、体系化、流程化的指令设计引导模型生成结果,是高效发挥大模型能力的重要途径,可以用于解决... 新一轮科技革命和产业变革方兴未艾,大数据、人工智能等系列数智技术对信息资源管理学科产生了深远影响。在大模型背景下,指令工程通过高质量、体系化、流程化的指令设计引导模型生成结果,是高效发挥大模型能力的重要途径,可以用于解决学科相关重要问题。本文首先介绍了指令工程的概念,然后详细梳理了指令的构成要素、设计模式以及指令工程的特点和意义,并探讨了指令工程赋能信息资源管理的建设路径。未来,指令工程的研究和发展还需要关注通用及领域指令工程建设、指令工程标准化、知识产权保护、安全性和体系化测试评估等问题,以期能够在各行业复杂的应用场景中更好地发挥指令的效能。 展开更多
关键词 指令工程 大模型 信息资源管理 数智赋能
下载PDF
大模型驱动的学术文本挖掘--推理端指令策略构建及能力评测
2
作者 陆伟 刘寅鹏 +4 位作者 石湘 刘家伟 程齐凯 黄永 汪磊 《情报学报》 CSSCI CSCD 北大核心 2024年第8期946-959,共14页
大型语言模型突出的任务理解和指令遵循能力,使用户可以通过简单的指令交互完成复杂的信息处理任务。科技文献分析领域正在积极探索大模型的应用,但尚未形成对指令工程技术和模型能力边界的系统性研究。本文以学术文本挖掘任务为切入点... 大型语言模型突出的任务理解和指令遵循能力,使用户可以通过简单的指令交互完成复杂的信息处理任务。科技文献分析领域正在积极探索大模型的应用,但尚未形成对指令工程技术和模型能力边界的系统性研究。本文以学术文本挖掘任务为切入点,从上下文学习、思维链推理等角度设计推理端指令策略,构建了涵盖文本分类、信息抽取、文本推理和文本生成4个能力维度共6项任务的大模型学术文本挖掘专业能力评测框架,并选取了7个国内外主流的指令调优模型进行实验,对比了不同指令策略的适用范围和不同参数模型的专业能力。实验结果表明,少样本、思维链等复杂指令策略在分类任务上的应用效果并不显著,而在抽取、生成等难度较高的任务上表现良好。千亿级参数规模的大模型经过指令引导,能够取得与充分训练的深度学习模型相近的效果,但对于十亿级或百亿级规模大模型,推理端的指令策略存在明显上限。为了实现大模型向科技情报领域的深层嵌入,现阶段仍需在调优端对模型参数进行领域化适配。 展开更多
关键词 大模型 学术文本挖掘 指令工程 能力评测
下载PDF
基于实体知识网络的政策文本关联分析——以国家创业政策为例
3
作者 黄佳妮 陆伟 于丰畅 《图书馆论坛》 CSSCI 北大核心 2024年第6期71-80,共10页
国家政治或经济目的的达成往往需要众多政策协同实施,探究政策间的关联、厘清其关系有助于政策的科学制定和有效实践。针对现有研究对政策文本关联的语义层面揭示较浅等问题,为进一步挖掘政策之间的关联关系、发现政策群中的核心政策,... 国家政治或经济目的的达成往往需要众多政策协同实施,探究政策间的关联、厘清其关系有助于政策的科学制定和有效实践。针对现有研究对政策文本关联的语义层面揭示较浅等问题,为进一步挖掘政策之间的关联关系、发现政策群中的核心政策,文章提出一种多层次政策实体知识网络的关联挖掘框架。运用命名实体识别技术抽取政策文本中的细粒度政策知识对象,在此基础上构建多层次政策实体知识网络,设计基于Jaccard距离的关联关系定量计算方法。文章以创业政策群为例构建多层次政策实体知识网络,有效揭示政策文本间的潜在关联,发现政策群中的核心政策文本,对政策文本关系进行多维度阐释。 展开更多
关键词 政策关联分析 政策文本计算 知识网络 知识抽取
下载PDF
基于文献计量的国际健康信息素养评估研究 被引量:9
4
作者 李信 李旭晖 《现代情报》 CSSCI 北大核心 2017年第2期134-140,共7页
梳理健康信息素养评估问题的研究进展、发展脉络,把握其研究前沿,为我国健康信息素养评估研究提供借鉴和参考。以Web of ScienceTM核心合集收录的有效文献为来源,综合运用文献计量和知识图谱等分析方法,从研究现状分析、引文时序分析、... 梳理健康信息素养评估问题的研究进展、发展脉络,把握其研究前沿,为我国健康信息素养评估研究提供借鉴和参考。以Web of ScienceTM核心合集收录的有效文献为来源,综合运用文献计量和知识图谱等分析方法,从研究现状分析、引文时序分析、主路径分析和前沿追踪4个方面,对健康信息素养评估的进展和前沿进行可视化分析。结果发现:1健康信息素养评估问题自1997年开始日益受到各国学者的关注,诞生了很多经典的健康信息素养评估工具,美国在健康信息素养评估研究中遥遥领先于其他国家,我国在研究热度与研究成果上尚需很大的努力。21993-2004年健康信息素养的评估研究经历了从临床视角到公共卫生视角的转变,再到两者结合的发展轨迹。3健康信息素养评估的前沿主题主要集中在针对于特定年龄人群、特定疾病患者的健康信息素养评估,评估方式的多元化,以及评估范畴的全面化、规范化。 展开更多
关键词 健康素养 健康信息素养 评估工具 前沿追踪 计量分析 知识图谱
下载PDF
一种基于加权网络和句子窗口方案的信息检索模型 被引量:9
5
作者 陆伟 程齐凯 《情报学报》 CSSCI 北大核心 2013年第8期797-804,共8页
经典的信息检索模型在文档表示上多采用词袋模型,与此不同,本文提出了一种基于加权网络的信息检索模型。在这一模型中,文档被表示为一个加权共词网络,词汇在文档中的重要性通过词项节点在网络中的重要性加以衡量。基于固定窗口平移... 经典的信息检索模型在文档表示上多采用词袋模型,与此不同,本文提出了一种基于加权网络的信息检索模型。在这一模型中,文档被表示为一个加权共词网络,词汇在文档中的重要性通过词项节点在网络中的重要性加以衡量。基于固定窗口平移和句子窗口方案,本文提出了文本游走模型Textrank的四个检索模型变种,分别是Win_Weighted_Textrank、Sent_Weighted_Textrank、Win_Weighted_Posrank和Sent_Weighted_Posrank。在ReuterRCVl上的实验证明,与无权网络模型Textrank、Posrank相比,本文提出的模型能显著地提升检索效果。 展开更多
关键词 信息检索信息检索模型加权网络共词网络
下载PDF
文本智能计算研究的主题挖掘与演化分析 被引量:6
6
作者 胡吉明 田沛霖 《情报杂志》 CSSCI 北大核心 2021年第4期139-146,共8页
[目的/意义]文本智能计算是近年来的新兴交叉学科,揭示其研究动态对情报学研究有重要意义。[方法/过程]从关键词共现网络的视角,以WOS核心合集中的文献为分析样本,借助复杂网络计算、社区划分以及可视化等技术手段,揭示了文本智能计算... [目的/意义]文本智能计算是近年来的新兴交叉学科,揭示其研究动态对情报学研究有重要意义。[方法/过程]从关键词共现网络的视角,以WOS核心合集中的文献为分析样本,借助复杂网络计算、社区划分以及可视化等技术手段,揭示了文本智能计算研究的主题结构和演化脉络,并总结归纳了其发展态势。[结果/结论]当前文本智能计算研究的结构趋于稳定,各子领域关联性较强。研究当前主要分为5个子领域,人工智能、数据挖掘是当前的领域研究热点,文本分析领域将有所突破,并成为新的研究重心。 展开更多
关键词 文本智能计算 复杂网络分析 主题结构 演化态势
下载PDF
ChatGPT为代表的大模型对信息资源管理的影响 被引量:100
7
作者 陆伟 刘家伟 +1 位作者 马永强 程齐凯 《图书情报知识》 CSSCI 北大核心 2023年第2期6-9,70,共5页
OpenAI发布的新一代对话型语言模型―ChatGPT,展现了自然流畅的对话能力。原本被认为不太可能的通用人工智能曙光重现。以ChatGPT为代表的大模型是数智时代的典型技术和应用创新。面对ChatGPT强大的信息加工、荟萃、整合和生成能力,信... OpenAI发布的新一代对话型语言模型―ChatGPT,展现了自然流畅的对话能力。原本被认为不太可能的通用人工智能曙光重现。以ChatGPT为代表的大模型是数智时代的典型技术和应用创新。面对ChatGPT强大的信息加工、荟萃、整合和生成能力,信息资源管理学科机遇与挑战同在。ChatGPT在信息资源管理支撑算法与技术、信息资源建设、信息组织与信息检索、信息治理、内容安全与评价、人机智能交互与协同等方面都具有深远的影响。数智时代,人工智能大模型飞速发展,我们有必要对此保持密切关注。依托以ChatGPT为代表的大模型,通过学科技术应用范式转换、理论方法创新、治理变革,可以进一步夯实信息资源支撑“四个面向”的基础。 展开更多
关键词 ChatGPT 大模型 信息资源管理
下载PDF
检索结果多样化研究综述 被引量:4
8
作者 冯晓华 陆伟 张晓娟 《情报学报》 CSSCI 北大核心 2015年第7期776-784,共9页
随着网络信息的日渐丰富,用户的信息需求也越来越多样化,其在进行检索时,输入的查询词往往较短,且含有歧义。因此,如何识别用户查询意图,满足多样化需求,成为当前信息检索领域的研究热点问题之一。本文在对用户检索多样化需求进... 随着网络信息的日渐丰富,用户的信息需求也越来越多样化,其在进行检索时,输入的查询词往往较短,且含有歧义。因此,如何识别用户查询意图,满足多样化需求,成为当前信息检索领域的研究热点问题之一。本文在对用户检索多样化需求进行分析的基础上,探讨了检索多样化的定义,并进而对检索结果多样化研究的方法和评价指标做了介绍。 展开更多
关键词 信息检索 用户需求 多样化
下载PDF
基于主动学习的新媒体政务互动内容情感挖掘研究 被引量:3
9
作者 郑翔 胡吉明 《情报理论与实践》 CSSCI 北大核心 2022年第4期177-183,共7页
[目的/意义]新媒体平台逐渐成为政民交互的重要载体,准确把握新媒体政务互动内容中的情感倾向,有助于提升政府舆情把握能力与社会治理能力。[方法/过程]在BERT文本语义表示基础上,将主动学习策略与BiLSTM模型集成,进行新媒体政务互动内... [目的/意义]新媒体平台逐渐成为政民交互的重要载体,准确把握新媒体政务互动内容中的情感倾向,有助于提升政府舆情把握能力与社会治理能力。[方法/过程]在BERT文本语义表示基础上,将主动学习策略与BiLSTM模型集成,进行新媒体政务互动内容情感倾向分析,以提升模型对互动内容情感数据的有效利用。[结果/结论]针对“法律法规草案公开征求意见类”微博互动内容的实验表明,将主动学习引入BERT-BiLSTM模型后,模型的准确率、召回率及F值提升,新媒体政务互动内容情感呈现效果较好。文章所提模型科学可行,能够在减少数据依赖的情况下,提升情感挖掘的效率。 展开更多
关键词 新媒体 政务互动内容 情感挖掘 主动学习
下载PDF
查询专指度与检索多样化的关系研究 被引量:1
10
作者 赵春晖 张俊 《情报工程》 2018年第4期82-94,共13页
为了研究不同查询专指度语句的多样化检索效果,进而为提高检索质量和用户体验提供借鉴。本文基于TREC(2009-2012)Web Track检索词,人工进行专指度标注,选用语言模型狄利克雷平滑、语言模型线性差值平滑和TF-IDF三种模型,使用MAP-IA,α-n... 为了研究不同查询专指度语句的多样化检索效果,进而为提高检索质量和用户体验提供借鉴。本文基于TREC(2009-2012)Web Track检索词,人工进行专指度标注,选用语言模型狄利克雷平滑、语言模型线性差值平滑和TF-IDF三种模型,使用MAP-IA,α-nDCG@k,ERR-IA@k评价多样化检索结果,对检索结果进行统计学分析和差异性检验,全面分析了查询专指度与多样化检索效果之间的关联性。实验结果表明查询词的专指度特征与多样化检索的效果间存在一定的关联。强专指度查询的多样化检索效果要明显好于弱专指度查询,特别在靠前的检索结果列表中,这种差异性最大。 展开更多
关键词 查询意图 查询专指度 检索多样化
下载PDF
学术论文科研贡献类型自动识别研究 被引量:1
11
作者 蔡乐 罗卓然 陆伟 《情报理论与实践》 CSSCI 北大核心 2023年第6期168-175,共8页
[目的/意义]学术论文中的科研贡献是论文中最有价值的信息类型之一。[方法/过程]文章将学术论文贡献内容从理论层面分为三个主要维度,即贡献功能、贡献重要性、问题—方法贡献。以此为指导,设计了一套包含五大贡献类别的标注框架,其中... [目的/意义]学术论文中的科研贡献是论文中最有价值的信息类型之一。[方法/过程]文章将学术论文贡献内容从理论层面分为三个主要维度,即贡献功能、贡献重要性、问题—方法贡献。以此为指导,设计了一套包含五大贡献类别的标注框架,其中包括揭示贡献类型抽象性质的贡献分类标注体系及描述贡献内容的多层术语词汇功能标注体系。在此基础上,以SCI-BERT为基础模型,引入了学术论文的章节功能和结构化的术语信息,提出了语义角色标注增强下的科研贡献识别模型CNSC,并将其与过往的文本分类方法进行对比。[结果/结论]实验结果表明,文章提出的CNSC模型充分利用了论文的术语结构和贡献句的章节信息,对贡献类型的识别要优于其他模型。 展开更多
关键词 贡献内容 学术论文 文本分类 预训练模型
下载PDF
学术文本词汇功能识别——基于BERT向量化表示的关键词自动分类研究 被引量:42
12
作者 陆伟 李鹏程 +1 位作者 张国标 程齐凯 《情报学报》 CSSCI CSCD 北大核心 2020年第12期1320-1329,共10页
关键词作为学术文本中映射全文主题内容的词汇或术语,能够为知识精准检索和文本大规模计算提供重要的底层语义标签。当前学术文本中的关键词存在使用意图不明、语义功能模糊及上下文信息缺失等问题。为此,本文提出了一种基于有监督学习... 关键词作为学术文本中映射全文主题内容的词汇或术语,能够为知识精准检索和文本大规模计算提供重要的底层语义标签。当前学术文本中的关键词存在使用意图不明、语义功能模糊及上下文信息缺失等问题。为此,本文提出了一种基于有监督学习的神经网络方法,对关键词所承载的语义功能进行分类,实现对学术文本中研究问题和研究方法的识别。本文以计算机等领域为期10年的学术期刊论文为训练语料,利用BERT及LSTM方法构建分类模型,实验结果显示,本文所提出的方法较传统更优,其整体准确率、召回率和F1值分别达到0.83、0.87和0.85。 展开更多
关键词 学术文本 关键词 语义功能识别 深度学习
下载PDF
跨社交媒体舆情风险感知:理论框架的构建与实现
13
作者 王丹 刘富康 陆伟 《情报学报》 CSSCI CSCD 北大核心 2024年第4期446-456,共11页
社交媒体间的摇摆和迁徙使网民获取信息的方式更加复杂多样,提高舆情传播效率的同时,也加速了舆情风险的生成和演化,及时捕捉和预测网络舆情风险对维护网络安全至关重要。目前,舆情风险的感知对象主要侧重于单一社交媒体,对跨社交媒体... 社交媒体间的摇摆和迁徙使网民获取信息的方式更加复杂多样,提高舆情传播效率的同时,也加速了舆情风险的生成和演化,及时捕捉和预测网络舆情风险对维护网络安全至关重要。目前,舆情风险的感知对象主要侧重于单一社交媒体,对跨社交媒体舆情风险感知的理论框架构建及实现仍然存在拓展空间。因此,本研究通过分析跨社交媒体舆情风险的传播特征,系统构建了跨社交媒体舆情风险感知框架,具体包括三个阶段:单一媒体异常舆情识别、跨社交媒体舆情风险研判以及跨社交媒体舆情风险预测。通过构建不同阶段指标体系及数据关联挖掘,实现了跨社交媒体风险舆情的识别、研判与预测。不仅能够拓宽舆情风险感知的研究视角、丰富舆情风险理论体系,而且能够强化社交媒体赋能舆情风险治理的协同作用,有利于提高舆情风险防控水平。 展开更多
关键词 社交媒体 舆情风险 风险感知 跨社交媒体
下载PDF
科技文献的多层次结构功能识别
14
作者 刘昊坦 刘家伟 +1 位作者 张帆 陆伟 《信息资源管理学报》 CSSCI 2024年第3期90-103,共14页
实现科技文献结构功能的自动识别有助于提升细粒度信息检索、关键词抽取、引文分析等任务的效率。针对当前结构功能识别研究面临的文本内部依赖关系表达能力较弱、模型泛化迁移能力不足等问题,本研究利用图卷积神经网络捕捉单词节点间... 实现科技文献结构功能的自动识别有助于提升细粒度信息检索、关键词抽取、引文分析等任务的效率。针对当前结构功能识别研究面临的文本内部依赖关系表达能力较弱、模型泛化迁移能力不足等问题,本研究利用图卷积神经网络捕捉单词节点间存在的固有依赖信息和拓扑结构,提升模型对科技文本建模表达能力,同时,还引入对抗学习思想,提升结构功能识别模型的泛化能力。选取ScienceDirect数据集,考察多种模型方法对章节标题、章节内容、章节段落三个不同层次的结构功能的识别效果,并在PubMed-20k的医学摘要结构功能数据集上进一步测试多种模型的跨领域迁移能力。研究结果表明,在章节标题层次,BERT+GCN的识别效果最佳,F1值达到了88%,比基线模型提升3%;在章节内容层次,BERT+GAN的识别效果最佳,F1值达到了76%,比基线模型提升了3%;在章节段落层次,F1值达到了68%。BERT+GCN的跨领域迁移能力相比其他模型更优,在跨领域数据上取得了90%的F1值。 展开更多
关键词 结构功能 图卷积神经网络 对抗生成网络 科技文献 信息识别
下载PDF
我国图书情报领域近十年科研论文研究方法的演化分析——以《情报学报》和《中国图书馆学报》为例 被引量:12
15
作者 赵忠伟 黄永 +1 位作者 程齐凯 陈海华 《信息资源管理学报》 CSSCI 2017年第3期106-112,F0003,共8页
本文通过对图书情报领域的科研论文进行内容分析,从科研论文研究方法的角度揭示图书情报学科的发展情况。在通过参考已有的科研论文研究方法分类体系的基础上,分析近十年科研论文中的研究方法得出了图书情报领域科研论文研究方法的分类... 本文通过对图书情报领域的科研论文进行内容分析,从科研论文研究方法的角度揭示图书情报学科的发展情况。在通过参考已有的科研论文研究方法分类体系的基础上,分析近十年科研论文中的研究方法得出了图书情报领域科研论文研究方法的分类体系。为揭示该学科科研论文中研究方法的演化规律,笔者对近十年发表在《情报学报》和《中国图书馆学报》两本权威期刊上共2556篇论文的研究方法进行分类标注并进行演化分析。结果表明:(1)图书情报学科的研究方法越来越重视定量的研究方法;(2)《情报学报》的研究方法从一开始的以定性研究为主逐渐发展为以数据为驱动的定量研究为主定性研究为辅;(3)《中国图书馆学报》的研究方法主要以定性研究为主,近年来定量研究占比有所增长,但是仍然以定性研究为主。 展开更多
关键词 图书情报学 研究方法 科研论文 演化分析 内容分析
下载PDF
医学图像模态特征表达及其比较研究 被引量:6
16
作者 丁恒 陆伟 +1 位作者 林霞 曹光超 《情报学报》 CSSCI 北大核心 2016年第12期1296-1304,共9页
医学图像模态的自动标注是建立检索词和医学图像间准确关联,实现医学图像检索的基础。当前医学图像的模态特征表达多采用基于单一表达模型的方法,没有充分运用不同表达模型的互补优势,医学图像的语义描述框架与医学图像检索需求不匹配... 医学图像模态的自动标注是建立检索词和医学图像间准确关联,实现医学图像检索的基础。当前医学图像的模态特征表达多采用基于单一表达模型的方法,没有充分运用不同表达模型的互补优势,医学图像的语义描述框架与医学图像检索需求不匹配。针对这些不足,本文在介绍医学图像模态分类框架和标准数据集的基础上,分析了文本特征和视觉特征对医学图像模态自动标注的影响,对比了向量空间模型(VSM)、潜在语义索引(LSI)、视觉词袋模型(B0W)、卷积神经网络模型(CNN)等多种特征表达模型在医学图像模态自动标注上的效果,研究发现文本特征与视觉特征各适用于部分医学模态的识别与区分,组合多种表达模型能够获得最佳的标注效果。 展开更多
关键词 医学图像检索 图像标注 ImageCLEFmed 模型组合
下载PDF
实体链接研究综述 被引量:19
17
作者 陆伟 武川 《情报学报》 CSSCI 北大核心 2015年第1期105-112,共8页
实体链接是指将文本中的实体指称链向知识库实体的过程,它能够丰富文本语义信息,在自然语言处理、信息检索等领域有着广泛的应用前景。本文详细介绍了实体链接的概念和步骤,回顾了实体链接发展过程中的相关研究,在总结现有实体链接... 实体链接是指将文本中的实体指称链向知识库实体的过程,它能够丰富文本语义信息,在自然语言处理、信息检索等领域有着广泛的应用前景。本文详细介绍了实体链接的概念和步骤,回顾了实体链接发展过程中的相关研究,在总结现有实体链接研究的基础上,对实体链接研究框架、实体链接步骤及各阶段所采用的技术方法进行了综述。最后对实体链接在国际评测会议中的现状进行了总结,分析了未来的研究方向。 展开更多
关键词 实体识别 实体消歧 实体链接
下载PDF
基于主题与用户偏好分析的查询推荐研究 被引量:10
18
作者 陆伟 张晓娟 《情报学报》 CSSCI 北大核心 2012年第12期1252-1258,共7页
查询日志分析作为近年来常用的查询推荐方法,常采用基于词共现的上下文来生成查询推荐。本文利用AOL日志,在词上下文分析基础之上,采用主题分析,再结合用户偏好,进行查询推荐建模,实验结果表明:采用主题分析可以显著提升查询推... 查询日志分析作为近年来常用的查询推荐方法,常采用基于词共现的上下文来生成查询推荐。本文利用AOL日志,在词上下文分析基础之上,采用主题分析,再结合用户偏好,进行查询推荐建模,实验结果表明:采用主题分析可以显著提升查询推荐的精确度,进一步考虑用户偏好后,推荐效果又有了进一步的提升。 展开更多
关键词 查询 查询推荐 查询替换 查询主题 用户偏好
下载PDF
基于引文上下文的学术文本自动摘要技术研究 被引量:4
19
作者 陈海华 黄永 +1 位作者 张炯 陆伟 《数字图书馆论坛》 CSSCI 2016年第8期43-49,共7页
学术文本自动摘要是指对于给定学术文献,自动地抽取其核心内容,以提高用户撰写和阅读文献的效率。目前基于文本词频对句子重要性排序的自动摘要技术,无法从语义层面揭示学术文本的核心内容。本文在已有研究的基础上,引入引文上下文内容... 学术文本自动摘要是指对于给定学术文献,自动地抽取其核心内容,以提高用户撰写和阅读文献的效率。目前基于文本词频对句子重要性排序的自动摘要技术,无法从语义层面揭示学术文本的核心内容。本文在已有研究的基础上,引入引文上下文内容特征,并通过构建支持向量回归模型,综合考虑自动摘要系统中的各个特征对句子权重的影响,重新对句子重要性进行排序。基于WE-ROUGE的评测表明,相比于传统基于词频统计和图模型的方法,本文提出的算法能够有效提升自动摘要的准确度。 展开更多
关键词 文本自动摘要 引文上下文 支持向量回归 词向量
下载PDF
基于多标签分类的引文全局功能识别研究 被引量:4
20
作者 刘兴帮 陆伟 孟睿 《数字图书馆论坛》 CSSCI 2016年第3期2-9,共8页
引文功能是科研工作者引用一篇文献的动机。其中,相比较于只考虑引文前后文语句的引文局部功能,引文全局功能关注的是参考文献在全文范围内的信息,是被引文献在施引文献中价值的综合体现,其自动识别研究对于引文推荐、引文索引、语义化... 引文功能是科研工作者引用一篇文献的动机。其中,相比较于只考虑引文前后文语句的引文局部功能,引文全局功能关注的是参考文献在全文范围内的信息,是被引文献在施引文献中价值的综合体现,其自动识别研究对于引文推荐、引文索引、语义化引文网络构建等学术文本挖掘研究具有重要意义。文章根据"参考文献在施引文献中存在一处或多处具体引用"这一特点,将引文全局功能识别研究转化为多标签分类问题,并构建引文全局功能数据集,在此数据集之上进行引文全局功能自动识别实验,取得较好的效果。 展开更多
关键词 引文全局功能 多标签分类 学术文本挖掘 引文分析
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部