期刊文献+
共找到175篇文章
< 1 2 9 >
每页显示 20 50 100
中国人文社科领域研究方法应用的实证研究——基于大规模博士学位论文的调查 被引量:1
1
作者 章成志 储新龙 《情报理论与实践》 北大核心 2024年第5期48-57,共10页
[目的/意义]研究方法的发展能在一定程度上反映学科的发展。目前鲜有针对中国整体人文社科领域研究方法使用的调研。对该领域不同学科研究方法的使用情况进行比较,可以揭示不同学科研究方法应用的特点,并为相关学者进行课题研究提供研... [目的/意义]研究方法的发展能在一定程度上反映学科的发展。目前鲜有针对中国整体人文社科领域研究方法使用的调研。对该领域不同学科研究方法的使用情况进行比较,可以揭示不同学科研究方法应用的特点,并为相关学者进行课题研究提供研究方法的使用建议。[方法/过程]与一般期刊论文相比,中国人文社科领域的博士学位论文中的研究方法通常会在特定的小节被明确阐述,便于提取分析。文章基于人文社科领域21个一级学科共63741篇博士学位论文,构建研究方法分类框架,抽取论文使用的研究方法,并从研究方法的使用频次、时间演化以及学科相关度角度进行深入分析。[结果/结论]中国人文社科领域研究方法命名存在不规范的问题,但方法意识正逐渐增强;比较分析法、历史分析法、文献研究法等经典的数据分析方法仍占主导地位;多数热门研究方法在人文社科领域不同学科之中存在一定的普适性。 展开更多
关键词 研究方法 中国人文社科领域 博士学位论文 方法分类框架 方法应用分析
下载PDF
图书情报领域中外学者研究方法使用差异分析——跨语言文本分类的视角
2
作者 章成志 储新龙 +1 位作者 田亮 储荷婷 《情报理论与实践》 北大核心 2024年第9期45-58,共14页
[目的/意义]对学科研究方法的自省式分析对于理解学科发展和建立学科自主知识体系至关重要。通过研究国内外学者在研究方法上的使用差异,可以更全面地了解不同地区和文化背景下的研究者在应对不同研究问题所采用的策略和方法,从而促进... [目的/意义]对学科研究方法的自省式分析对于理解学科发展和建立学科自主知识体系至关重要。通过研究国内外学者在研究方法上的使用差异,可以更全面地了解不同地区和文化背景下的研究者在应对不同研究问题所采用的策略和方法,从而促进学术交流和跨国合作,并进一步推动学科的发展与学科知识体系的完善。[方法/过程]以图书情报领域5种高影响力中英文期刊中1990-2021年共30余年的学术论文为研究对象,采用跨语言文本分类方法对这些论文中的研究方法进行自动分类。然后从研究方法的使用频率与演化差异以及适用主题多样性差异两个角度,进行中外比较研究。[结果/结论]国外学者越来越倾向于使用定性方法,而对定量方法的使用正在减少。同时,国内外大多数研究方法的适用主题多样性都在增加。这项研究对于理解图书情报学科的发展、促进学术交流与合作以及提高国内学者的国际影响力具有重要意义。 展开更多
关键词 自动分类模型 研究方法分类 跨语言文本分类 研究方法使用
下载PDF
基于SciBERT与ChatGPT数据增强的研究流程段落识别 被引量:2
3
作者 张恒 赵毅 章成志 《情报理论与实践》 北大核心 2024年第1期164-172,153,共10页
[目的/意义]在阅读文献的过程中,研究流程是研究者需要特别关注的一个重要方面,自动识别学术文本中描述研究流程的段落对辅助文献阅读、学习研究设计等有着重要意义。[方法/过程]文章以自然语言处理领域为例,收集代表性会议论文构建数... [目的/意义]在阅读文献的过程中,研究流程是研究者需要特别关注的一个重要方面,自动识别学术文本中描述研究流程的段落对辅助文献阅读、学习研究设计等有着重要意义。[方法/过程]文章以自然语言处理领域为例,收集代表性会议论文构建数据集。分别基于传统机器学习模型、神经网络分类工具以及预训练语言模型构建分类器识别研究流程段落,然后对不同模型的分类效果进行评估,确定性能最优的模型。为进一步提升研究流程段落识别效果,在最优模型的基础上,基于ChatGPT进行了数据增强。[结果/结论]实验结果表明,在所有分类器中,SciBERT具有最好的研究流程段落识别效果。基于ChatGPT的数据增强可使SciBERT模型的分类性能进一步提高,最终准确率(Acc)和F_(1)值分别达到了0.9414和0.9409。 展开更多
关键词 学术文本 研究流程段落 文本分类 SciBERT ChatGPT数据增强
下载PDF
什么类型的机构合作会产生更高的学术影响力?--以自然语言处理领域为例 被引量:1
4
作者 杨裕楷 赵毅 章成志 《图书馆论坛》 北大核心 2024年第5期40-53,共14页
研究特定领域中机构合作类型与学术影响力之间的关系,能深入了解不同合作类型所产生的学术影响力差异,以识别出哪种类型的合作可能更具生产力或效率。文章以自然语言处理(NLP)领域为例探究机构合作类型与学术影响力之间的关系。通过与... 研究特定领域中机构合作类型与学术影响力之间的关系,能深入了解不同合作类型所产生的学术影响力差异,以识别出哪种类型的合作可能更具生产力或效率。文章以自然语言处理(NLP)领域为例探究机构合作类型与学术影响力之间的关系。通过与工业界进行合作,可以将学术界的研究成果转化为实际应用,但不同合作模式对合作效果的影响有所不同,因此文章研究不同类型的机构合作与学术影响力之间的关系,从而帮助机构更好地规划合作策略,提高合作效果。首先,将机构分为学术界机构和工业界机构;然后,将合作类型分为学术界机构间合作、学术界机构内合作、学术界与工业界机构间合作、工业界机构间合作和工业界机构内合作;最后,从谷歌学术获取5种合作类型发表的论文被引频次信息,同时定义高被引论文,采用这两个指标衡量学术影响力,并将论文归属到NLP领域不同任务,发现学术界与工业界的机构间合作往往能产生更大的学术影响力,且在不同任务中学术影响力最高的机构合作类型存在差异。 展开更多
关键词 科学合作 机构合作类型 合作绩效 自然语言处理
下载PDF
大模型时代下全文计量分析的应用与思考——2023全文本文献计量分析学术沙龙综述
5
作者 周海晨 章成志 +3 位作者 胡志刚 徐硕 毛进 陈亮 《信息资源管理学报》 2024年第2期162-168,F0003,共8页
2023年9月14日—16日,由中国科学院成都文献情报中心主办、科技创新评价研究中心(SERC)承办的“第六届科学计量与科技评价天府论坛”在成都举办。由章成志、胡志刚、徐硕等人共同发起的第四届“全文本文献计量分析”沙龙作为其中的一项... 2023年9月14日—16日,由中国科学院成都文献情报中心主办、科技创新评价研究中心(SERC)承办的“第六届科学计量与科技评价天府论坛”在成都举办。由章成志、胡志刚、徐硕等人共同发起的第四届“全文本文献计量分析”沙龙作为其中的一项重要活动,吸引了八十余位专家学者的积极参与和深入交流。本文通过对沙龙嘉宾的发言与研讨内容进行梳理与总结,将沙龙的主要内容归纳为大语言模型与全文本计量分析、全文计量分析的应用场景等方面,以期介绍国内外全文本文献计量分析的研究现状和发展趋势。 展开更多
关键词 全文本计量 大语言模型 颠覆性技术 创新识别
下载PDF
从算法提出视角看国家学术影响力差异--以自然语言处理领域算法为例
6
作者 王玉琢 李晓婷 +2 位作者 乔红 邢瀚文 章成志 《图书馆论坛》 北大核心 2024年第5期54-66,共13页
随着数字技术发展,算法在不同领域的重要性日益提升,但少有论文探讨不同国家在算法研发工作中的表现。文章以自然语言处理领域为例,利用机器学习方法抽取该领域学术论文提及的算法,获得领域中的完整算法集合;收集所有算法的提出国家及... 随着数字技术发展,算法在不同领域的重要性日益提升,但少有论文探讨不同国家在算法研发工作中的表现。文章以自然语言处理领域为例,利用机器学习方法抽取该领域学术论文提及的算法,获得领域中的完整算法集合;收集所有算法的提出国家及相关信息,从算法数量和质量等维度分析不同国家的学术影响力。研究发现:在算法数量上,各国差异明显,中美是提出算法的主力军;在算法质量上,美国在综合被引上表现出色,各国平均被引差距较小,澳大利亚、乌克兰等排名明显提升;综合考虑算法数量和质量,将不同国家的学术影响力分为4种类型,从中发掘出数量、质量表现皆优的模范型国家,以及在单一维度影响力高的潜力型国家。文章为国家、机构、个人的学术影响力评价提供了新视角,验证了利用细粒度知识成果进行国家学术影响力评价的可能性,能为算法创新过程中各国之间的学术合作提供参考。 展开更多
关键词 算法实体 学术影响力 影响力评估 国别差异
下载PDF
基于公式化表达脱敏与边界识别加强的学术论文研究问题与方法识别研究
7
作者 张颖怡 章成志 《情报学报》 CSCD 北大核心 2024年第6期712-732,共21页
研究问题和方法是学术论文中的重要组成部分,其在学术论文组织、管理与检索以及科研成果评价中具有重要意义。为缓解研究问题与方法识别中存在的公式化表达依赖和词语边界识别错误等问题,本文提出一种联合公式化表达脱敏和边界识别加强... 研究问题和方法是学术论文中的重要组成部分,其在学术论文组织、管理与检索以及科研成果评价中具有重要意义。为缓解研究问题与方法识别中存在的公式化表达依赖和词语边界识别错误等问题,本文提出一种联合公式化表达脱敏和边界识别加强的模型。具体地,公式化表达脱敏使用数据增强方法实现,边界识别加强使用指针网络与序列标注模型实现。随着学术论文的开放获取,学术论文全文被研究者用于实体识别任务中。为证明使用学术论文全文的必要性,本文人工构建了自然语言处理领域的摘要和全文标注数据集,同时设计了数值和内容指标,用于分析两类数据集中的问题和方法识别结果以及问题与方法关系对抽取结果的差异。十折交叉实验结果表明,本文模型的宏平均F1值优于SciBERT-BiLSTM-CRF基线模型3.69个百分点且存在显著性差异。根据摘要与全文实体识别和关系对抽取结果的对比,发现摘要中包含的问题与方法实体的表意较宽泛,全文中具有更多描述模型设计和训练细节的实体和关系对。 展开更多
关键词 知识实体识别 研究问题和方法识别 指针网络 数据增强
下载PDF
跨学科知识发现及其生长路径挖掘研究——基于国家自然科学基金的跨学科申请视角
8
作者 吴小兰 章成志 《科技情报研究》 2024年第2期58-71,共14页
[目的/意义]在国家自然科学基金项目申请中,同一个学者在不同时间使用不同学科基金代码,这在一定程度上促进了跨学科知识的融合与生长。为此,文章基于国家自然科学基金跨学科申请视角,挖掘跨学科知识及其融合生长路径。[方法/过程]首先... [目的/意义]在国家自然科学基金项目申请中,同一个学者在不同时间使用不同学科基金代码,这在一定程度上促进了跨学科知识的融合与生长。为此,文章基于国家自然科学基金跨学科申请视角,挖掘跨学科知识及其融合生长路径。[方法/过程]首先,结合自然科学基金学科申请代码的层级结构,改进并优化了跨学科性测度指标,识别最具有跨学科性的跨学科知识。随后,构建跨学科知识与一级学科的二类型异质网络,并基于RankClus实现了跨学科知识社区发现与生长路径挖掘。[结果/结论]研究发现,存在显著的12个跨学科知识主题与6个明显的知识生长路径,其知识生长路径分别是生命科学部-医学科学部(C-H)、化学科学部-工程与材料科学部(B-E)、生命科学部—地理科学部(C-D)、数理科学部—信息科学部—管理科学部(A-FG)、数理科学部—地理科学部—工程与材料科学部(A-D-E)、化学科学部—管理科学部(B-G)。 展开更多
关键词 跨学科知识 国家自然科学基金 知识生长路径 跨学科测度指标
下载PDF
学术文献全文内容中的方法实体细粒度抽取及演化分析研究 被引量:2
9
作者 章成志 谢雨欣 张恒 《情报学报》 CSCD 北大核心 2023年第8期952-966,共15页
在科学研究过程中,科研人员需要考虑针对不同的研究问题选择合适的研究方法,有时还会对研究方法进行优化,从而更好地解决研究问题。因此,研究方法往往是解决研究问题的关键,是学术文献的重要知识。帮助科研人员快速发现学术文献全文内... 在科学研究过程中,科研人员需要考虑针对不同的研究问题选择合适的研究方法,有时还会对研究方法进行优化,从而更好地解决研究问题。因此,研究方法往往是解决研究问题的关键,是学术文献的重要知识。帮助科研人员快速发现学术文献全文内容中蕴含的方法实体,为其推荐适用于自身研究问题的关键解决方法提供实践参考,可以提高科研人员解决问题的效率。当前相关研究缺乏对方法实体之间共现关系的分析,未充分挖掘学术文献中蕴含的丰富知识。为此,本研究以自然语言处理领域为例,将方法实体细分为算法、数据集、指标以及工具4种类型,并标注了50篇论文作为训练语料。本研究构建了CRF(conditional random field)、BiLSTM(bi-directional long short-term memory)+CRF等4种实体抽取模型。研究结果表明,SciBERT(scientific bidirectional encoder representations from transformers)+CRF模型的性能最优。以ACL年会(Annual Meeting of the Association for Computational Linguistics)在2001—2020年共20年收录的论文全文数据为基础,进一步分析抽取出的方法实体的使用情况。本研究结合经典关联规则挖掘算法Apriori和卡方值构建方法实体共现数据集,并分析方法实体的演化。研究结果揭示了方法实体间的共现关系及其整体演化情况,可辅助特定领域的科研人员寻找合适的研究方法。 展开更多
关键词 方法实体 命名实体识别 APRIORI算法 演化分析
下载PDF
新场景、新技术背景下领域知识组织与服务的创新——评《网络社区知识聚合与服务研究》
10
作者 章成志 《数字图书馆论坛》 2023年第6期69-70,共2页
领域知识组织与服务是信息资源管理学科的核心课题。近年来,有两个该课题的研究动态值得关注:其一是其场景逐步向网络社区延伸,用户基于特定兴趣或目标聚集于诸多网络社区并积累了大量领域知识资源,由此突出了网络社区场景下知识资源组... 领域知识组织与服务是信息资源管理学科的核心课题。近年来,有两个该课题的研究动态值得关注:其一是其场景逐步向网络社区延伸,用户基于特定兴趣或目标聚集于诸多网络社区并积累了大量领域知识资源,由此突出了网络社区场景下知识资源组织和服务的重要性。 展开更多
关键词 网络社区 知识聚合 知识组织与服务 核心课题 社区延伸 新技术背景 信息资源管理学科 新场景
下载PDF
专利技术互补性研究综述:概念、测度及应用
11
作者 张金柱 施佳璐 章成志 《情报学报》 CSCD 北大核心 2023年第10期1251-1264,共14页
专利技术互补性作为各类组织进行技术创新的重要参考,近年来受到国内外学者的广泛关注。本文回顾了技术互补性概念的发展沿革,从产业/行业分类、专利分类、专利引用关系以及专利内容特征关联四个角度归纳其测度方法,最后综述专利技术互... 专利技术互补性作为各类组织进行技术创新的重要参考,近年来受到国内外学者的广泛关注。本文回顾了技术互补性概念的发展沿革,从产业/行业分类、专利分类、专利引用关系以及专利内容特征关联四个角度归纳其测度方法,最后综述专利技术互补性的多种应用。基于此,总结形成专利技术互补性的概念内涵,发现相关研究主要利用专利分类或专利引用网络来形成技术互补测度指标和方法,并主要应用于创新绩效因素判定、企业并购决策制定以及潜在合作伙伴发现等。未来,建议继续细化和具体化技术互补性概念,综合利用专利文本、图表、市场信息等多模异构数据,设计细粒度定量测度指标,引入深度学习等方法,提升专利技术互补测度的准确性,进一步拓宽专利技术互补性的应用范围,提升应用效果。 展开更多
关键词 专利技术 互补性 概念 测度 应用
下载PDF
全文计量分析的实践与展望:理论、方法与应用——2022全文本文献计量分析学术沙龙综述 被引量:3
12
作者 周海晨 章成志 +3 位作者 胡志刚 徐硕 杨思洛 李恺 《信息资源管理学报》 2023年第2期135-142,共8页
2022年12月1日—2日,由中科院成都文献情报中心主办、科技创新评价研究中心(SERC)承办“第五届科学计量与科技评价天府论坛”在成都举办。由章成志等人发起的第三届“全文本文献计量分析”沙龙是天府论坛的一项重要活动,吸引了百余位专... 2022年12月1日—2日,由中科院成都文献情报中心主办、科技创新评价研究中心(SERC)承办“第五届科学计量与科技评价天府论坛”在成都举办。由章成志等人发起的第三届“全文本文献计量分析”沙龙是天府论坛的一项重要活动,吸引了百余位专家学者的参与和交流。本文通过对沙龙嘉宾的发言与研讨内容进行梳理与总结,将沙龙的主要内容归纳为理论研究、技术方法与应用方向等方面,以期揭示国内外全文本文献计量分析的研究现状和发展趋势。 展开更多
关键词 全文本 文献计量 全文计量 引文内容 颠覆性技术 弱信号
下载PDF
基于层次观点树的社交媒体多维度观点挖掘研究 被引量:1
13
作者 习海旭 章成志 +1 位作者 赵毅 田亮 《情报学报》 CSCD 北大核心 2023年第3期304-315,共12页
挖掘社交媒体舆论中隐含的观点有助于人们快速有效地了解社交媒体舆论,避免主观和随意地发表评论,传播错误信息进而引发恶性事件。目前,社交媒体观点挖掘主要从观点主题、倾向性或某方面内容等单个维度分析舆论,人们难以全面认识舆论并... 挖掘社交媒体舆论中隐含的观点有助于人们快速有效地了解社交媒体舆论,避免主观和随意地发表评论,传播错误信息进而引发恶性事件。目前,社交媒体观点挖掘主要从观点主题、倾向性或某方面内容等单个维度分析舆论,人们难以全面认识舆论并掌握这些观点内容之间的逻辑关联等多维度信息,且各子任务的相关性能还有待提高。为了更准确地了解且综合地分析不同维度的舆论信息,促进人们对社交媒体舆论的深入认知,本文提出了一种面向社交媒体短文本,体现各维度观点内容之间逻辑关系的层次观点树构建方法,并选取推特(Twitter)中有关羟基氯喹治疗COVID-19疾病的话题内容,进行层次观点树构建的实证研究。结果表明,本文提出的层次观点树构建方法能够提供多维度、易理解的社交媒体观点信息。 展开更多
关键词 社交媒体 主题聚类 立场识别 观点挖掘 层次观点树
下载PDF
影响不同子领域国际合作的距离因素相同吗?——来自计算机科学学科的证据 被引量:1
14
作者 赵毅 章成志 习海旭 《情报学报》 CSCD 北大核心 2023年第12期1458-1476,共19页
探索影响国际科学合作的因素对于提高国际合作水平具有重要意义。然而,现有研究主要聚焦于顶层学科的分析,忽略了影响不同子领域国际合作的距离因素的异质性,研究结论无法为精细化政策的制定提供依据。为此,本文从比较视角出发,基于DBL... 探索影响国际科学合作的因素对于提高国际合作水平具有重要意义。然而,现有研究主要聚焦于顶层学科的分析,忽略了影响不同子领域国际合作的距离因素的异质性,研究结论无法为精细化政策的制定提供依据。为此,本文从比较视角出发,基于DBLP数据库中1990—2019年187个国家的计算机科学论文发表数据,分析了计算机科学学科不同子领域的国际合作时空演化模式,并借助零膨胀beta回归模型揭示影响不同子领域、不同时期国际合作的6种距离因素。研究结果表明,从时空分布来看,以计算机科学代表性子领域——人工智能为例,本文发现早期人工智能领域的高强度合作关系主要由美国主导,随着中国、新加坡等新兴人工智能强国逐渐涌现,国际合作模式由“一强多极”转向“多极合作”。从总体的回归结果来看,地理距离、认知距离和经济距离会阻碍所有子领域的国际合作,而认知距离的影响最大,文化距离、企业参与程度距离和政治距离只在部分领域与国际合作存在显著负向相关关系。从时间维度来看,在不同的子领域,地理距离和认知距离的边际效应呈现下降趋势,而经济距离的影响则随着时间变化而增大。 展开更多
关键词 国际合作 团队科学 子领域差异 时空分布 距离因素
下载PDF
学术论文中多方法的过程结构分析研究——以我国图书情报领域为例 被引量:1
15
作者 李博闻 章成志 《情报理论与实践》 北大核心 2023年第5期193-201,143,共10页
[目的/意义]按照系统论观点,多方法研究中不同方法、技术和工具并非孤立发生作用,而是通过确立的相互关系和组织秩序,作为整体中的要素综合于具体的科学理论创立和解释过程之中。为弥补人们对多方法过程结构关注的不足,并从知识单元和... [目的/意义]按照系统论观点,多方法研究中不同方法、技术和工具并非孤立发生作用,而是通过确立的相互关系和组织秩序,作为整体中的要素综合于具体的科学理论创立和解释过程之中。为弥补人们对多方法过程结构关注的不足,并从知识单元和语用层次探索多方法使用的现象与规律,文章提出多方法过程结构分析理论和方法。[方法/过程]首先,通过文献调研与理论梳理,提出创新背景、理论基础、一般步骤。其次,以我国图书情报领域为例,选取社会网络分析方法(SNA)研究论文为实证对象,结合CNKI与万方数据检索获取2003—2021年4082篇SNA有关论文。最后,对2116篇改进或使用了SNA的论文,多视角分析其方法过程结构。[结果/结论]通过实证,文章提出的理论和方法,为学术评价问题丰富了一种新的“证伪”思路;以“先天说”充实了方法生命周期学说;为过度挪用西方科研工具产生的学术风险提供了新证据;为范式理论在我国图书情报领域中的说明机制完善提供了新依据。结果显示:多方法过程结构分析,兼具理论和实践价值,能够在推动图书情报研究深化的过程中发挥作用。[局限]以我国图书情报领域学术论文为实证对象,未考虑其他学科领域、其他类型学术文献是文章的不足之处。 展开更多
关键词 多方法 方法论 过程结构 SPAM 研究方法 方法史 社会网络分析
下载PDF
细粒度致谢实体的学科差异研究——以中国人文社科博士学位论文为例 被引量:3
16
作者 和嘉昕 张仕锦 +2 位作者 郑嘉瑜 储新龙 章成志 《科技情报研究》 2023年第1期58-77,共20页
[目的/意义]学位论文致谢是作者对支持他们研究的个人和机构表达感谢的公开文本。抽取致谢实体、对比不同学科学位论文致谢对象的分布,有助于了解在不同学科对博士生提供帮助的人和机构的类别。[方法/过程]本文爬取21个学科60 000余篇... [目的/意义]学位论文致谢是作者对支持他们研究的个人和机构表达感谢的公开文本。抽取致谢实体、对比不同学科学位论文致谢对象的分布,有助于了解在不同学科对博士生提供帮助的人和机构的类别。[方法/过程]本文爬取21个学科60 000余篇中国人文社科博士学位论文致谢文本,抽取致谢实体,构建细粒度的致谢实体分类体系,将致谢实体分为人物与致谢机构两大类别与13个子类,进一步从致谢对象类别分布、时间演化、学科差异3个方面进行分析。[结果/结论]研究发现,致谢人物的频次高于机构,家人与课题组成员频次呈现较快增长趋势;不同学科致谢实体子类分布呈现一定差异,其中图书馆、情报与档案管理学科的致谢对象最为丰富多样。 展开更多
关键词 致谢语 学位论文 致谢实体 学科差异
下载PDF
面向融合出版前沿主题发现的学术论文未来工作句挖掘研究
17
作者 谢林蕾 向熠 章成志 《情报工程》 2023年第5期123-138,共16页
[目的/意义]近年来,随着传统出版与数字出版的不断融合,形成了融合出版的新兴范式。如何科学准确地把握融合出版领域未来研究趋势具有重要研究意义。学术论文中描述未来研究工作的句子(简称“未来工作句”),不但可以辅助预测未来可能出... [目的/意义]近年来,随着传统出版与数字出版的不断融合,形成了融合出版的新兴范式。如何科学准确地把握融合出版领域未来研究趋势具有重要研究意义。学术论文中描述未来研究工作的句子(简称“未来工作句”),不但可以辅助预测未来可能出现的前沿主题,还可为科研工作者、特别是初学者选题提供参考。[方法/过程]对融合出版领域论文中的未来工作句进行人工标注和类别划分,构建未来工作句识别与分类语料库。在此基础上,使用支持向量机、朴素贝叶斯和随机森林三种模型结合SelectKBest特征选择方法,来训练未来工作句自动识别模型。[结果/结论]LinearSVC在未来工作句自动识别任务中表现最为出色,其加权F1值达到92.08%。另外,本文对分类语料库中的未来工作句内容及其类别进行分析,得到融合出版领域未来工作句的类别分布及其变化规律。 展开更多
关键词 融合出版 未来工作句 机器学习 文本分类 内容分析
下载PDF
学术专著引用行为研究——基于引文内容特征分析的视角 被引量:15
18
作者 章成志 王玉琢 卢超 《情报学报》 CSSCI CSCD 北大核心 2017年第3期319-330,共12页
当前的引文内容分析研究基本上以学术论文为研究对象。与学术论文相比,学术专著的篇幅较长、引文内容更加翔实。学术专著的引文内容特征分布对学术专著的引文内容分析方法、乃至引用行为与动机等研究都具有重要的意义。本文首先通过对Mo... 当前的引文内容分析研究基本上以学术论文为研究对象。与学术论文相比,学术专著的篇幅较长、引文内容更加翔实。学术专著的引文内容特征分布对学术专著的引文内容分析方法、乃至引用行为与动机等研究都具有重要的意义。本文首先通过对Morgan&Claypool出版的39本学术专著的引文内容进行人工标注,构建包含13539条引文内容的学术专著引文内容分析语料;然后分别从引文内容位置分布、引文提及次数以及引文内容上下文特征等三个方面分析学术专著的引文行为,并针对不同学科学术专著的引用行为特点进行了总结;最后本文讨论了学术专著与学术论文引文内容特征分布的差异,并指出进行学术专著引文内容分析时应注意的问题。本文研究成果可以帮助学者进一步了解学术专著引用行为的特点,并为后续的学术专著中的引文动机研究打下基础。 展开更多
关键词 学术专著 引文内容分析 引用行为 引用位置 提及次数
下载PDF
跨学科研究综述 被引量:76
19
作者 章成志 吴小兰 《情报学报》 CSSCI CSCD 北大核心 2017年第5期523-535,共13页
随着社会问题的多样化和复杂化,跨学科研究将是解决社会问题的必然选择,为此,本文从三个方面梳理和总结了现有跨学科研究现状:首先,我们从跨学科研究发展历程开始,对跨学科研究概念及内涵进行了剖析;随后,我们从基础研究、关键技术研究... 随着社会问题的多样化和复杂化,跨学科研究将是解决社会问题的必然选择,为此,本文从三个方面梳理和总结了现有跨学科研究现状:首先,我们从跨学科研究发展历程开始,对跨学科研究概念及内涵进行了剖析;随后,我们从基础研究、关键技术研究和跨学科知识挖掘三个角度总结了现有研究跨学科研究内容;最后,我们归纳了现有存在的问题和挑战。这为后续跨学科研究的开展与发展提供了一个全面的视角和参考。 展开更多
关键词 跨学科研究 科学引文索引 文献计量学
下载PDF
基于学术论文全文的研究方法实体自动识别研究 被引量:33
20
作者 章成志 张颖怡 《情报学报》 CSSCI CSCD 北大核心 2020年第6期589-600,共12页
研究方法的规范程度标志着一门学科发展的成熟程度。在情报学学科中,关于研究方法的理论分析和规范性研究逐渐引起重视,而使用量化方法进行实证分析的研究相对较少。另外,当一个研究方法实体出现在学术文本中,则表示该研究方法实体被该... 研究方法的规范程度标志着一门学科发展的成熟程度。在情报学学科中,关于研究方法的理论分析和规范性研究逐渐引起重视,而使用量化方法进行实证分析的研究相对较少。另外,当一个研究方法实体出现在学术文本中,则表示该研究方法实体被该学术论文使用或该学术论文引用该研究方法实体用于分析或比较。梳理学术论文使用的研究方法实体,可以帮助学者快速了解学术论文的主旨内容。总结学术论文引用的研究方法实体,有助于理清学科领域中研究方法的演变和发展模式。因此,本文将研究方法分为论文使用研究方法和论文引用研究方法。本文比较双向长短时记忆网络等8种神经网络研究方法实体自动抽取模型,从中选择最优的模型进行研究方法实体的识别。实验结果表明,基于字向量的、结合条件随机场的双向长短时记忆网络联合训练模型在研究方法识别任务中表现出最高的性能。以《情报学报》近10年的论文全文为依据,分析抽取出的研究方法实体的使用情况。统计分析结果发现,情报学学科中与实验法相关的研究方法使用频次和引用频次均最高。 展开更多
关键词 研究方法识别 命名实体识别 深度学习 序列标注
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部