[目的/意义]创新驱动,情报先行,在更广的范围内站在战略高度,整合社会经济、科技发展、横向分析等相关情报,深度挖掘信息资源,需要新的情报学理论、技术和方法进行支撑。了解当前国内外支持创新的情报学研究状况,揭示该领域研究热点主...[目的/意义]创新驱动,情报先行,在更广的范围内站在战略高度,整合社会经济、科技发展、横向分析等相关情报,深度挖掘信息资源,需要新的情报学理论、技术和方法进行支撑。了解当前国内外支持创新的情报学研究状况,揭示该领域研究热点主题和前沿趋势,为构建创新情报学做一定准备。[方法/过程]选取国内CNKI和国外Web of Science核心数据库为数据来源,运用文献计量学方法,借助可视化软件Citespace,对发文量趋势、关键词聚类以及突现词检测进行分析。[结果/结论]研究发现,中外期刊论文研究热点呈现多元化特点,包括面向创新的专利情报分析、面向创新的知识管理、创新识别的情报学方法等研究成果;未来研究应聚焦在:面向创新的学术成果评价、创新情报的识别和抽取以及创新情报的组织和检索等主题,推动支持创新的情报学研究向构建创新情报学发展。展开更多
[目的/意义]基于深度学习的中共党史文献命名实体识别,有助于探索与挖掘党史资源的价值,对于构建中共党史领域专业术语库、知识图谱、知识问答系统等应用发挥着基础性作用,为进一步的智慧化的中共党史数字人文研究提供基础支撑。[方法/...[目的/意义]基于深度学习的中共党史文献命名实体识别,有助于探索与挖掘党史资源的价值,对于构建中共党史领域专业术语库、知识图谱、知识问答系统等应用发挥着基础性作用,为进一步的智慧化的中共党史数字人文研究提供基础支撑。[方法/过程]本研究采用基于Trie树的字符串匹配算法完成实验语料的批量标注任务,利用中文XLNet(Generalized Autoregressive Pretraining for Language Understanding,XLNet)预训练模型嵌入主流BiLSTM-CRF模型中,构建基于XLNet-BiLSTM-CRF的中共党史文献命名实体识别模型。[结果/结论]该模型在命名实体识别中表现优异,其调和平均数F值为0.9535,高于BiLSTM-CRF、BERT-BiLSTM-CRF、BERT-wwmext-BiLSTM-CRF、XLNet-CRF等深度学习模型。研究表明本文提出的方法对于中共党史非结构化文本挖掘工作具有可行性和有效性。展开更多
文摘[目的/意义]创新驱动,情报先行,在更广的范围内站在战略高度,整合社会经济、科技发展、横向分析等相关情报,深度挖掘信息资源,需要新的情报学理论、技术和方法进行支撑。了解当前国内外支持创新的情报学研究状况,揭示该领域研究热点主题和前沿趋势,为构建创新情报学做一定准备。[方法/过程]选取国内CNKI和国外Web of Science核心数据库为数据来源,运用文献计量学方法,借助可视化软件Citespace,对发文量趋势、关键词聚类以及突现词检测进行分析。[结果/结论]研究发现,中外期刊论文研究热点呈现多元化特点,包括面向创新的专利情报分析、面向创新的知识管理、创新识别的情报学方法等研究成果;未来研究应聚焦在:面向创新的学术成果评价、创新情报的识别和抽取以及创新情报的组织和检索等主题,推动支持创新的情报学研究向构建创新情报学发展。
文摘[目的/意义]基于深度学习的中共党史文献命名实体识别,有助于探索与挖掘党史资源的价值,对于构建中共党史领域专业术语库、知识图谱、知识问答系统等应用发挥着基础性作用,为进一步的智慧化的中共党史数字人文研究提供基础支撑。[方法/过程]本研究采用基于Trie树的字符串匹配算法完成实验语料的批量标注任务,利用中文XLNet(Generalized Autoregressive Pretraining for Language Understanding,XLNet)预训练模型嵌入主流BiLSTM-CRF模型中,构建基于XLNet-BiLSTM-CRF的中共党史文献命名实体识别模型。[结果/结论]该模型在命名实体识别中表现优异,其调和平均数F值为0.9535,高于BiLSTM-CRF、BERT-BiLSTM-CRF、BERT-wwmext-BiLSTM-CRF、XLNet-CRF等深度学习模型。研究表明本文提出的方法对于中共党史非结构化文本挖掘工作具有可行性和有效性。