期刊文献+
共找到343篇文章
< 1 2 18 >
每页显示 20 50 100
基于语义层级细粒度的海量文献标引研究 被引量:1
1
作者 罗宏宇 刘伟 《情报理论与实践》 CSSCI 北大核心 2024年第5期194-203,193,共11页
[目的/意义]信息资源爆炸式增长使科技文献知识的组织趋于自动化,文献自动标引是组织构建科技文献数字资源的基础和关键。针对目前科技文献自动标引语义粒度不够精准以及难以适应大规模海量文献标引的问题,提出了基于语义层级细粒度的... [目的/意义]信息资源爆炸式增长使科技文献知识的组织趋于自动化,文献自动标引是组织构建科技文献数字资源的基础和关键。针对目前科技文献自动标引语义粒度不够精准以及难以适应大规模海量文献标引的问题,提出了基于语义层级细粒度的自动标引方法。[方法/过程]在传统知识组织自动标引方法的基础上,对知识组织工具中的语义资源进行深入挖掘,借助知识组织中概念间的语义层级结构对概念信息进行语义扩展,并设计基于语义层级细粒度的概念遴选方法以解决传统方法标引效率过低的问题,从而实现对大规模文献的概念高效标引。[结果/结论]实验结果表明,文章所提出的方法较好地实现了概念表示效果,有效降低了不相关概念在标引结果中出现的几率,并且在提高了标引结果文献相关性的同时大大减少了标引所需的时间,实现了知识组织工具在自动标引领域更深层次的利用,为科技文献数字资源的挖掘计算提供有价值的参考和支持。 展开更多
关键词 自动标引 语义层级 语义扩展 语义关系 词向量
下载PDF
“双碳”战略下煤炭工业节能减排技术评估
2
作者 孙呈祥 李姗姗 《现代工业经济和信息化》 2024年第9期1-6,共6页
煤炭工业作为“双碳”目标落实过程中的重点领域,其节能减排技术的创新发展受到了高度重视,而目前少有研究对这些技术进行系统整理。在此背景下,为了评估煤炭工业节能减排技术,本研究使用Python来获取国家煤炭工业网中所有节能减排技术... 煤炭工业作为“双碳”目标落实过程中的重点领域,其节能减排技术的创新发展受到了高度重视,而目前少有研究对这些技术进行系统整理。在此背景下,为了评估煤炭工业节能减排技术,本研究使用Python来获取国家煤炭工业网中所有节能减排技术并对其进行了词频分析、共词分析、指标体系构建、以及技术评价,从多方面梳理了煤炭工业节能减排相关技术的现状,以期为煤炭工业绿色循环低碳发展提供参考。研究表明:当前关注度最高的技术包括“煤气化技术”“洁净煤技术”“脱硝技术”“超低排放技术”“脱硫技术”“低氮燃烧技术”“煤炭洗选技术”“煤矸石综合利用技术”“碳捕集与封存”;通过对技术的梳理,可将不同技术划分入生产端、消费端、去碳端三个总指标中。设施设备节能减排技术就绪水平最高,而负碳固碳技术就绪水平最低。 展开更多
关键词 节能减排技术 PYTHON 词频统计 共词分析 指标体系 技术评价
下载PDF
g指数在共词分析主题词选取中的应用研究 被引量:117
3
作者 杨爱青 马秀峰 +1 位作者 张风燕 薛卫双 《情报杂志》 CSSCI 北大核心 2012年第2期52-55,74,共5页
为了克服共词分析中主题词选取主观性强的缺陷,借鉴g指数的思想,提出一种基于g指数的主题词选取方法——词频g指数。以图书情报学为例,对词频g指数进行了实证分析,并与齐普夫第二定律的选词结果进行比较,得出其选词结果很好的满足二八... 为了克服共词分析中主题词选取主观性强的缺陷,借鉴g指数的思想,提出一种基于g指数的主题词选取方法——词频g指数。以图书情报学为例,对词频g指数进行了实证分析,并与齐普夫第二定律的选词结果进行比较,得出其选词结果很好的满足二八定律。同时对主题词进行聚类分析得到良好的结果,为共词分析的准确性提供了理论依据。 展开更多
关键词 共词分析 G指数 齐普夫定律 词频g指数
下载PDF
东北三省旅游资源时空分布特征研究
4
作者 杜平 《测绘与空间地理信息》 2024年第2期123-125,128,共4页
随着人们生活水平的提高,旅游总收入占东北各省市GDP总量的比例逐年升高。为了更好地了解东北旅游资源,发展东北旅游业,本文利用从旅游网站爬取的景点和评论数据,综合运用核密度分析、莫兰指数、热点分析、词云分析和文本情感分析等多... 随着人们生活水平的提高,旅游总收入占东北各省市GDP总量的比例逐年升高。为了更好地了解东北旅游资源,发展东北旅游业,本文利用从旅游网站爬取的景点和评论数据,综合运用核密度分析、莫兰指数、热点分析、词云分析和文本情感分析等多种方法对东北三省的旅游资源分布进行了分析,以便为东北三省之间旅游产业的发展提供科学依据。 展开更多
关键词 莫兰指数 核密度分析 热点分析 词云分析 文本情感分析
下载PDF
基于“bag of words”的视频匹配方法 被引量:10
5
作者 李远宁 刘汀 +1 位作者 蒋树强 黄庆明 《通信学报》 EI CSCD 北大核心 2007年第12期147-151,共5页
提出了一种利用"bag of words"模型对视频内容进行建模和匹配的方法。通过量化视频帧的局部特征构建视觉关键词(visual words)辞典,将视频的子镜头表示成若干视觉关键词的集合。在此基础上构建基于子镜头的视觉关键词词组的... 提出了一种利用"bag of words"模型对视频内容进行建模和匹配的方法。通过量化视频帧的局部特征构建视觉关键词(visual words)辞典,将视频的子镜头表示成若干视觉关键词的集合。在此基础上构建基于子镜头的视觉关键词词组的倒排索引,用于视频片段的匹配和检索。这种方法保留了局部特征的显著性及其相对位置关系,而且有效地压缩了视频的表达,加速的视频的匹配和检索过程。实验结果表明,和已有方法相比,基于"bag of words"的视频匹配方法在大视频样本库上获得了更高的检索精度和检索速度。 展开更多
关键词 视频匹配 视觉关键词 BAG of words倒排索引
下载PDF
论中文标题的单字标引与位置检索 被引量:8
6
作者 苏新宁 刘晓清 邵品洪 《南京大学学报(自然科学版)》 CAS CSCD 1990年第2期329-335,共7页
本文首先考察了中文文献自动标引方法的现状和存在问题;然后给出了中文单字标引和位置检索算法的处理思想和实现过程;最后指出这种方法属于无词典检索技术,为实现中西文信息的全文检索和混合检索提供了现实途径。
关键词 自动标引 标引 单字 汉浯 检索
下载PDF
基于字角色标注的中文书目关键词标引研究 被引量:10
7
作者 邓三鸿 王昊 +1 位作者 秦嘉杭 苏新宁 《中国图书馆学报》 CSSCI 北大核心 2012年第2期38-49,共12页
中文书目机器自动标引是数字图书馆建设中亟待解决的关键问题之一。本文试图将条件随机场(CRFs)序列标注机器学习算法引入到关键词抽取中,建立面向图书内容、基于字角色标注的中文书目关键词标引模型。将图书内容转化为字序列,进而提出... 中文书目机器自动标引是数字图书馆建设中亟待解决的关键问题之一。本文试图将条件随机场(CRFs)序列标注机器学习算法引入到关键词抽取中,建立面向图书内容、基于字角色标注的中文书目关键词标引模型。将图书内容转化为字序列,进而提出构建关键词角色空间模型和综合利用字序列上下文特征的设计思路。通过实验,从题名和内容提要中分别自动抽取关键词,论证该模型的合理性和实用性。 展开更多
关键词 中文书目 关键词标引 字角色 序列标注 自动标引
下载PDF
我国体育核心期刊关键词标引分析 被引量:4
8
作者 赵智岗 王长青 袁庚申 《首都体育学院学报》 北大核心 2010年第2期36-39,共4页
运用文献资料法,以2008年13种体育核心期刊为样本,对所抽查各期的每篇论文的关键词标引进行统计分析。发现在关键词标引数量上基本符合国家标准要求,略显低平,存在着关键词标引主题不清、重复、泛意词多、漏标、概念专指性差等问题。应... 运用文献资料法,以2008年13种体育核心期刊为样本,对所抽查各期的每篇论文的关键词标引进行统计分析。发现在关键词标引数量上基本符合国家标准要求,略显低平,存在着关键词标引主题不清、重复、泛意词多、漏标、概念专指性差等问题。应引起作者与编者的重视,加强关键词标引环节管理检查,提高期刊质量。 展开更多
关键词 关键词 标引 主题词 体育核心期刊 质量
下载PDF
中文期刊文献关键词标引的分析和改进 被引量:14
9
作者 董丽 侯汉清 《情报科学》 CSSCI 北大核心 2004年第11期1355-1358,共4页
期刊文献关键词标引 ,对于揭示文献主题和文献信息检索有着重要作用。本文以《中国期刊网》上的《中国期刊全文数据库》中的文献为例 ,与《全国报刊索引数据库》进行标引质量的比较 ,从标引词来源、标引深度、先组度、标引一致性、通用... 期刊文献关键词标引 ,对于揭示文献主题和文献信息检索有着重要作用。本文以《中国期刊网》上的《中国期刊全文数据库》中的文献为例 ,与《全国报刊索引数据库》进行标引质量的比较 ,从标引词来源、标引深度、先组度、标引一致性、通用词使用情况等方面做了抽样统计分析 。 展开更多
关键词 关键词 关键词标引 主题标引 标引质量 中国期刊网
下载PDF
基于词频g指数的共词聚类关键词选取研究——以教育技术学硕士学位论文为例 被引量:32
10
作者 张松 刘成新 苌雨 《现代教育技术》 CSSCI 2013年第10期53-57,共5页
利用CNKI中国优秀硕士学位论文全文数据库,以教育技术学专业为例,利用其中3465篇教育技术学硕士学位论文的6593个关键词为研究对象,对词频g指数和齐普夫第二定律选取的高频词进行共词聚类比较,基于词频g指数选取的关键词得到了良好的聚... 利用CNKI中国优秀硕士学位论文全文数据库,以教育技术学专业为例,利用其中3465篇教育技术学硕士学位论文的6593个关键词为研究对象,对词频g指数和齐普夫第二定律选取的高频词进行共词聚类比较,基于词频g指数选取的关键词得到了良好的聚类结果,为以后共词聚类的关键词选取研究提供了理论依据。 展开更多
关键词 共词聚类 词频g指数 齐普夫定律 教育技术学
下载PDF
关键词与创新点词句群分布分析 被引量:8
11
作者 温有奎 温浩 《情报学报》 CSSCI 北大核心 2007年第1期50-55,共6页
本文对400篇《电子学报》论文中作者标出的关键词及作者提出的创新点词在正文中的句群分布做了统计分析。结果显示关键词0句群分布的概率为31.5%,关键词大于等于0.3的句群分布概率为40.5%,关键词与创新点词用词一致的概率为19.... 本文对400篇《电子学报》论文中作者标出的关键词及作者提出的创新点词在正文中的句群分布做了统计分析。结果显示关键词0句群分布的概率为31.5%,关键词大于等于0.3的句群分布概率为40.5%,关键词与创新点词用词一致的概率为19.2%;创新点词具有引导特征词和适中的句群分布,由此提出增设创新点词标引的建议。试验表明,该方法不仅专指度高,且有利于创新点的知识单元发现。 展开更多
关键词 关键词 统计分析 创新点词标引 句群分布
下载PDF
具有三级索引词库结构的中文分词方法研究 被引量:16
12
作者 肖红 许少华 李欣 《计算机应用研究》 CSCD 北大核心 2006年第8期49-51,共3页
提出了一种分组并具有三级索引结构的词库组织体系,给出了合适的索引密度间隔;针对系统基本词库的扩充问题,考虑了一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。大量仿真实验结果表明,采用该方法可较大提高中文文... 提出了一种分组并具有三级索引结构的词库组织体系,给出了合适的索引密度间隔;针对系统基本词库的扩充问题,考虑了一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。大量仿真实验结果表明,采用该方法可较大提高中文文本的切词速度及信息的查全查准率。 展开更多
关键词 中文切词 正向最大匹配 词库 索引密度 全文检索
下载PDF
共词网络分析中E指数的改进研究 被引量:7
13
作者 胡阿沛 张静 张晓宇 《情报理论与实践》 CSSCI 北大核心 2014年第1期46-50,共5页
选择高频词进行共词网络分析会遗失信息,选择所有词又会使得共词网络结构混乱,无法分析。为解决该问题,在E指数的基础之上,提出一种改进的共词强度计算方法,根据词对共现频次,赋予共现频次高的词对的E指数较高权值,共现频次低的词对的E... 选择高频词进行共词网络分析会遗失信息,选择所有词又会使得共词网络结构混乱,无法分析。为解决该问题,在E指数的基础之上,提出一种改进的共词强度计算方法,根据词对共现频次,赋予共现频次高的词对的E指数较高权值,共现频次低的词对的E指数较低权值。采用该方法无需选择高频词,可直接对所有词进行共词网络分析。为验证该方法的有效性,以电动汽车动力电池专利文献为数据源进行实证对比研究。 展开更多
关键词 共词分析 E指数 共词网络
下载PDF
一种高效的全文检索索引技术 被引量:7
14
作者 陈玮 陈玉鹏 +1 位作者 石晶 陆达 《计算机应用研究》 CSCD 北大核心 2004年第7期35-37,40,共4页
针对目前比较流行的基于词的倒排文档索引模型 ,结合全文检索数据的特点 ,提出了变长编码的索引压缩算法。利用该压缩编码 ,研究了基于内存缓存的快速创建索引的流程。通过实验 ,对索引膨胀率、创建时间和检索响应速度进行了对比分析 。
关键词 全文检索 词索引 内存缓存 索引压缩
下载PDF
网络环境下科技论文关键词的地位与标引原则 被引量:4
15
作者 孙岩 吕芳萍 邓晓群 《中华医学图书情报杂志》 CAS 2011年第2期38-40,共3页
分析了网络环境下关键词的地位,并提出了其标引原则,指出了关键词应能清晰地提示论文主题内容、反映科技论文的创新性、表征论文的主题内容、为用户提供完整的信息。
关键词 网络环境 科技论文 关键词 标引
下载PDF
中文全文检索系统截词检索的实现研究 被引量:4
16
作者 靖培栋 宋雯斐 《情报科学》 CSSCI 北大核心 2006年第6期884-887,共4页
本文探讨了在基于关键词索引的中文全文检索系统中实现各种截词检索的方法,建立了关键词索引的Hash索引,这种方法即能节省内存又提高检索效率。
关键词 截词检索 全文检索 关键词索引
下载PDF
一种基于Lucene的影片搜索引擎的研究和应用 被引量:3
17
作者 匡振国 倪宏 +1 位作者 嵇智辉 刘磊 《计算机工程与应用》 CSCD 北大核心 2008年第29期8-10,30,共4页
Lucene是一个优秀的开源搜索引擎框架,已经广泛应用于信息搜索领域。分析点播门户中现有的搜索引擎存在的不足,设计一种基于双字哈希算法支持中文的分词器,并利用该分词器和Lucene工具包,设计并实现了一个视频点播影片快速搜索引擎,它... Lucene是一个优秀的开源搜索引擎框架,已经广泛应用于信息搜索领域。分析点播门户中现有的搜索引擎存在的不足,设计一种基于双字哈希算法支持中文的分词器,并利用该分词器和Lucene工具包,设计并实现了一个视频点播影片快速搜索引擎,它不仅支持中文检索,还具有搜索速度快、易于扩展等优点。仿真实验证明提出的基于Lucene的影片搜索引擎具有良好的性能。 展开更多
关键词 LUCENE 搜索引擎 双字哈希 中文分词 倒排索引
下载PDF
医学新闻关键词自动提取策略 被引量:2
18
作者 何晓阳 张精理 丁婷 《中华医学图书情报杂志》 CAS 2014年第4期13-17,共5页
提出了将医学叙词表MeSH词汇加入到通用分词表中进行分词,并利用MeSH词汇结合词长、词语所在位置加权实现医学新闻网页的关键词自动提取策略。作者随机选取了10家网站100篇医学新闻进行人工关键词标引,并采用机器标引与人工标引比照的... 提出了将医学叙词表MeSH词汇加入到通用分词表中进行分词,并利用MeSH词汇结合词长、词语所在位置加权实现医学新闻网页的关键词自动提取策略。作者随机选取了10家网站100篇医学新闻进行人工关键词标引,并采用机器标引与人工标引比照的方式进行验证的结果表明,关键词抽取精度达0.34,召回率达0.30,实验证明该策略可行。 展开更多
关键词 自动提取 医学新闻 叙词表 MESH 生物医学 医学术语 关键词标引 主题标引 自动标引
下载PDF
一种快速中文分词词典机制 被引量:16
19
作者 吴晶晶 荆继武 +1 位作者 聂晓峰 王平建 《中国科学院研究生院学报》 CAS CSCD 北大核心 2009年第5期703-711,共9页
通过研究目前中文分词领域各类分词机制,注意到中文快速分词机制的关键在于对单双字词的识别,在这一思想下,提出了一种快速中文分词机制:双字词-长词哈希机制,通过提高单双字词的查询效率来实现对中文分词机制的改进.实验证明,该机制提... 通过研究目前中文分词领域各类分词机制,注意到中文快速分词机制的关键在于对单双字词的识别,在这一思想下,提出了一种快速中文分词机制:双字词-长词哈希机制,通过提高单双字词的查询效率来实现对中文分词机制的改进.实验证明,该机制提高了中文文本分词的效率. 展开更多
关键词 文本实时处理 中文分词 词典法分词 双字词-长词哈希机制
下载PDF
次高频关键词的选择及在共词分析中的应用 被引量:22
20
作者 徐坤 毕强 《情报理论与实践》 CSSCI 北大核心 2019年第5期148-152,共5页
[目的/意义]在共词分析方法中,高频词的选词策略对共词分析的准确度及可预测性具有重要影响。系统地研究高频关键词的选择方法,对提升共词分析效果与促进共词分析方法的不断完善都具有重要意义。[方法/过程]通过词频分析,引入超高频词... [目的/意义]在共词分析方法中,高频词的选词策略对共词分析的准确度及可预测性具有重要影响。系统地研究高频关键词的选择方法,对提升共词分析效果与促进共词分析方法的不断完善都具有重要意义。[方法/过程]通过词频分析,引入超高频词、次高频词概念,利用高频词界分公式与G指数提取高频词方法提取次高频词,并利用其进行共词分析。[结果/结论]利用次高频词进行聚类分析,在分类效果上优于界分公式方法和G指数方法,而且在揭示领域研究热点上具有较好效果。 展开更多
关键词 次高频词 聚类分析 共词分析 G指数 高频词界分公式
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部