期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
“双碳”战略下煤炭工业节能减排技术评估
1
作者 孙呈祥 李姗姗 《现代工业经济和信息化》 2024年第9期1-6,共6页
煤炭工业作为“双碳”目标落实过程中的重点领域,其节能减排技术的创新发展受到了高度重视,而目前少有研究对这些技术进行系统整理。在此背景下,为了评估煤炭工业节能减排技术,本研究使用Python来获取国家煤炭工业网中所有节能减排技术... 煤炭工业作为“双碳”目标落实过程中的重点领域,其节能减排技术的创新发展受到了高度重视,而目前少有研究对这些技术进行系统整理。在此背景下,为了评估煤炭工业节能减排技术,本研究使用Python来获取国家煤炭工业网中所有节能减排技术并对其进行了词频分析、共词分析、指标体系构建、以及技术评价,从多方面梳理了煤炭工业节能减排相关技术的现状,以期为煤炭工业绿色循环低碳发展提供参考。研究表明:当前关注度最高的技术包括“煤气化技术”“洁净煤技术”“脱硝技术”“超低排放技术”“脱硫技术”“低氮燃烧技术”“煤炭洗选技术”“煤矸石综合利用技术”“碳捕集与封存”;通过对技术的梳理,可将不同技术划分入生产端、消费端、去碳端三个总指标中。设施设备节能减排技术就绪水平最高,而负碳固碳技术就绪水平最低。 展开更多
关键词 节能减排技术 PYTHON 词频统计 共词分析 指标体系 技术评价
下载PDF
无词典抽词的RMMFS和BMMFS方法及其比较研究 被引量:5
2
作者 姜韶华 党延忠 宣照国 《情报学报》 CSSCI 北大核心 2006年第4期499-503,共5页
针对作为中文信息处理基础的抽词问题,本文在作者提出的正向串频最大匹配法(MMFS)的基础上,提出了逆向串频最大匹配法(RMMFS)及双向串频最大匹配法(BMMFS).这两种方法分别采用逆向和双向长串优先与串频统计的思路,并引进规则和支... 针对作为中文信息处理基础的抽词问题,本文在作者提出的正向串频最大匹配法(MMFS)的基础上,提出了逆向串频最大匹配法(RMMFS)及双向串频最大匹配法(BMMFS).这两种方法分别采用逆向和双向长串优先与串频统计的思路,并引进规则和支持度指标筛选,不需要词典,不需要事先进行语料库学习,不需要建立字索引,通过串匹配获取中文文本中的汉字共现模式,实时地抽取出包含专业术语及专有名词等未登录词在内的专指语义串、短语和词.实验研究了抽词准确率受规则的影响及随文本大小和词频变化的分布,结果表明BMMFS可以取得更好的抽词效果. 展开更多
关键词 逆向串频最大匹配 双向串频最大匹配 自动抽词 汉字共现模式
下载PDF
统计分析法自动标引的改进 被引量:18
3
作者 赵云志 《情报学报》 CSSCI 北大核心 2000年第4期333-337,共5页
情报检索的目的是为用户服务 ,因而标引词的提取应以其与文献主题内容相关程度为标准。文章基于原有的统计分析标引法 ,对其权值设计予以重新考虑 ,并与文献词频统计相结合 ,使分词与标引相统一 ,标引词更好地反映文献主题概念 ,提高检... 情报检索的目的是为用户服务 ,因而标引词的提取应以其与文献主题内容相关程度为标准。文章基于原有的统计分析标引法 ,对其权值设计予以重新考虑 ,并与文献词频统计相结合 ,使分词与标引相统一 ,标引词更好地反映文献主题概念 ,提高检索效率。 展开更多
关键词 自动标引 词频统计 权值 统计分析
下载PDF
一种使用自动聚类思想的自动文摘方法 被引量:7
4
作者 杨建林 《情报学报》 CSSCI 北大核心 2001年第5期532-536,共5页
本文提出了一种使用自动聚类思想的自动文摘方法 ,这种方法是进行自动文摘研究的一种新的有益的尝试。该方法首先利用词频统计方法得到文献的关键词向量、每个段落的关键词向量 ,然后利用自动聚类的方法将文献分为若干个段落类 ,从中选... 本文提出了一种使用自动聚类思想的自动文摘方法 ,这种方法是进行自动文摘研究的一种新的有益的尝试。该方法首先利用词频统计方法得到文献的关键词向量、每个段落的关键词向量 ,然后利用自动聚类的方法将文献分为若干个段落类 ,从中选出与文献主题相关的段落类作为候选的用来挑出文摘句的段落类 。 展开更多
关键词 自动文摘 信息处理 自动处理技术 词频统计 关键词向量 段落类
下载PDF
基于词频统计法的医学新闻自动受控标引 被引量:1
5
作者 张精理 何晓阳 丁婷 《中华医学图书情报杂志》 CAS 2014年第8期7-10,共4页
分析了医学新闻信息利用的必要性及自动标引的发展现状,提出一种医学新闻文本自动受控标引方法,即以分词词表为基础词表,引入汉化MeSH词表建立标引词表,对中文医学新闻文本进行分词、词频统计和排序,过滤掉不在主题词表中的高频词后,选... 分析了医学新闻信息利用的必要性及自动标引的发展现状,提出一种医学新闻文本自动受控标引方法,即以分词词表为基础词表,引入汉化MeSH词表建立标引词表,对中文医学新闻文本进行分词、词频统计和排序,过滤掉不在主题词表中的高频词后,选取词频最高的5个MeSH主题词用作标引词。 展开更多
关键词 词频统计 自动标引 主题标引 受控标引 医学主题词表
下载PDF
Internet网络新闻文本自动摘要的研究 被引量:9
6
作者 官礼和 《计算机工程与设计》 CSCD 北大核心 2007年第14期3518-3520,F0003,共4页
给出了Internet网络新闻中文文本自动摘要的基本思路和基本步骤,讨论了断句、分词算法。针对自动摘要中新闻文本的4种形式特征,提出了一套新的自动摘要方案:首先综合新闻文本的4种形式特征对词汇和句子赋予不同的权值,然后根据权值大小... 给出了Internet网络新闻中文文本自动摘要的基本思路和基本步骤,讨论了断句、分词算法。针对自动摘要中新闻文本的4种形式特征,提出了一套新的自动摘要方案:首先综合新闻文本的4种形式特征对词汇和句子赋予不同的权值,然后根据权值大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅且具备一定质量的摘要。最后实验分析表明效果较好。 展开更多
关键词 自然语言处理 自动摘要 分词 断句 权重 平滑处理
下载PDF
统计分析法自动标引的改进研究 被引量:2
7
作者 许剑颖 《现代图书情报技术》 CSSCI 北大核心 2004年第2期92-95,共4页
统计分析法自动标引是自动标引的一种重要方法。本文从标引词应反映文献主题内容这一原则出发,对统计分析法自动标引从标引源的确定、权值的设计、词频的调整及检索后控词表的设计与维护等方面提出了一些改进设想。通过这些方法使标引... 统计分析法自动标引是自动标引的一种重要方法。本文从标引词应反映文献主题内容这一原则出发,对统计分析法自动标引从标引源的确定、权值的设计、词频的调整及检索后控词表的设计与维护等方面提出了一些改进设想。通过这些方法使标引词更好地反映文献主题的同时提高检索效率。 展开更多
关键词 自动标引 统计分析法 标引词 标引源 词频调整 词表 文献检索
下载PDF
基于XML的PubMed生物医学工程文献的聚类分析方法的探讨 被引量:1
8
作者 刘春艳 胡铁军 《中华医学图书情报杂志》 CAS 2006年第6期58-60,共3页
采用依据主题词表的聚类数据挖掘技术对基于可扩展标识语言(Extensible Markup Language,XML)的PubMed生物医学工程方面的文献进行分析,实现PubMed生物医学工程文献的概念导航,建立生物医学工程专题文献数据库,并利用加权的词频统计方... 采用依据主题词表的聚类数据挖掘技术对基于可扩展标识语言(Extensible Markup Language,XML)的PubMed生物医学工程方面的文献进行分析,实现PubMed生物医学工程文献的概念导航,建立生物医学工程专题文献数据库,并利用加权的词频统计方法分析其文献主题分布。 展开更多
关键词 生物医学工程 可扩展标识语言 自动文本聚类 专题文献数据库 词频统计
下载PDF
中文自动文献系统研究 被引量:1
9
作者 杨建林 《情报学报》 CSSCI 北大核心 2001年第4期460-463,共4页
本文提出了几个可以改善中文自动文摘系统的文摘效果的措施 :1 将字频统计方法和词频统计方法有机结合起来 ;2 进一步研究人工文摘中理解性文摘句的形成机理 ,完善仿人算法 ;3 将自动聚类的方法引入自动文摘研究。
关键词 中文自动文献系统 自动文摘 词频统计 自动聚类 算法 字频统计
下载PDF
《仓央嘉措情歌》用词特征分析 被引量:1
10
作者 董颖红 《云南师范大学学报(哲学社会科学版)》 CSSCI 2006年第5期112-115,共4页
本文利用计算机作为分析工具,对流传在藏族地区的第六世达赖喇嘛创作的《仓央嘉措情歌》进行了词频统计和文本搭配索引,并根据计算机的处理结果对《仓央嘉措情歌》的用词特点作出了简要分析。
关键词 词频统计 文本索引 仓央嘉措情歌
下载PDF
藏文搜索引擎系统中网页自动摘要的研究 被引量:3
11
作者 安见才让 《微处理机》 2010年第5期77-80,共4页
给出了藏文搜索引擎中网页自动摘要的基本思路、基本步骤和Web文摘的定义,讨论了分词算法,提出了基于句子抽取的Web文摘生成算法。算法中将每个Web句子的权重分解为Web特征词权重和Web句子结构权重,Web句子结构权重充分考虑排版格式和... 给出了藏文搜索引擎中网页自动摘要的基本思路、基本步骤和Web文摘的定义,讨论了分词算法,提出了基于句子抽取的Web文摘生成算法。算法中将每个Web句子的权重分解为Web特征词权重和Web句子结构权重,Web句子结构权重充分考虑排版格式和超连接属性。根据权值大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅且具备一定质量的摘要。最后实验分析表明效果较好。 展开更多
关键词 自然语言处理 自动摘要 分词 权重 平滑处理
下载PDF
基于二元模糊匹配的编程题智能评分方法 被引量:1
12
作者 冷强奎 刘雨晴 秦玉平 《计算机技术与发展》 2020年第2期71-74,共4页
针对传统编程题自动评分方法不能准确衡量学生程序与参考答案之间的接近程度等问题,提出了一种基于二元模糊匹配的编程题智能评分方法。第一元为结构匹配,检测学生程序在变量声明、数据输入、函数调用、控制结构等方面与参考答案的相似... 针对传统编程题自动评分方法不能准确衡量学生程序与参考答案之间的接近程度等问题,提出了一种基于二元模糊匹配的编程题智能评分方法。第一元为结构匹配,检测学生程序在变量声明、数据输入、函数调用、控制结构等方面与参考答案的相似程度,目的是快速判断学生程序中是否存在关键的采分点。第二元为词语匹配,首先进行词频统计,以确定每个词的权重。然后,分别构造学生程序与参考答案的向量空间模型,并计算两者的余弦相似度,来作为评判词语相似的依据。最终的分数由结构相似度和词语相似度的加权分数计算得出。由于该二元匹配方法不关心程序中结构/词语的先后顺序和是否为精确表达,因此被称为是模糊的。仿真实验表明,该方法具有不错的评分准确性,尽管与人工评分相比还存在一定的差距,但当试题规模较大时,可以作为人工评分的替代手段。 展开更多
关键词 二元模糊匹配 自动评分 词频统计 余弦相似度 向量空间模型
下载PDF
基于Web的新闻文本自动摘要研究 被引量:1
13
作者 张筱丹 胡学钢 《阜阳师范学院学报(自然科学版)》 2009年第1期41-43,共3页
研究了一种基于统计的Web新闻文本自动摘要生成方法.首先,根据Web新闻文本的特点,对词汇和句子赋予不同的权重,然后根据权重大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅的摘要.
关键词 web新闻文本 自动摘要 分词 权重
下载PDF
简单中文自动摘要系统研究 被引量:1
14
作者 张雷生 万绍俊 许鹏文 《装备指挥技术学院学报》 2004年第3期105-109,共5页
摘要是对文档内容的概括,在信息检索中起着重要的作用.分析了机械式自动摘要的局限性,提出一种模仿人工进行自动摘要的方法;探讨了简单的中文自动摘要系统的结构模型,在此基础上对模型中的分词模块和文摘句的提取模块进行了分析.最后,... 摘要是对文档内容的概括,在信息检索中起着重要的作用.分析了机械式自动摘要的局限性,提出一种模仿人工进行自动摘要的方法;探讨了简单的中文自动摘要系统的结构模型,在此基础上对模型中的分词模块和文摘句的提取模块进行了分析.最后,结合实例对系统进行了进一步地讨论.结果表明:该系统能够达到较好的质量和效率. 展开更多
关键词 信息检索 中文自动摘要 分词模块 文摘句
下载PDF
时间加权z指数探测热点关键词研究 被引量:1
15
作者 邱小敏 奉国和 刘宇东 《情报工程》 2021年第1期16-29,共14页
[目的/意义]构建关键词热度h值模型,探究近年图书情报领域热点与发展趋势。[方法/过程]基于学者Prathp的z指数模型,对关键词词频和文章被引值进行赋权,引入前人时间加权思想,多维角度归一化处理,计算热度值与年度排名,获得趋势。[结果/... [目的/意义]构建关键词热度h值模型,探究近年图书情报领域热点与发展趋势。[方法/过程]基于学者Prathp的z指数模型,对关键词词频和文章被引值进行赋权,引入前人时间加权思想,多维角度归一化处理,计算热度值与年度排名,获得趋势。[结果/结论]比较加权前后绝对词频、z指数和关键词热度h值,排名结果差异明显;热度h值模型可提升热点关键词排名,拉低非热点关键词排名,排名情况验证h值的有效性,效果优良。 展开更多
关键词 Z指数 绝对词频 时间加权被引值 研究热点 发展趋势
下载PDF
自动标引中船舶资料位置权重方案的确定 被引量:2
16
作者 刘艳文 周朝晖 《科技情报开发与经济》 2012年第17期101-104,共4页
对随机抽取的852篇船舶资料进行统计分析,旨在解决自动标引中船舶资料位置权重方案的确定问题。分析了人工打分确定位置权重的方案,结合工程技术资料的特点,提出基于统计分析方法的标引词词频统计的位置权重方案,并对两种方案进行比较分... 对随机抽取的852篇船舶资料进行统计分析,旨在解决自动标引中船舶资料位置权重方案的确定问题。分析了人工打分确定位置权重的方案,结合工程技术资料的特点,提出基于统计分析方法的标引词词频统计的位置权重方案,并对两种方案进行比较分析,确定最终的位置权重方案。 展开更多
关键词 船舶资料 自动标引 词频 位置权重方案
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部