期刊文献+
共找到175篇文章
< 1 2 9 >
每页显示 20 50 100
Research on the Transmutation of Chinese Loanwords-Based on Modern Chinese Dictionary(7th Edition)
1
作者 FU Yi SHEN Jiayu 《Sino-US English Teaching》 2022年第8期277-282,共6页
Vocabulary plays an irreplaceable role in a language.As an important carrier to record foreign cultures in vocabulary,loanwords are widely used in all aspects of society.Modern Chinese Dictionary includes loanwords fr... Vocabulary plays an irreplaceable role in a language.As an important carrier to record foreign cultures in vocabulary,loanwords are widely used in all aspects of society.Modern Chinese Dictionary includes loanwords from a variety of languages from the perspective of universal use.This paper takes the loanwords in Modern Chinese Dictionary(7th Edition)as the closed corpus,and analyzes the etymology,structure,word length,and other aspects while making blanket statistics on the loanwords.The representative words are investigated by word frequency and described from multiple perspectives. 展开更多
关键词 LOANwordS Modern Chinese Dictionary word frequency statistics
下载PDF
国内外信息检索研究热点分析——基于Z-Score标准化的词频 被引量:14
2
作者 苍宏宇 谭宗颖 《图书馆建设》 CSSCI 北大核心 2009年第1期93-98,共6页
通过利用基于Z-Score标准化的词频统计分析法,从研究主题、关键技术和学科特点对国内外信息检索领域研究的热点进行分析,可以看出国内外基于网络环境的研究成为重要主题;研究的关键技术大体相同,但侧重点不同;国外的研究集中在计算机领... 通过利用基于Z-Score标准化的词频统计分析法,从研究主题、关键技术和学科特点对国内外信息检索领域研究的热点进行分析,可以看出国内外基于网络环境的研究成为重要主题;研究的关键技术大体相同,但侧重点不同;国外的研究集中在计算机领域,国内集中在图书情报领域。而未来信息检索中,网络信息检索将得到进一步的发展,知识、多媒体等将成为信息检索的关键主题,新信息检索技术将会成为日后关注的重点。 展开更多
关键词 词频统计法 Z-SCORE 信息检索 对比分析
下载PDF
2006-2011年我国图书馆个性化服务研究统计分析 被引量:5
3
作者 陈永忠 李新权 《现代情报》 CSSCI 2012年第2期111-115,共5页
通过对18种图书情报学核心期刊2006-2011年所刊发的有关图书馆个性化服务的研究论文的计量统计,调查了论文期刊分布、年代分布和核心作者地区分布现状,对论文关键词运用词频统计方法,分析了相关研究热点的成因并预测了其发展趋势。
关键词 图书馆 高校 个性化服务 词频 统计分析
下载PDF
国内图书馆采访研究论文的计量分析:2000-2010 被引量:2
4
作者 朱一红 周卫华 汤建民 《图书馆论坛》 CSSCI 北大核心 2012年第1期99-103,107,共6页
运用词频统计、共现分析及信息可视化等文献计量学方法,对2000-2010年间CNKI有关图书馆采访研究论文的年度发文量、期刊分布、作者发文量、基金资助分布和关键词词频变化等进行统计分析,探索图书馆采访研究的演变过程及发展态势,为图书... 运用词频统计、共现分析及信息可视化等文献计量学方法,对2000-2010年间CNKI有关图书馆采访研究论文的年度发文量、期刊分布、作者发文量、基金资助分布和关键词词频变化等进行统计分析,探索图书馆采访研究的演变过程及发展态势,为图书馆采访的深入研究和拓展提供有益启示。 展开更多
关键词 图书馆采访 词频统计 共现分析 信息可视化
下载PDF
词频分析与中俄政治文献翻译——以2013-2014年中国政府工作报告俄文版与俄罗斯国情咨文对比为个案 被引量:10
5
作者 王铭玉 刘子夜 《天津外国语大学学报》 2016年第3期1-6,80,共6页
在我国译界,政治文献外译凸显重要。文章以2013-2014年中国政府工作报告俄文版和俄罗斯国情咨文为语料,借助词频统计手段对其进行了量化分析与对比研究,发现俄罗斯国情咨文用词的频率整体略高于中国政府工作报告俄文版用词。文章还探究... 在我国译界,政治文献外译凸显重要。文章以2013-2014年中国政府工作报告俄文版和俄罗斯国情咨文为语料,借助词频统计手段对其进行了量化分析与对比研究,发现俄罗斯国情咨文用词的频率整体略高于中国政府工作报告俄文版用词。文章还探究了词频对比过程中的用词差异现象,从量化角度对我国政治文献汉译俄问题提出了对策性建议。 展开更多
关键词 政治文献 翻译 词频统计 量化分析
下载PDF
2004-2006自然辩证法研究学术轨迹概观——基于3种自然辩证法研究核心期刊所发表的1600多篇论文题名的词频统计 被引量:8
6
作者 汤建民 《自然辩证法研究》 CSSCI 北大核心 2007年第8期87-93,共7页
运用词频统计法分析了2004-2006年《自然辩证法研究》、《自然辩证法通讯》、《科学技术与辩证法》3种核心期刊所发表的1600多篇论文的题名,在一定程度上显示出了这3年自然辩证法研究的现状、研究热点和发展动向。此外,这种研究方法也... 运用词频统计法分析了2004-2006年《自然辩证法研究》、《自然辩证法通讯》、《科学技术与辩证法》3种核心期刊所发表的1600多篇论文的题名,在一定程度上显示出了这3年自然辩证法研究的现状、研究热点和发展动向。此外,这种研究方法也为自然辩证法界的学科反思提供了一种定量化分析的新思路。 展开更多
关键词 自然辩证法研究 词频统计 论文题名 研究热点 发展动向
下载PDF
重庆市图书馆学研究论文的统计与计量分析——基于2004-2013年中国知网的数据 被引量:1
7
作者 景佳 《西南师范大学学报(自然科学版)》 CAS 北大核心 2017年第5期127-131,共5页
以中国学术期刊网络出版总库为来源,收集2004-2013年10年中收录的第一作者单位为重庆市,且题名或关键词为"图书馆"的论文.运用文献计量学、统计学及文本数据挖掘等方法,对论文的发文量、著者、关键词分布等进行了统计与计量分... 以中国学术期刊网络出版总库为来源,收集2004-2013年10年中收录的第一作者单位为重庆市,且题名或关键词为"图书馆"的论文.运用文献计量学、统计学及文本数据挖掘等方法,对论文的发文量、著者、关键词分布等进行了统计与计量分析.研究发现重庆市10年间图书馆学论文增长较缓慢,作者的合作度与合作率不高,机构发文量不均衡,相关研究处于与新兴信息技术结合的初步阶段. 展开更多
关键词 重庆 图书馆学 词频统计 文献计量 文本挖掘
下载PDF
WoS题录Keywords字段关键词频度统计程序设计与实现 被引量:1
8
作者 朱玉强 《情报探索》 2015年第6期86-89,共4页
使用Visual Basic编程,采用正则表达式批量提取由Web of Science导出的Bib Tex题录中所有Keywords字段关键词,按需合并所得关键词的同义词、近义词及词形变化词,然后将出现频度的统计数据写入Excel表,并编制Excel宏自动生成折线图,实现... 使用Visual Basic编程,采用正则表达式批量提取由Web of Science导出的Bib Tex题录中所有Keywords字段关键词,按需合并所得关键词的同义词、近义词及词形变化词,然后将出现频度的统计数据写入Excel表,并编制Excel宏自动生成折线图,实现关键词分布的简单可视化。情报工作者后续可借助Excel功能对该程序生成的Excel表执行复杂的数据组合分析,以提高工作效率。 展开更多
关键词 Web of Science(WoS) 关键词 词频统计 Excel BibTex Visual Basic(VB)
下载PDF
在线评论数据挖掘视角下游客情感分析模式构建——以肇庆市七星岩景区为调研对象
9
作者 郭栩东 胡绿 +1 位作者 李茂强 王怡 《科技创新与应用》 2024年第13期9-13,共5页
互联网时代的到来,推动全球的经济发展发生巨大改变。如今互联网已经是人们的生活中不可分割的一部分。旅游行业的业态也随网络时代而转变。随着各旅游平台的兴起,在线评论已经是很普遍的现象,并成为人们旅游消费的重要参考指标。该文... 互联网时代的到来,推动全球的经济发展发生巨大改变。如今互联网已经是人们的生活中不可分割的一部分。旅游行业的业态也随网络时代而转变。随着各旅游平台的兴起,在线评论已经是很普遍的现象,并成为人们旅游消费的重要参考指标。该文以肇庆市七星岩景区为调研对象,基于在线评论的视角对数据采集进行剔除过滤、高频词统计及可视化呈现等一系列工作,通过情感分析法对数据进行分析整理,构建游客情感分析模式。经过系列的实证试验分析可以诊断,对于旅游目的地因素,游客的情感更为敏感以及在意;管理和景观是景区提升自身竞争力的重要内容;消费不仅受游客关注度影响,同时也对游客情感有着显著的影响力。提出关于资源管理、经济发展模式和服务、饮食开发的相关建议。 展开更多
关键词 在线评论 游客情感 情感分析模式 数据挖掘 高频词统计
下载PDF
“双碳”战略下煤炭工业节能减排技术评估
10
作者 孙呈祥 李姗姗 《现代工业经济和信息化》 2024年第9期1-6,共6页
煤炭工业作为“双碳”目标落实过程中的重点领域,其节能减排技术的创新发展受到了高度重视,而目前少有研究对这些技术进行系统整理。在此背景下,为了评估煤炭工业节能减排技术,本研究使用Python来获取国家煤炭工业网中所有节能减排技术... 煤炭工业作为“双碳”目标落实过程中的重点领域,其节能减排技术的创新发展受到了高度重视,而目前少有研究对这些技术进行系统整理。在此背景下,为了评估煤炭工业节能减排技术,本研究使用Python来获取国家煤炭工业网中所有节能减排技术并对其进行了词频分析、共词分析、指标体系构建、以及技术评价,从多方面梳理了煤炭工业节能减排相关技术的现状,以期为煤炭工业绿色循环低碳发展提供参考。研究表明:当前关注度最高的技术包括“煤气化技术”“洁净煤技术”“脱硝技术”“超低排放技术”“脱硫技术”“低氮燃烧技术”“煤炭洗选技术”“煤矸石综合利用技术”“碳捕集与封存”;通过对技术的梳理,可将不同技术划分入生产端、消费端、去碳端三个总指标中。设施设备节能减排技术就绪水平最高,而负碳固碳技术就绪水平最低。 展开更多
关键词 节能减排技术 PYTHON 词频统计 共词分析 指标体系 技术评价
下载PDF
我国个人信息法律保护现状、主要问题及完善路径--基于《中华人民共和国个人信息保护法》的词频统计与分析 被引量:15
11
作者 文禹衡 于琳 《图书馆理论与实践》 CSSCI 2022年第4期12-21,28,共11页
文章运用词频统计分析法分析《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)文本的主题分布规律,借助社会网络分析软件对核心词与法条之间的关系进行可视化分析。研究发现,《个人信息保护法》初步建立了完整的个人信息... 文章运用词频统计分析法分析《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)文本的主题分布规律,借助社会网络分析软件对核心词与法条之间的关系进行可视化分析。研究发现,《个人信息保护法》初步建立了完整的个人信息法律保护框架,个人信息热点问题的立法回应还较为模糊,与其他法律欠缺法秩序的一致性。未来,需要对《个人信息保护法》作出精细化调整,并加快出台《个人信息保护法实施条例》等配套法律法规,为执法提供指导依据。 展开更多
关键词 个人信息 《中华人民共和国个人信息保护法》 词频统计 社会网络分析
下载PDF
基于TF-IDF算法的文本信息提取 被引量:12
12
作者 于韬 王洪岩 《科技视界》 2018年第16期117-118,共2页
随着大数据时代的到来,数据量呈几何倍增长。文本信息是人们接触最多的信息,关键信息作为对文本主题的高度概括,成为用户了解文本主题的快速渠道,如何快速有效的挖掘文本关键信息成为研究的关键问题。本文以本溪市政府工作报告为研究对... 随着大数据时代的到来,数据量呈几何倍增长。文本信息是人们接触最多的信息,关键信息作为对文本主题的高度概括,成为用户了解文本主题的快速渠道,如何快速有效的挖掘文本关键信息成为研究的关键问题。本文以本溪市政府工作报告为研究对象,将文本信息进行抽象,利用TF-IDF算法实现对文本中频繁出现的短语进行批量自动提取,统计频繁短语出现的频次,进而提取关键信息。通过对政府工作报告的提取,可以看出政府建设本溪的总体趋势,并且积极响应国家号召,总体推进本溪政府工作不断向前。 展开更多
关键词 进行关键词提取的工作
下载PDF
2015-2019年国家社科基金“中华学术外译”项目出版现状及趋势 被引量:1
13
作者 邹杰 林嘉新 《技术与创新管理》 2021年第4期417-423,共7页
为了向“中华学术外译”项目决策提供数据支撑,通过定性量化分析,研究了2015-2019年立项情况,对比分析了立项数量、学科分布、资助文版、责任单位、国外出版机构及关键词词频。研究发现,自2015年起,“中华学术外译”项目申报资质收紧,... 为了向“中华学术外译”项目决策提供数据支撑,通过定性量化分析,研究了2015-2019年立项情况,对比分析了立项数量、学科分布、资助文版、责任单位、国外出版机构及关键词词频。研究发现,自2015年起,“中华学术外译”项目申报资质收紧,项目审核流程严格化;学科种类多样化,传统人文学科占比高,学科分布不平衡;资助文版多样,主要集中在发达国家所使用的语言;立项数与学科覆盖面向综合性出版单位集中;境外出版机构向欧美地区名社大社集中;词频分布均衡。结果表明,“中华学术外译”项目自实施以来取得了良好效果和强烈反响,但也存在一些问题亟需完善,总体势头依然稳中向好。 展开更多
关键词 出版发行 中华学术外译项目 量化分析 词频统计 出版现状
下载PDF
基于结巴分词的领域自适应分词方法研究 被引量:6
14
作者 邢玲 程兵 《计算机仿真》 北大核心 2023年第4期310-316,503,共8页
利用Jieba分词(结巴分词)对中文文本进行分词时,对于领域词组分词效果不是很理想,需要通过加载自定义词典解决这个问题。提出一种领域自适应分词方法,将结巴分词后相邻词语组合为词组,利用标准化点互信息(NPMI)及词频统计两种方法分别... 利用Jieba分词(结巴分词)对中文文本进行分词时,对于领域词组分词效果不是很理想,需要通过加载自定义词典解决这个问题。提出一种领域自适应分词方法,将结巴分词后相邻词语组合为词组,利用标准化点互信息(NPMI)及词频统计两种方法分别计算词组凝聚度,利用左右信息熵计算词组自由度,通过设定凝聚度与自由度阈值识别领域词组,利用文中提出的词性约束规则进一步筛选词组,将得到的词组作为自定义词典加入到结巴分词中,再次对文本进行分词。通过在自己构建的金融和法律领域语料库进行实验,证明了所提算法可以有效发现领域词组,利用该算法进行领域分词时,准确率和召回率高于只利用结巴分词的准确率和召回率。最后提出了一种基于区分不同领域的领域自适应分词算法评价方法。实验结果表明,上述算法能够有效区分不同领域,即可以有效实现领域分词。 展开更多
关键词 结巴分词 领域自适应 标准化点互信息 词频统计 左右信息熵 词性约束
下载PDF
中国纺织服装上市企业数字化转型特点与建议 被引量:4
15
作者 郑通 张立杰 《丝绸》 CAS CSCD 北大核心 2023年第12期11-16,共6页
文章为帮助纺织服装企业顺利进行数字化转型,以中国纺织服装上市企业为样本,采用文本量化分析方法,归纳数字化转型的主要特点并提出转型建议。通过对2016—2022年纺织服装上市企业年度报告进行分析,发现中国纺织服装上市企业数字化转型... 文章为帮助纺织服装企业顺利进行数字化转型,以中国纺织服装上市企业为样本,采用文本量化分析方法,归纳数字化转型的主要特点并提出转型建议。通过对2016—2022年纺织服装上市企业年度报告进行分析,发现中国纺织服装上市企业数字化转型主要拥有的特点包括:以技术进步为主要动力;以业务流程全面改革为目标;以消费者需求为导向;以信息系统为支撑;以数据为关键生产要素。针对中国纺织服装上市企业的数字化转型特点,从政府和企业两个层面提出数字化转型建议,具体包括:政府引导企业数字化转型;企业的业务流程全面转型。 展开更多
关键词 纺织服装上市企业 数字化转型 文本量化分析 词频统计 转型特点 转型建议
下载PDF
MapReduce与Spark的Shuffle过程比较——以词频统计为例
16
作者 汪世伟 陈新房 杨丽佳 《电脑与电信》 2023年第12期29-32,38,共5页
MapReduce和Spark作为大数据处理框架,都用于处理和分析大规模数据集,为了深入理解二者的异同,选取HadoopMapReduce与Spark计算模型中涉及核心环节Shuffle过程原理深入剖析,并以单词词频统计算法Shuffle过程为例,对比实验计算过程,结果... MapReduce和Spark作为大数据处理框架,都用于处理和分析大规模数据集,为了深入理解二者的异同,选取HadoopMapReduce与Spark计算模型中涉及核心环节Shuffle过程原理深入剖析,并以单词词频统计算法Shuffle过程为例,对比实验计算过程,结果表明Spark的Shuffle过程比MapReduce的Shuffle过程运算速度更快,效率更高。 展开更多
关键词 HADOOP MAPREDUCE SPARK 词频统计
下载PDF
基于词频统计的中文分词的研究 被引量:68
17
作者 费洪晓 康松林 +1 位作者 朱小娟 谢文彪 《计算机工程与应用》 CSCD 北大核心 2005年第7期67-68,100,共3页
论文介绍了一个基于词频统计的中文分词系统的设计和实现。通过这个系统,可以将输入的连续汉字串进行分词处理,输出分割后的汉语词串,一般是二字词串,并得到一个词典。词典中不重复地存储了每次处理中得到的词语,以及这些词语出现的频... 论文介绍了一个基于词频统计的中文分词系统的设计和实现。通过这个系统,可以将输入的连续汉字串进行分词处理,输出分割后的汉语词串,一般是二字词串,并得到一个词典。词典中不重复地存储了每次处理中得到的词语,以及这些词语出现的频率。这个系统选用了三种统计原理分别进行统计:互信息,N元统计模型和t-测试。文中还对这三种原理的处理结果进行了比较,以分析各种统计原理的统计特点,以及各自所适合的应用场合。 展开更多
关键词 中文分词 词频统计 互信息N元统计模型 t-测试
下载PDF
一种基于词频统计的组织机构名识别方法 被引量:15
18
作者 胡万亭 杨燕 +2 位作者 尹红风 贾真 刘利 《计算机应用研究》 CSCD 北大核心 2013年第7期2014-2016,共3页
命名实体识别是自然语言处理必不可少的重要部分,其中组织机构名识别占了很大的比例。提出了基于词频统计的组织机构名识别方法。训练数据主要通过百度百科词条整理得到。训练时,利用百度百科词条名在词条文本中的频数统计进行机构构成... 命名实体识别是自然语言处理必不可少的重要部分,其中组织机构名识别占了很大的比例。提出了基于词频统计的组织机构名识别方法。训练数据主要通过百度百科词条整理得到。训练时,利用百度百科词条名在词条文本中的频数统计进行机构构成词的词频统计。在此基础上,构建了数学模型,实现了组织机构名识别算法。该识别算法集成到了中文分词中,取得了较好的识别结果,可以满足一定的实际应用需求。 展开更多
关键词 统计 词频 机构名构成词 组织机构名识别
下载PDF
SegT:一个实用的藏文分词系统 被引量:25
19
作者 刘汇丹 诺明花 +2 位作者 赵维纳 吴健 贺也平 《中文信息学报》 CSCD 北大核心 2012年第1期97-103,共7页
在分析现有藏文分词方法的基础上,该文重点研究了藏文分词中的格助词分块、临界词识别、词频统计、交集型歧义检测和消歧等问题并提出了相应的方法。应用这些方法,设计实现了一个藏文分词系统SegT。该系统采用格助词分块并识别临界词,... 在分析现有藏文分词方法的基础上,该文重点研究了藏文分词中的格助词分块、临界词识别、词频统计、交集型歧义检测和消歧等问题并提出了相应的方法。应用这些方法,设计实现了一个藏文分词系统SegT。该系统采用格助词分块并识别临界词,然后采用最大匹配方法分词,并进行紧缩词识别。系统采用双向切分检测交集型歧义字段并使用预先统计的词频信息进行消歧。实验结果表明,该文设计的格助词分块和临界词识别方法可以将分词速度提高15%左右,但格助词分块对分词效果没有明显提高或降低。系统最终分词正确率为96.98%,基本达到了实用的水平。 展开更多
关键词 藏文分词 格助词 临界词识别 词频统计 藏文信息处理 中文信息处理
下载PDF
基于篇章结构相似度的复制检测算法 被引量:28
20
作者 金博 史彦军 滕弘飞 《大连理工大学学报》 EI CAS CSCD 北大核心 2007年第1期125-130,共6页
学术论文的复制检测研究对于知识产权保护和抑制抄袭侵权等行为有重要意义.国内外主要用数字指纹及关键词匹配等技术进行论文的复制检测.为解决目前中文复制检测难题,给出了一种基于篇章结构相似度的中文学术论文复制检测算法及其问题... 学术论文的复制检测研究对于知识产权保护和抑制抄袭侵权等行为有重要意义.国内外主要用数字指纹及关键词匹配等技术进行论文的复制检测.为解决目前中文复制检测难题,给出了一种基于篇章结构相似度的中文学术论文复制检测算法及其问题的数学模型.在分析论文篇章结构的基础上,利用数字指纹和词频统计等技术,经编程实现,用于论文的全抄、部分抄袭和拼抄等抄袭现象的初步检测.与基于全文数字指纹和基于全文词频统计的检测方法相比较,更适用于要求较准确的论文复制检测. 展开更多
关键词 学术论文 复制检测 抄袭识别 数字指纹 词频统计 篇章结构
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部