期刊文献+
共找到1,846篇文章
< 1 2 93 >
每页显示 20 50 100
超临界塔式锅炉“TF”方式下加负荷缓慢的原因分析
1
作者 张文智 《电力系统装备》 2018年第8期121-122,共2页
以火电厂运行过程中的的现场实例,结合超临界塔式锅炉的特点介绍了塔式锅炉在“TF”方式下加负荷缓慢的原因。
关键词 超临界 塔式锅炉 tf方式 加负荷
下载PDF
基于TF-IDF算法的运营商客户投诉原因研究 被引量:1
2
作者 张爱华 孙嘉鸿 《北京邮电大学学报(社会科学版)》 2024年第2期39-49,共11页
针对运营商人工处理客户投诉工单高成本低效率问题,提出了一种基于TF-IDF算法的定量研究方法,旨在高效精准地识别客户投诉原因。选用Jieba分词,导入自定义词典和停用词列表,对运营商客户投诉工单进行关键词抽取,获取各类问题中TF-IDF值... 针对运营商人工处理客户投诉工单高成本低效率问题,提出了一种基于TF-IDF算法的定量研究方法,旨在高效精准地识别客户投诉原因。选用Jieba分词,导入自定义词典和停用词列表,对运营商客户投诉工单进行关键词抽取,获取各类问题中TF-IDF值排名前6的关键词,输出关键词集。提高了关键词抽取的准确性和效率。此外,对比仅对文档集使用TF进行统计和使用TextRank算法的情况,突显了IDF的重要性及算法原理的差异。实验结果表明,光猫、路由器、机顶盒问题广泛存在于各类投诉中。针对这三类问题,为运营商提供了改进产品、服务的相关建议,对运营商集中治理、解决问题具有一定的实用价值。 展开更多
关键词 投诉工单 投诉原因 关键词抽取 tf-IDF
下载PDF
基于TF-NGO算法的CFB锅炉床温系统建模研究
3
作者 印江 霍泽良 杜志龙 《自动化仪表》 CAS 2024年第6期22-27,32,共7页
床温是循环流化床(CFB)锅炉重要的运行参数之一。针对床温耦合性强、干扰因素多、控制复杂的问题,亟需建立床温的数学模型,以实现床温控制,从而保证CFB锅炉安全、平稳地运行。为此,首先引入了混沌映射、切线飞行(TF)和柯西变异策略改进... 床温是循环流化床(CFB)锅炉重要的运行参数之一。针对床温耦合性强、干扰因素多、控制复杂的问题,亟需建立床温的数学模型,以实现床温控制,从而保证CFB锅炉安全、平稳地运行。为此,首先引入了混沌映射、切线飞行(TF)和柯西变异策略改进北方苍鹰优化(NGO)算法,并用实际工况的系统模型测试TF-NGO算法。测试结果表明,TF-NGO算法拥有更快的收敛速度和更高的寻优精度。其次,采集并预处理山西某电厂350 MW超临界CFB锅炉的现场运行数据。最后,采用TF-NGO算法对所建模型的参数进行辨识,并用实际工况数据进行模型验证。辨识和验证结果表明,由TF-NGO算法辨识的床温模型与实际输出拟合度高,能有效反映床温的动态特性,证明所建模型的有效性。该研究为后续对350 MW超临界CFB锅炉床温的优化控制研究奠定了基础。 展开更多
关键词 循环流化床 锅炉 床温 系统辨识 切线飞行 北方苍鹰优化算法
下载PDF
基于TF-IDF和多头注意力Transformer模型的文本情感分析 被引量:9
4
作者 高佳希 黄海燕 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期129-136,共8页
文本情感分析旨在对带有情感色彩的主观性文本进行分析、处理、归纳和推理,是自然语言处理中一项重要任务。针对现有的计算方法不能充分处理复杂度和混淆度较高的文本数据集的问题,提出了一种基于TF-IDF(Term Frequency-Inverse Documen... 文本情感分析旨在对带有情感色彩的主观性文本进行分析、处理、归纳和推理,是自然语言处理中一项重要任务。针对现有的计算方法不能充分处理复杂度和混淆度较高的文本数据集的问题,提出了一种基于TF-IDF(Term Frequency-Inverse Document Frequency)和多头注意力Transformer模型的文本情感分析模型。在文本预处理阶段,利用TF-IDF算法对影响文本情感倾向较大的词语进行初步筛选,舍去常见的停用词及其他文本所属邻域对文本情感倾向影响较小的专有名词。然后,利用多头注意力Transformer模型编码器进行特征提取,抓取文本内部重要的语义信息,提高模型对语义的分析和泛化能力。该模型在多领域、多类型评论语料库数据集上取得了98.17%的准确率。 展开更多
关键词 文本情感分析 自然语言处理 多头注意力机制 tf-IDF算法 Transformer模型
下载PDF
基于改进TF-IDF与BERT的领域情感词典构建方法 被引量:1
5
作者 蒋昊达 赵春蕾 +1 位作者 陈瀚 王春东 《计算机科学》 CSCD 北大核心 2024年第S01期150-158,共9页
领域情感词典的构建是领域文本情感分析的基础。现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题。为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于... 领域情感词典的构建是领域文本情感分析的基础。现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题。为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于改进词频-逆文档频率(TF-IDF)与BERT的领域情感词典构建方法。该方法在筛选领域候选情感词阶段对TF-IDF算法进行改进,将隐含狄利克雷分布(LDA)算法与改进后的TF-IDF算法结合,进行领域性修正,提升了所筛选候选情感词的领域性;在候选情感词极性判断阶段,将情感倾向点互信息算法(SO-PMI)与BERT结合,利用领域情感词微调BERT分类模型,提高了判断领域候选情感词情感极性的准确程度。在不同领域的用户评论数据集上进行实验,结果表明,该方法可以提高所构建领域情感词典的质量,使用该方法构建的领域情感词典用于汽车领域和手机领域文本情感分析的F1值分别达到78.02%和88.35%。 展开更多
关键词 情感分析 领域情感词典 词频-逆文档频率 隐含狄利克雷分布 情感倾向点互信息算法 BERT模型
下载PDF
基于改进TF-IDF融合二进制灰狼优化的短文本分类
6
作者 杨东 毋涛 +1 位作者 赵雪青 李猛 《计算机技术与发展》 2024年第8期37-41,共5页
为了提高特殊类型短文本分类准确度和降低特征维度,提出了基于改进TF-IDF方法融合二进制灰狼优化的短文本分类。为了提高特征向量文本权重计算准确度,提出了点赞排列因子,并融合了文本特征集中度,对附有点赞数的特殊类型文本进行权重计... 为了提高特殊类型短文本分类准确度和降低特征维度,提出了基于改进TF-IDF方法融合二进制灰狼优化的短文本分类。为了提高特征向量文本权重计算准确度,提出了点赞排列因子,并融合了文本特征集中度,对附有点赞数的特殊类型文本进行权重计算,设计改进了TF-IDF-RANK方法对特征进行加权;同时,基于初选特征向量,设计优化了二进制灰狼优化算法(BGWO)搜寻最优特征子集,引入衰减系数向量和多优解迭代机制,提高灰狼搜寻性能。结果表明,该方法有效地提升了权重准确率,更好地表征初选特征向量,增强特征选择时寻找全局最优解的能力,进而提高短文本的分类效果。通过LABIC和抖音开放平台数据集测试,综合指标F1值分别提高了14.76%和14.02%,验证了该方法对于特殊类型文本分类的有效性。 展开更多
关键词 短文本分类 特征加权 tf-IDF-RANK方法 特征选择 二进制灰狼优化
下载PDF
激光熔覆TF550阻燃钛合金的组织和性能研究
7
作者 王晓东 陈嘉鑫 +4 位作者 彭俊超 刘丰刚 刘奋成 胡万谦 王联波 《热加工工艺》 北大核心 2024年第14期161-167,共7页
研究了工艺参数对激光熔覆TF550阻燃钛合金成形质量的影响,以及微观组织和力学性能演变规律。结果表明,对试样成形的影响因素主次为激光功率>扫描速度>送粉率。不同激光功率下的激光熔覆TF550阻燃钛合金块体试样顶部及底部均由等... 研究了工艺参数对激光熔覆TF550阻燃钛合金成形质量的影响,以及微观组织和力学性能演变规律。结果表明,对试样成形的影响因素主次为激光功率>扫描速度>送粉率。不同激光功率下的激光熔覆TF550阻燃钛合金块体试样顶部及底部均由等轴Prior-β晶粒组成,中间区域为粗大的柱状Prior-β晶粒。随着激光功率的增大,各区域的晶粒尺寸也随之增大。激光熔覆TF550阻燃钛合金试样的显微组织主要由鸡爪状的TiC相、点状的Ti_(5)Si_(3)以及针状的α组成。激光熔覆TF550试样的平均显微硬度均呈现出沉积区>热影响区>基材的规律。激光熔覆TF550试样水平方向的抗拉强度以及屈服强度均略高于锻件,但伸长率仅为锻件的72%,其断口形貌呈现出混合断裂的特征。 展开更多
关键词 激光熔覆 tf550阻燃钛合金 工艺参数 微观组织 拉伸性能
下载PDF
长三角一体化发展特征与动力探究——基于TF-IDF算法与格兰杰检验
8
作者 关硕 赵雪 刘毅 《科技和产业》 2024年第5期40-47,共8页
从政策观念视角出发,深入探讨长三角区域一体化发展进程,有助于洞察区域内生发展动力和经济增长潜力。应用话语制度主义和间断-均衡框架,结合TF-IDF(词频-逆文档频率)算法与格兰杰检验,揭示长三角一体化发展特征与动因。研究发现:建设... 从政策观念视角出发,深入探讨长三角区域一体化发展进程,有助于洞察区域内生发展动力和经济增长潜力。应用话语制度主义和间断-均衡框架,结合TF-IDF(词频-逆文档频率)算法与格兰杰检验,揭示长三角一体化发展特征与动因。研究发现:建设主体对5个发展目标的注意力分配不均衡;在创新共建目标方面,地方主体的注意力变动会引起中央主体的注意力变动;长三角一体化发展呈现小间断大均衡特征,体现“自下而上”的地方主导模式。 展开更多
关键词 长三角一体化 话语制度主义 间断-均衡框架 tf-IDF(词频-逆文件频率)算法 格兰杰检验
下载PDF
基于改进TF-IDF和AGLCNN的新闻长文本分类模型
9
作者 周宪溪 牟莉 《计算机与现代化》 2024年第8期120-126,共7页
新闻长文本分类是自然语言处理中的一项重要任务,但传统的文本表示方法存在特征稀疏、语义不足等问题。此外,新闻长文本含有大量的冗余信息,并且可能涉及其他主题,以上问题都会导致文本特征提取不全面。为此,本文提出一种基于改进TF-ID... 新闻长文本分类是自然语言处理中的一项重要任务,但传统的文本表示方法存在特征稀疏、语义不足等问题。此外,新闻长文本含有大量的冗余信息,并且可能涉及其他主题,以上问题都会导致文本特征提取不全面。为此,本文提出一种基于改进TF-IDF算法和AGLCNN的新闻长文本分类模型。该模型首先利用特征项在类间与类内分布情况及其位置信息来改进TF-IDF算法,并结合Word2Vec词向量进行文本表示;利用注意力机制突出关键字信息,输入至Bi-LSTM捕获文本上下文特征;接着利用CNN突出新闻主题的显著特征;考虑到新闻长文本中可能存在涉及其他主题信息的句子,引入门控机制对Bi-LSTM和CNN输出特征进行融合,获得最终的文本特征表示;最后,将特征向量输入Softmax层进行新闻分类。在THUCNews数据集和搜狐新闻数据集上进行对比实验,结果表明,所提模型在2个数据集上的召回率分别为0.985和0.976,优于其他分类模型。 展开更多
关键词 文本分类 tf-IDF 注意力机制 卷积神经网络 特征项
下载PDF
PTG和TFA根管治疗系统清理根管效果的分析
10
作者 孙海欧 刘佼佼 赵灵洁 《中国医科大学学报》 CAS 北大核心 2024年第8期747-751,共5页
目的比较ProTaper Gold(PTG)和TF-Adaptive(TFA)根管治疗系统的根管清理效果。方法将40颗离体牙随机分为PTG组和TFA组,每组20颗。分别使用PTG和TFA根管治疗系统进行根管预备。通过扫描电子显微镜观察根管预备后碎屑和玷污层的分布,并采... 目的比较ProTaper Gold(PTG)和TF-Adaptive(TFA)根管治疗系统的根管清理效果。方法将40颗离体牙随机分为PTG组和TFA组,每组20颗。分别使用PTG和TFA根管治疗系统进行根管预备。通过扫描电子显微镜观察根管预备后碎屑和玷污层的分布,并采用YAMASHITA量化分析标准对每组根冠1/3、根中1/3、根尖1/3区域的碎屑和玷污层分别量化评分,分析PTG和TFA的清理效果。结果PTG组和TFA组根冠1/3、根中1/3的碎屑与玷污层评分差异无统计学意义(P>0.05)。PTG组根尖1/3的碎屑和玷污层评分均大于TFA组,差异有统计学意义(P<0.05)。结论PTG和TFA根管治疗系统在根管中上段清理效果均良好,但TFA在根尖1/3区域的清理效果比PTG更具优势。 展开更多
关键词 ProTaper Gold根管治疗系统 tf-Adaptive根管治疗系统 扫描电子显微镜 根管预备 根管清理
下载PDF
奥迪TFSI e车型充电和存储系统新技术剖析(上)
11
作者 张伟 《汽车维修技师》 2024年第5期20-27,共8页
一、混合动力蓄电池单元AX1混合动力蓄电池单元AX1也被简称为高压蓄电池,其在德国奥迪公司的TFSI e车型上有两种不同的结构形式。一种是所谓的高地板蓄电池,这种蓄电池内叠加了两层模块,因此其结构较高,并由此得名;另一种是平地板蓄电池... 一、混合动力蓄电池单元AX1混合动力蓄电池单元AX1也被简称为高压蓄电池,其在德国奥迪公司的TFSI e车型上有两种不同的结构形式。一种是所谓的高地板蓄电池,这种蓄电池内叠加了两层模块,因此其结构较高,并由此得名;另一种是平地板蓄电池,它只有一层模块,因此也就很平。在奥迪的MQB车上,使用的是平地板TFSI e高压蓄电池。在奥迪的MLB车上,除了使用平地板TFSI e高压蓄电池外,还使用一种高地板TFSI e高压蓄电池。 展开更多
关键词 动力蓄电池 技术剖析 存储系统 平地板 tfS 奥迪 车型
下载PDF
奥迪TFSI e车系空调和温度管理系统技术剖析(上)
12
作者 张明 《汽车维修技师》 2024年第13期24-29,共6页
一、空调奥迪TFSI e车型上使用的空调装置与不带电驱动装置的车上是相同的。由于各车型的空调装置在细节方面是不同的,奥迪TFSI e车型上的驻车空调系统不使用烧油的驻车加热装置,如图1所示。二、温度管理由于采用纵置发动机的奥迪TFSI ... 一、空调奥迪TFSI e车型上使用的空调装置与不带电驱动装置的车上是相同的。由于各车型的空调装置在细节方面是不同的,奥迪TFSI e车型上的驻车空调系统不使用烧油的驻车加热装置,如图1所示。二、温度管理由于采用纵置发动机的奥迪TFSI e车型上使用的温度管理系统相差不大,本文以奥迪A8 TFSI e车为例来讲述温度管理系统。 展开更多
关键词 空调装置 技术剖析 加热装置 奥迪A8 驱动装置 驻车空调 tfS
下载PDF
基于TF-IDF和VOSviewer的我国应急救援现状可视化分析 被引量:1
13
作者 黄萍 张文龙 +2 位作者 叶圣琳 余君 余龙星 《中国安全科学学报》 CAS CSCD 北大核心 2023年第11期196-205,共10页
为有效利用消防救援队伍的实战记录资料挖掘应急救援战例成功经验,结合词频-逆文档频率(TF-IDF)算法和VOSviewer文献可视化分析技术,构建战例资料分析模型,分析战例成功与失败的共性规律和特点,总结我国应急救援现状及发展趋势。模型以2... 为有效利用消防救援队伍的实战记录资料挖掘应急救援战例成功经验,结合词频-逆文档频率(TF-IDF)算法和VOSviewer文献可视化分析技术,构建战例资料分析模型,分析战例成功与失败的共性规律和特点,总结我国应急救援现状及发展趋势。模型以2007—2019年间共185起应急救援典型战例为数据库,按照自然灾害、交通事故、建筑坍塌、危化品泄漏、火灾扑救等应急救援行动类型展开分析。结果表明:我国应急救援行动的影响因素主要表现在人(救援队伍)、机(装备技术)、环(环境)、管(管理)4个方面。其中,环境因素的影响几乎都是负面的,其他3个因素均有正负面影响。此外,不同应急救援行动类型的主导影响因素存在差异,自然灾害突出“机”;交通事故突出“管”;建筑坍塌突出“机”“环”;危化品泄漏在“人机环管”4个方面均有突出问题;火灾救援突出“机”。 展开更多
关键词 词频-逆文档频率(tf-IDF) VOSviewer 应急救援 消防救援 可视化分析 战例分析
下载PDF
基于改进TF-IDF算法的毕业生就业推荐算法研究 被引量:2
14
作者 李龙 金铄 黄霞 《计算机与数字工程》 2023年第9期1985-1989,2118,共6页
针对传统就业推荐算法不能够对每一个毕业生进行精准的推荐的局限性,论文提出一种结合TF-IDF算法和K-means++算法的双向推荐系统,一方面对毕业生信息使用K-means++算法进行聚类,对新用户根据其初始信息与行为信息进行用户画像建模,并计... 针对传统就业推荐算法不能够对每一个毕业生进行精准的推荐的局限性,论文提出一种结合TF-IDF算法和K-means++算法的双向推荐系统,一方面对毕业生信息使用K-means++算法进行聚类,对新用户根据其初始信息与行为信息进行用户画像建模,并计算与往届毕业生的相似度;另一方面使用TF-IDF算法对各个招聘网站所发布的招聘信息中的关键词进行统计转换词频等操作。实验结果表明,该双向就业推荐系统比起之前单向就业推荐提高了毕业生就业推荐的满意度,提升推荐效率。 展开更多
关键词 K-means++算法 tf-IDF算法 用户画像 推荐系统
下载PDF
西安回族汉语tf声母社会意义的二元分化
15
作者 董洪杰 周敏莉 《唐都学刊》 2023年第4期97-102,共6页
tf声母是西安回族方言变体的重要语音特征,具有标识回族语言社区的社会意义。20世纪90年代以来,西安坊上回族社区的居住空间分化为自建房和单元楼两种形式,并形成了相对独立的两个子社区。经对变体测试数据的量化和质化分析发现,居住空... tf声母是西安回族方言变体的重要语音特征,具有标识回族语言社区的社会意义。20世纪90年代以来,西安坊上回族社区的居住空间分化为自建房和单元楼两种形式,并形成了相对独立的两个子社区。经对变体测试数据的量化和质化分析发现,居住空间的重置引发了回族对tf声母识别和认知的分化,tf声母在原有社会意义基础上,衍生出了标识回族内部自建房社区的内涵,而这一分化是在“三元变体二元对立”的框架下实现的。研究表明,“三元变体二元对立”的分析框架将微观的语言变体与宏观的社会背景相结合,以社会意义为连接点,有利于深入探讨语言与社会的互动关系。 展开更多
关键词 西安坊上 回族汉语 居住空间 tf声母 社会意义
下载PDF
基于TF-IDF和TextRank结合的中文文本关键词提取方法——以体育新闻为例 被引量:4
16
作者 兰晓芳 刘卓 +1 位作者 许志豪 肖毅 《软件工程》 2023年第8期6-10,共5页
利用文本挖掘技术进行体育热点分析,可以为体育领域的发展提供更多有用的信息。文中提出了一种基于TF-IDF(Term Frequency-Inverse Document Frequency,词频-逆文档频率)和TextRank(文本排序)的中文文本关键词提取方法,该方法首先采用... 利用文本挖掘技术进行体育热点分析,可以为体育领域的发展提供更多有用的信息。文中提出了一种基于TF-IDF(Term Frequency-Inverse Document Frequency,词频-逆文档频率)和TextRank(文本排序)的中文文本关键词提取方法,该方法首先采用分词、去除停用词等对文本进行预处理;其次使用TF-IDF算法计算每个词的重要性并进行归一化处理,同时使用TextRank算法权衡单词之间的关系并计算每个单词的得分以进行归一化处理;最后将TF-IDF值和TextRank得分进行加权和得到每个词的综合权重值,最终获得权重值最高的N个关键词。应用TF-IDF和TextRank结合的方法在F1值上选择5个关键词时取得了更好的结果,相较于只使用TF-IDF方法或TextRank方法,其关键词提取准确率分别提高约40%和32%。该方法有效提高了关键词提取的准确性和提取效率。 展开更多
关键词 tf-IDF TextRank 体育新闻 关键词提取
下载PDF
苯线磷和甲胺磷对TF-1细胞乙酰胆碱酯酶影响的差异
17
作者 陈旸升 马永超 +3 位作者 彭颖蓓 徐丽 谢群慧 赵斌 《生态毒理学报》 CAS CSCD 北大核心 2023年第4期231-240,共10页
有机磷农药(organophosphorus pesticides,OPs)具有较强的神经毒性,主要是通过抑制胆碱能神经传导中的关键酶,乙酰胆碱酯酶(acetylcholinesterase,AChE,EC 3.1.1.7)的活性来实现的。苯线磷和甲胺磷是广泛用于农业生产的OPs,但对它们抑制... 有机磷农药(organophosphorus pesticides,OPs)具有较强的神经毒性,主要是通过抑制胆碱能神经传导中的关键酶,乙酰胆碱酯酶(acetylcholinesterase,AChE,EC 3.1.1.7)的活性来实现的。苯线磷和甲胺磷是广泛用于农业生产的OPs,但对它们抑制人AChE活性的机制研究十分有限。本研究应用2种不同的给药方式,包括对培养的细胞和细胞裂解液进行药物处理,明确苯线磷和甲胺磷对人血液白血病细胞系TF-1中AChE酶活性的直接作用和对AChE基因转录表达的影响,从而揭示苯线磷和甲胺磷抑制AChE酶活性的机制与两者的差别。结果表明,高浓度苯线磷(10^(-3) mol·L^(-1))处理后,TF-1细胞活力降低,同时诱导细胞凋亡和坏死;而所有被试浓度的甲胺磷对细胞活力均没有明显影响。此外,对于TF-1细胞裂解液中的AChE,苯线磷和甲胺磷短期处理(1 h和5 h)均可产生直接抑制作用,其中苯线磷的抑制作用略强于甲胺磷(孵育1 h,IC_(50)值分别为1.181×10^(-6) mol·L^(-1)和2.837×10^(-6) mol·L^(-1))。对培养细胞的药物处理实验结果显示,苯线磷和甲胺磷(10^(-6) mol·L^(-1)和10-5 mol·L^(-1))处理24 h后,均显著降低了TF-1细胞的AChE酶活性,苯线磷的抑制率略高于甲胺磷。而与对酶活性的抑制作用相反,苯线磷和甲胺磷对TF-1中AChE H转录本表达有轻微的上调作用,以甲胺磷更为明显,提示存在反馈调节机制。总结上述结果,我们发现苯线磷对TF-1细胞中AChE的抑制作用总体略强于甲胺磷,而甲胺磷对AChE基因表达的反馈上调作用更明显。从而首次从对AChE酶的直接抑制作用和生物合成影响的不同角度阐述了2个OPs对AChE影响的差异,为进一步的分子机制研究提供了实验数据。 展开更多
关键词 苯线磷 甲胺磷 乙酰胆碱酯酶(AChE) 人血液白血病细胞tf-1
下载PDF
融合条件熵和TF-IDF的过采样方法 被引量:1
18
作者 胡宏章 邱云飞 郭蕾 《计算机时代》 2023年第6期48-53,共6页
针对非均衡数据带来的分类器对少数类样本学习不充分的问题,提出融合条件熵和TF-IDF的过采样方法。该方法首先指定参数,组合数据特征,然后计算每种组合方式下的条件熵,判断每种组合条件下类的不确定性,同时为了避免低词频带来的噪音数据... 针对非均衡数据带来的分类器对少数类样本学习不充分的问题,提出融合条件熵和TF-IDF的过采样方法。该方法首先指定参数,组合数据特征,然后计算每种组合方式下的条件熵,判断每种组合条件下类的不确定性,同时为了避免低词频带来的噪音数据,将条件熵结果乘上1/TF-IDF因子,再将结果按升序排序,最后结合参数选定过采样依据的特征组合,用以构造新数据,使正负样本平衡。将所提方法在7个不均衡数据集上进行实验仿真,结果表明,所提方法比其他方法在F-measure、G-mean和AUC等评价指标上均有一定提高。 展开更多
关键词 非均衡数据 条件熵 tf-IDF 过采样
下载PDF
基于情感指数和TF-IDF词频分析的高客单价商品物流影响因素研究 被引量:1
19
作者 孔茹佳 汪传雷 +2 位作者 支茁 李慧 赵林子 《物流工程与管理》 2023年第7期13-17,32,共6页
随着数字经济的发展和生活水平的提高,电商平台中高客单价商品的销量不断增加,在线评论成为影响消费者购买决策的关键要素之一。针对京东平台的在线评论数据,提出一种基于情感指数和TF-IDF词频分析的高客单价商品情感指数计算模型来量... 随着数字经济的发展和生活水平的提高,电商平台中高客单价商品的销量不断增加,在线评论成为影响消费者购买决策的关键要素之一。针对京东平台的在线评论数据,提出一种基于情感指数和TF-IDF词频分析的高客单价商品情感指数计算模型来量化消费者情感指数,采用灰色关联分析法探索消费者物流服务情感指数与消费者总情感指数的相关性,结果表明消费者物流服务情感指数与消费者总情感指数之间的关联度极高,挖掘出对高客单价商品消费者情感影响较大的五个关键物流因素:配送、安装、服务态度、售后服务以及包装。 展开更多
关键词 在线评论 情感分析 tf-IDF 高客单价商品
下载PDF
一种结合TF-IDF和Simhash的科技项目文本相似性度量方法 被引量:5
20
作者 孙北宁 吕维新 +1 位作者 曾俊 肖衡 《电子技术应用》 2023年第6期89-93,共5页
为了提高科技项目文本相似性度量的准确性和性能,将TF-IDF和Simhash相结合,提出了一种新的科技项目文本相似性度量方法。首先,该方法对科技项目文本进行预处理得到词项集合,再使用TF-IDF计算词项集合中每个词项的权重值,并选取具有较高... 为了提高科技项目文本相似性度量的准确性和性能,将TF-IDF和Simhash相结合,提出了一种新的科技项目文本相似性度量方法。首先,该方法对科技项目文本进行预处理得到词项集合,再使用TF-IDF计算词项集合中每个词项的权重值,并选取具有较高权重值的重要词项;其次,使用Simhash把重要词项映射为固定长度的二进制串,并求和得到文本的Simhash签名;最后,使用汉明距离计算两个Simhash签名间的相似性。实验结果表明,所提方法在查准率、召回率和F度量值方面优于传统的Simhash算法和TF-IDF方法。 展开更多
关键词 科技项目文本 文本相似度 tf-IDF Simhash算法
下载PDF
上一页 1 2 93 下一页 到第
使用帮助 返回顶部