期刊文献+
共找到1,815篇文章
< 1 2 91 >
每页显示 20 50 100
基于TF-IDF算法的运营商客户投诉原因研究
1
作者 张爱华 孙嘉鸿 《北京邮电大学学报(社会科学版)》 2024年第2期39-49,共11页
针对运营商人工处理客户投诉工单高成本低效率问题,提出了一种基于TF-IDF算法的定量研究方法,旨在高效精准地识别客户投诉原因。选用Jieba分词,导入自定义词典和停用词列表,对运营商客户投诉工单进行关键词抽取,获取各类问题中TF-IDF值... 针对运营商人工处理客户投诉工单高成本低效率问题,提出了一种基于TF-IDF算法的定量研究方法,旨在高效精准地识别客户投诉原因。选用Jieba分词,导入自定义词典和停用词列表,对运营商客户投诉工单进行关键词抽取,获取各类问题中TF-IDF值排名前6的关键词,输出关键词集。提高了关键词抽取的准确性和效率。此外,对比仅对文档集使用TF进行统计和使用TextRank算法的情况,突显了IDF的重要性及算法原理的差异。实验结果表明,光猫、路由器、机顶盒问题广泛存在于各类投诉中。针对这三类问题,为运营商提供了改进产品、服务的相关建议,对运营商集中治理、解决问题具有一定的实用价值。 展开更多
关键词 投诉工单 投诉原因 关键词抽取 tf-IDF
下载PDF
基于TF-IDF和多头注意力Transformer模型的文本情感分析 被引量:2
2
作者 高佳希 黄海燕 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期129-136,共8页
文本情感分析旨在对带有情感色彩的主观性文本进行分析、处理、归纳和推理,是自然语言处理中一项重要任务。针对现有的计算方法不能充分处理复杂度和混淆度较高的文本数据集的问题,提出了一种基于TF-IDF(Term Frequency-Inverse Documen... 文本情感分析旨在对带有情感色彩的主观性文本进行分析、处理、归纳和推理,是自然语言处理中一项重要任务。针对现有的计算方法不能充分处理复杂度和混淆度较高的文本数据集的问题,提出了一种基于TF-IDF(Term Frequency-Inverse Document Frequency)和多头注意力Transformer模型的文本情感分析模型。在文本预处理阶段,利用TF-IDF算法对影响文本情感倾向较大的词语进行初步筛选,舍去常见的停用词及其他文本所属邻域对文本情感倾向影响较小的专有名词。然后,利用多头注意力Transformer模型编码器进行特征提取,抓取文本内部重要的语义信息,提高模型对语义的分析和泛化能力。该模型在多领域、多类型评论语料库数据集上取得了98.17%的准确率。 展开更多
关键词 文本情感分析 自然语言处理 多头注意力机制 tf-IDF算法 Transformer模型
下载PDF
长三角一体化发展特征与动力探究——基于TF-IDF算法与格兰杰检验
3
作者 关硕 赵雪 刘毅 《科技和产业》 2024年第5期40-47,共8页
从政策观念视角出发,深入探讨长三角区域一体化发展进程,有助于洞察区域内生发展动力和经济增长潜力。应用话语制度主义和间断-均衡框架,结合TF-IDF(词频-逆文档频率)算法与格兰杰检验,揭示长三角一体化发展特征与动因。研究发现:建设... 从政策观念视角出发,深入探讨长三角区域一体化发展进程,有助于洞察区域内生发展动力和经济增长潜力。应用话语制度主义和间断-均衡框架,结合TF-IDF(词频-逆文档频率)算法与格兰杰检验,揭示长三角一体化发展特征与动因。研究发现:建设主体对5个发展目标的注意力分配不均衡;在创新共建目标方面,地方主体的注意力变动会引起中央主体的注意力变动;长三角一体化发展呈现小间断大均衡特征,体现“自下而上”的地方主导模式。 展开更多
关键词 长三角一体化 话语制度主义 间断-均衡框架 tf-IDF(词频-逆文件频率)算法 格兰杰检验
下载PDF
基于TF-NGO算法的CFB锅炉床温系统建模研究
4
作者 印江 霍泽良 杜志龙 《自动化仪表》 CAS 2024年第6期22-27,32,共7页
床温是循环流化床(CFB)锅炉重要的运行参数之一。针对床温耦合性强、干扰因素多、控制复杂的问题,亟需建立床温的数学模型,以实现床温控制,从而保证CFB锅炉安全、平稳地运行。为此,首先引入了混沌映射、切线飞行(TF)和柯西变异策略改进... 床温是循环流化床(CFB)锅炉重要的运行参数之一。针对床温耦合性强、干扰因素多、控制复杂的问题,亟需建立床温的数学模型,以实现床温控制,从而保证CFB锅炉安全、平稳地运行。为此,首先引入了混沌映射、切线飞行(TF)和柯西变异策略改进北方苍鹰优化(NGO)算法,并用实际工况的系统模型测试TF-NGO算法。测试结果表明,TF-NGO算法拥有更快的收敛速度和更高的寻优精度。其次,采集并预处理山西某电厂350 MW超临界CFB锅炉的现场运行数据。最后,采用TF-NGO算法对所建模型的参数进行辨识,并用实际工况数据进行模型验证。辨识和验证结果表明,由TF-NGO算法辨识的床温模型与实际输出拟合度高,能有效反映床温的动态特性,证明所建模型的有效性。该研究为后续对350 MW超临界CFB锅炉床温的优化控制研究奠定了基础。 展开更多
关键词 循环流化床 锅炉 床温 系统辨识 切线飞行 北方苍鹰优化算法
下载PDF
奥迪TFSI e车型充电和存储系统新技术剖析(上)
5
作者 张伟 《汽车维修技师》 2024年第5期20-27,共8页
一、混合动力蓄电池单元AX1混合动力蓄电池单元AX1也被简称为高压蓄电池,其在德国奥迪公司的TFSI e车型上有两种不同的结构形式。一种是所谓的高地板蓄电池,这种蓄电池内叠加了两层模块,因此其结构较高,并由此得名;另一种是平地板蓄电池... 一、混合动力蓄电池单元AX1混合动力蓄电池单元AX1也被简称为高压蓄电池,其在德国奥迪公司的TFSI e车型上有两种不同的结构形式。一种是所谓的高地板蓄电池,这种蓄电池内叠加了两层模块,因此其结构较高,并由此得名;另一种是平地板蓄电池,它只有一层模块,因此也就很平。在奥迪的MQB车上,使用的是平地板TFSI e高压蓄电池。在奥迪的MLB车上,除了使用平地板TFSI e高压蓄电池外,还使用一种高地板TFSI e高压蓄电池。 展开更多
关键词 动力蓄电池 技术剖析 存储系统 平地板 tfS 奥迪 车型
下载PDF
基于改进TF-IDF与BERT的领域情感词典构建方法
6
作者 蒋昊达 赵春蕾 +1 位作者 陈瀚 王春东 《计算机科学》 CSCD 北大核心 2024年第S01期150-158,共9页
领域情感词典的构建是领域文本情感分析的基础。现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题。为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于... 领域情感词典的构建是领域文本情感分析的基础。现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题。为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于改进词频-逆文档频率(TF-IDF)与BERT的领域情感词典构建方法。该方法在筛选领域候选情感词阶段对TF-IDF算法进行改进,将隐含狄利克雷分布(LDA)算法与改进后的TF-IDF算法结合,进行领域性修正,提升了所筛选候选情感词的领域性;在候选情感词极性判断阶段,将情感倾向点互信息算法(SO-PMI)与BERT结合,利用领域情感词微调BERT分类模型,提高了判断领域候选情感词情感极性的准确程度。在不同领域的用户评论数据集上进行实验,结果表明,该方法可以提高所构建领域情感词典的质量,使用该方法构建的领域情感词典用于汽车领域和手机领域文本情感分析的F1值分别达到78.02%和88.35%。 展开更多
关键词 情感分析 领域情感词典 词频-逆文档频率 隐含狄利克雷分布 情感倾向点互信息算法 BERT模型
下载PDF
基于改进TF-IDF算法的毕业生就业推荐算法研究 被引量:1
7
作者 李龙 金铄 黄霞 《计算机与数字工程》 2023年第9期1985-1989,2118,共6页
针对传统就业推荐算法不能够对每一个毕业生进行精准的推荐的局限性,论文提出一种结合TF-IDF算法和K-means++算法的双向推荐系统,一方面对毕业生信息使用K-means++算法进行聚类,对新用户根据其初始信息与行为信息进行用户画像建模,并计... 针对传统就业推荐算法不能够对每一个毕业生进行精准的推荐的局限性,论文提出一种结合TF-IDF算法和K-means++算法的双向推荐系统,一方面对毕业生信息使用K-means++算法进行聚类,对新用户根据其初始信息与行为信息进行用户画像建模,并计算与往届毕业生的相似度;另一方面使用TF-IDF算法对各个招聘网站所发布的招聘信息中的关键词进行统计转换词频等操作。实验结果表明,该双向就业推荐系统比起之前单向就业推荐提高了毕业生就业推荐的满意度,提升推荐效率。 展开更多
关键词 K-means++算法 tf-IDF算法 用户画像 推荐系统
下载PDF
西安回族汉语tf声母社会意义的二元分化
8
作者 董洪杰 周敏莉 《唐都学刊》 2023年第4期97-102,共6页
tf声母是西安回族方言变体的重要语音特征,具有标识回族语言社区的社会意义。20世纪90年代以来,西安坊上回族社区的居住空间分化为自建房和单元楼两种形式,并形成了相对独立的两个子社区。经对变体测试数据的量化和质化分析发现,居住空... tf声母是西安回族方言变体的重要语音特征,具有标识回族语言社区的社会意义。20世纪90年代以来,西安坊上回族社区的居住空间分化为自建房和单元楼两种形式,并形成了相对独立的两个子社区。经对变体测试数据的量化和质化分析发现,居住空间的重置引发了回族对tf声母识别和认知的分化,tf声母在原有社会意义基础上,衍生出了标识回族内部自建房社区的内涵,而这一分化是在“三元变体二元对立”的框架下实现的。研究表明,“三元变体二元对立”的分析框架将微观的语言变体与宏观的社会背景相结合,以社会意义为连接点,有利于深入探讨语言与社会的互动关系。 展开更多
关键词 西安坊上 回族汉语 居住空间 tf声母 社会意义
下载PDF
基于TF-IDF和TextRank结合的中文文本关键词提取方法——以体育新闻为例 被引量:2
9
作者 兰晓芳 刘卓 +1 位作者 许志豪 肖毅 《软件工程》 2023年第8期6-10,共5页
利用文本挖掘技术进行体育热点分析,可以为体育领域的发展提供更多有用的信息。文中提出了一种基于TF-IDF(Term Frequency-Inverse Document Frequency,词频-逆文档频率)和TextRank(文本排序)的中文文本关键词提取方法,该方法首先采用... 利用文本挖掘技术进行体育热点分析,可以为体育领域的发展提供更多有用的信息。文中提出了一种基于TF-IDF(Term Frequency-Inverse Document Frequency,词频-逆文档频率)和TextRank(文本排序)的中文文本关键词提取方法,该方法首先采用分词、去除停用词等对文本进行预处理;其次使用TF-IDF算法计算每个词的重要性并进行归一化处理,同时使用TextRank算法权衡单词之间的关系并计算每个单词的得分以进行归一化处理;最后将TF-IDF值和TextRank得分进行加权和得到每个词的综合权重值,最终获得权重值最高的N个关键词。应用TF-IDF和TextRank结合的方法在F1值上选择5个关键词时取得了更好的结果,相较于只使用TF-IDF方法或TextRank方法,其关键词提取准确率分别提高约40%和32%。该方法有效提高了关键词提取的准确性和提取效率。 展开更多
关键词 tf-IDF TextRank 体育新闻 关键词提取
下载PDF
苯线磷和甲胺磷对TF-1细胞乙酰胆碱酯酶影响的差异
10
作者 陈旸升 马永超 +3 位作者 彭颖蓓 徐丽 谢群慧 赵斌 《生态毒理学报》 CAS CSCD 北大核心 2023年第4期231-240,共10页
有机磷农药(organophosphorus pesticides,OPs)具有较强的神经毒性,主要是通过抑制胆碱能神经传导中的关键酶,乙酰胆碱酯酶(acetylcholinesterase,AChE,EC 3.1.1.7)的活性来实现的。苯线磷和甲胺磷是广泛用于农业生产的OPs,但对它们抑制... 有机磷农药(organophosphorus pesticides,OPs)具有较强的神经毒性,主要是通过抑制胆碱能神经传导中的关键酶,乙酰胆碱酯酶(acetylcholinesterase,AChE,EC 3.1.1.7)的活性来实现的。苯线磷和甲胺磷是广泛用于农业生产的OPs,但对它们抑制人AChE活性的机制研究十分有限。本研究应用2种不同的给药方式,包括对培养的细胞和细胞裂解液进行药物处理,明确苯线磷和甲胺磷对人血液白血病细胞系TF-1中AChE酶活性的直接作用和对AChE基因转录表达的影响,从而揭示苯线磷和甲胺磷抑制AChE酶活性的机制与两者的差别。结果表明,高浓度苯线磷(10^(-3) mol·L^(-1))处理后,TF-1细胞活力降低,同时诱导细胞凋亡和坏死;而所有被试浓度的甲胺磷对细胞活力均没有明显影响。此外,对于TF-1细胞裂解液中的AChE,苯线磷和甲胺磷短期处理(1 h和5 h)均可产生直接抑制作用,其中苯线磷的抑制作用略强于甲胺磷(孵育1 h,IC_(50)值分别为1.181×10^(-6) mol·L^(-1)和2.837×10^(-6) mol·L^(-1))。对培养细胞的药物处理实验结果显示,苯线磷和甲胺磷(10^(-6) mol·L^(-1)和10-5 mol·L^(-1))处理24 h后,均显著降低了TF-1细胞的AChE酶活性,苯线磷的抑制率略高于甲胺磷。而与对酶活性的抑制作用相反,苯线磷和甲胺磷对TF-1中AChE H转录本表达有轻微的上调作用,以甲胺磷更为明显,提示存在反馈调节机制。总结上述结果,我们发现苯线磷对TF-1细胞中AChE的抑制作用总体略强于甲胺磷,而甲胺磷对AChE基因表达的反馈上调作用更明显。从而首次从对AChE酶的直接抑制作用和生物合成影响的不同角度阐述了2个OPs对AChE影响的差异,为进一步的分子机制研究提供了实验数据。 展开更多
关键词 苯线磷 甲胺磷 乙酰胆碱酯酶(AChE) 人血液白血病细胞tf-1
下载PDF
融合条件熵和TF-IDF的过采样方法 被引量:1
11
作者 胡宏章 邱云飞 郭蕾 《计算机时代》 2023年第6期48-53,共6页
针对非均衡数据带来的分类器对少数类样本学习不充分的问题,提出融合条件熵和TF-IDF的过采样方法。该方法首先指定参数,组合数据特征,然后计算每种组合方式下的条件熵,判断每种组合条件下类的不确定性,同时为了避免低词频带来的噪音数据... 针对非均衡数据带来的分类器对少数类样本学习不充分的问题,提出融合条件熵和TF-IDF的过采样方法。该方法首先指定参数,组合数据特征,然后计算每种组合方式下的条件熵,判断每种组合条件下类的不确定性,同时为了避免低词频带来的噪音数据,将条件熵结果乘上1/TF-IDF因子,再将结果按升序排序,最后结合参数选定过采样依据的特征组合,用以构造新数据,使正负样本平衡。将所提方法在7个不均衡数据集上进行实验仿真,结果表明,所提方法比其他方法在F-measure、G-mean和AUC等评价指标上均有一定提高。 展开更多
关键词 非均衡数据 条件熵 tf-IDF 过采样
下载PDF
一种结合TF-IDF和Simhash的科技项目文本相似性度量方法 被引量:3
12
作者 孙北宁 吕维新 +1 位作者 曾俊 肖衡 《电子技术应用》 2023年第6期89-93,共5页
为了提高科技项目文本相似性度量的准确性和性能,将TF-IDF和Simhash相结合,提出了一种新的科技项目文本相似性度量方法。首先,该方法对科技项目文本进行预处理得到词项集合,再使用TF-IDF计算词项集合中每个词项的权重值,并选取具有较高... 为了提高科技项目文本相似性度量的准确性和性能,将TF-IDF和Simhash相结合,提出了一种新的科技项目文本相似性度量方法。首先,该方法对科技项目文本进行预处理得到词项集合,再使用TF-IDF计算词项集合中每个词项的权重值,并选取具有较高权重值的重要词项;其次,使用Simhash把重要词项映射为固定长度的二进制串,并求和得到文本的Simhash签名;最后,使用汉明距离计算两个Simhash签名间的相似性。实验结果表明,所提方法在查准率、召回率和F度量值方面优于传统的Simhash算法和TF-IDF方法。 展开更多
关键词 科技项目文本 文本相似度 tf-IDF Simhash算法
下载PDF
基于转录组挖掘不同碳源条件下解淀粉芽孢杆菌TF28脂肽合成相关基因
13
作者 闫更轩 王向向 +3 位作者 田缘 刘治廷 张淑梅 夏海华 《湖北农业科学》 2023年第5期172-178,共7页
以解淀粉芽孢杆菌(Bacillus amyloliquefaciens)TF28为供试菌株,设置葡萄糖组(对照)、果糖组、木糖组3个实验组,通过转录组测序鉴定差异基因,分别对差异基因进行功能分析,挖掘脂肽合成调控基因。果糖组共鉴定到差异基因688个,上调基因52... 以解淀粉芽孢杆菌(Bacillus amyloliquefaciens)TF28为供试菌株,设置葡萄糖组(对照)、果糖组、木糖组3个实验组,通过转录组测序鉴定差异基因,分别对差异基因进行功能分析,挖掘脂肽合成调控基因。果糖组共鉴定到差异基因688个,上调基因522个,下调基因166个;木糖组共鉴定到差异基因855个,上调基因691个,下调基因164个。不同碳源改变了解淀粉芽孢杆菌TF28脂肽合成群体感应系统、双组分系统全局调控因子的表达水平,并影响脂肽必需氨基酸及脂肪酸的合成代谢,为进一步研究脂肽合成的生物学调控机制提供参考。 展开更多
关键词 脂肽 解淀粉芽孢杆菌(Bacillus amyloliquefaciens) tf28 转录组 差异基因
下载PDF
依赖IL-5增殖的细胞株TF-1-9E3的驯化及验证
14
作者 李诗洁 代维燕 +5 位作者 王雪莲 柯文锋 韩飞 陈永奇 刘畅 白仲虎 《生物学杂志》 CAS CSCD 北大核心 2023年第6期109-114,共6页
在IL-5靶点药物的发现阶段,为评价候选药物的阻断活性,需建立依赖IL-5增殖且信噪比高、重现性好的检测用细胞株。TF-1是人白血病细胞,其生长完全依赖IL-3或GM-CSF,而IL-5与IL-3和GM-CSF共用β(βc)受体,因此,研究以GM-CSF依赖的TF-1细... 在IL-5靶点药物的发现阶段,为评价候选药物的阻断活性,需建立依赖IL-5增殖且信噪比高、重现性好的检测用细胞株。TF-1是人白血病细胞,其生长完全依赖IL-3或GM-CSF,而IL-5与IL-3和GM-CSF共用β(βc)受体,因此,研究以GM-CSF依赖的TF-1细胞株为来源,用IL-5替换TF-1细胞生长必需的生长因子GM-CSF,降低血清含量进行细胞驯化培养传代。通过35 d的细胞驯化及3~5次降血清传代培养,采用有限稀释法分离单克隆,一共得到14个单克隆细胞株。对14株细胞进行FACS检测,其中,有9个细胞株IL-5Rα表达量升高。对IL-5Rα过表达的细胞株进行IL-5增殖检测,结果表明,相比8%FBS得到的单克隆,6%FBS得到的单克隆对IL-5刺激更敏感。通过单因素优化实验,细胞增殖检测最优的细胞接种量为2×10^(4)个/孔,FBS含量为3%,血清品牌为Gibco。驯化后的细胞TF-1-9E3对IL-5的剂量-效应曲线的信噪比为3.19,Emax区间为2.15,可用于IL-5的生物学活性检测及IL-5与IL-5Rα的抗体阻断活性检测。 展开更多
关键词 IL-5 tf-1细胞 增殖 阻断活性 细胞驯化
下载PDF
基于差异化建模与TF-IDF算法的城市功能区识别及混合度测算
15
作者 赖桂君 赵冠伟 杨木壮 《测绘与空间地理信息》 2023年第2期89-93,共5页
基于POI性质、特点的不同,本文构建了一个融合统计分析法、核密度分析法的城市功能区定量识别模型,有效地识别出了广州市中心四区的功能区类型。利用耦合TF-IDF算法和信息熵算法测算城市功能混合度并进行面积加权,使得城市功能混合度测... 基于POI性质、特点的不同,本文构建了一个融合统计分析法、核密度分析法的城市功能区定量识别模型,有效地识别出了广州市中心四区的功能区类型。利用耦合TF-IDF算法和信息熵算法测算城市功能混合度并进行面积加权,使得城市功能混合度测算更加符合实际情况。研究结果表明:广州市中心城区呈现出混合用地为主的特征,总体混合程度高。混合用地主要分布在研究区中心,单一类型用地零星分布在研究区外围,呈现出显著的“核心-外围”式的圈层化分布格局。城市功能混合度呈现“中心高,四周低”“多中心,组团式”、空间梯度差异显著的分布特征,并且功能混合程度与发展水平有一定正相关关系;功能分区结果与混合密度情况分布较为一致,表明本研究方法可行、研究结果合理。 展开更多
关键词 POI 城市功能区 混合度 分类模型 tf-IDF
下载PDF
基于TF-IDF和VOSviewer的我国应急救援现状可视化分析
16
作者 黄萍 张文龙 +2 位作者 叶圣琳 余君 余龙星 《中国安全科学学报》 CAS CSCD 北大核心 2023年第11期196-205,共10页
为有效利用消防救援队伍的实战记录资料挖掘应急救援战例成功经验,结合词频-逆文档频率(TF-IDF)算法和VOSviewer文献可视化分析技术,构建战例资料分析模型,分析战例成功与失败的共性规律和特点,总结我国应急救援现状及发展趋势。模型以2... 为有效利用消防救援队伍的实战记录资料挖掘应急救援战例成功经验,结合词频-逆文档频率(TF-IDF)算法和VOSviewer文献可视化分析技术,构建战例资料分析模型,分析战例成功与失败的共性规律和特点,总结我国应急救援现状及发展趋势。模型以2007—2019年间共185起应急救援典型战例为数据库,按照自然灾害、交通事故、建筑坍塌、危化品泄漏、火灾扑救等应急救援行动类型展开分析。结果表明:我国应急救援行动的影响因素主要表现在人(救援队伍)、机(装备技术)、环(环境)、管(管理)4个方面。其中,环境因素的影响几乎都是负面的,其他3个因素均有正负面影响。此外,不同应急救援行动类型的主导影响因素存在差异,自然灾害突出“机”;交通事故突出“管”;建筑坍塌突出“机”“环”;危化品泄漏在“人机环管”4个方面均有突出问题;火灾救援突出“机”。 展开更多
关键词 词频-逆文档频率(tf-IDF) VOSviewer 应急救援 消防救援 可视化分析 战例分析
下载PDF
基于异构信息网络与TF-IDF的核心药物发现算法 被引量:1
17
作者 梁尘逸 姚远哲 《计算机时代》 2023年第5期31-35,共5页
提出一种基于异构信息网络和TF-IDF的核心药物发现算法。其核心思想是建立包含症状、方剂等多种类型对象的异构信息网络,并使用PathSim算法得到方剂之间的相似度来完成方剂聚类。以此为基础使用综合了剂量因素与TD-IDF算法原理的药物重... 提出一种基于异构信息网络和TF-IDF的核心药物发现算法。其核心思想是建立包含症状、方剂等多种类型对象的异构信息网络,并使用PathSim算法得到方剂之间的相似度来完成方剂聚类。以此为基础使用综合了剂量因素与TD-IDF算法原理的药物重要性系数计算方法完成核心药物发现。本文从《伤寒论》的方剂中划分出9个主要聚类并给出了各个聚类上重要性排名前5的药物,该算法可以考虑到多方面的信息,合理地挖掘出核心药物。 展开更多
关键词 异构信息网络 PathSim tf-IDF 聚类 核心药物
下载PDF
基于LDA-TF-IDF和Word2vec文档表示 被引量:1
18
作者 彭俊利 王少泫 +1 位作者 陆正球 李兴远 《浙江纺织服装职业技术学院学报》 2023年第2期91-96,共6页
针对自然语言处理中传统文档表示方法上下文语义信息不全,干扰词多等问题,提出了一种基于LDA-TFIDF和Word2vec的文档表示方法。首先对数据集进行分词、去停用词等预处理;其次,利用LDA主题模型和TF-IDF抽取文档中具有表征性的特征词,并... 针对自然语言处理中传统文档表示方法上下文语义信息不全,干扰词多等问题,提出了一种基于LDA-TFIDF和Word2vec的文档表示方法。首先对数据集进行分词、去停用词等预处理;其次,利用LDA主题模型和TF-IDF抽取文档中具有表征性的特征词,并计算对应权重;最后,应用数据集训练Word2vec模型获取词向量,并将抽取的特征词权重融入Word2vec词向量构建文档语义向量。通过分类任务对该方法进行验证,实验结果表明,与已有方法相比该方法在垃圾短信数据集上表现效果更佳,验证了方法的有效性。 展开更多
关键词 LDA主题模型 tf-IDF word2vec 文档表示
下载PDF
基于情感指数和TF-IDF词频分析的高客单价商品物流影响因素研究
19
作者 孔茹佳 汪传雷 +2 位作者 支茁 李慧 赵林子 《物流工程与管理》 2023年第7期13-17,32,共6页
随着数字经济的发展和生活水平的提高,电商平台中高客单价商品的销量不断增加,在线评论成为影响消费者购买决策的关键要素之一。针对京东平台的在线评论数据,提出一种基于情感指数和TF-IDF词频分析的高客单价商品情感指数计算模型来量... 随着数字经济的发展和生活水平的提高,电商平台中高客单价商品的销量不断增加,在线评论成为影响消费者购买决策的关键要素之一。针对京东平台的在线评论数据,提出一种基于情感指数和TF-IDF词频分析的高客单价商品情感指数计算模型来量化消费者情感指数,采用灰色关联分析法探索消费者物流服务情感指数与消费者总情感指数的相关性,结果表明消费者物流服务情感指数与消费者总情感指数之间的关联度极高,挖掘出对高客单价商品消费者情感影响较大的五个关键物流因素:配送、安装、服务态度、售后服务以及包装。 展开更多
关键词 在线评论 情感分析 tf-IDF 高客单价商品
下载PDF
Python语言在自动化拷贝eSeis节点仪器TF卡数据中的应用
20
作者 王磊 张庆 +2 位作者 张霆 黄铂 翟立军 《物探装备》 2023年第6期387-390,共4页
陆上地震勘探技术发展迅猛,随着“两宽一高”地震勘探技术和陆上节点仪器的大规模应用,东方地球物理公司自主研发的eSeis系列节点仪器已经应用超过30万道。野外施工过程中会出现因节点单元故障导致数据下载失败的情况,为了保证地震数据... 陆上地震勘探技术发展迅猛,随着“两宽一高”地震勘探技术和陆上节点仪器的大规模应用,东方地球物理公司自主研发的eSeis系列节点仪器已经应用超过30万道。野外施工过程中会出现因节点单元故障导致数据下载失败的情况,为了保证地震数据完整性,通常的解决办法是人工拷贝eSeis节点单元内部TF卡中地震数据,这种方式效率低且易出错,本文介绍一种使用Python编程语言编写的自动化拷贝eSeis节点单元内部TF卡中地震数据的软件,详细阐述软件的开发思路、过程和结果,最后给出了软件的应用效果。 展开更多
关键词 PYTHON eSeis tf 数据拷贝
下载PDF
上一页 1 2 91 下一页 到第
使用帮助 返回顶部