-
题名词向量嵌入在优化聚类算法中的应用
- 1
-
-
作者
肖明魁
-
机构
江苏经贸职业技术学院信管处
-
出处
《福建电脑》
2024年第9期1-6,共6页
-
文摘
为提高聚类算法处理文本数据的效率和效果,本文研究词嵌入技术在文本聚类任务中的有效性和实用性。通过对航空公司服务评论数据集的实证分析,结果显示,词向量嵌入技术能有效捕获语义信息,显著提升聚类准确性和解释性。
-
关键词
词嵌入技术
文本聚类
词向量
聚类分析
-
Keywords
Word Embedding Technology
Text Clustering
Word Vector
Cluster Analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名跨模型在用户意图理解任务中的对比研究
- 2
-
-
作者
肖明魁
-
机构
江苏经贸职业技术学院信管处
-
出处
《信息技术与信息化》
2024年第7期194-198,共5页
-
文摘
全面评估和比较三种主流机器学习模型—随机森林(random forest,RF)、LightGBM(LGBM)与XGBoost在用户意图理解任务中的效能表现。针对当前用户意图识别精度尚存提升空间的问题,提出采用多样化的模型策略来优化预测效果。研究方法上,首先对数据集进行了细致的预处理,包括数据清洗、缺失值处理以及特征选择等步骤;接着,对每种模型实施了精细的参数调优,利用网格搜索和随机搜索策略寻找最优配置。研究内容涵盖了模型的训练、验证及测试全过程,获得模型在不同参数设置下的准确率、召回率及F1分数等关键指标。实验结果表明,XGBoost在经过参数优化后,在用户意图理解任务上取得了最佳的整体性能,随机森林则展现出了良好的稳健性,而LGBM在训练速度上占据优势。
-
关键词
机器学习
随机森林
分类模型
参数优化
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-