期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于文本机器学习的轨道交通运行故障智能分类方法研究
1
作者
陈德威
张曙皓
吕陈浩
《中国科技期刊数据库 工业A》
2022年第6期186-189,共4页
本系统基于TF-IDF算法和朴素贝叶斯分类算法对轨道交通运行故障文本进行分类。TF-IDF由两部分组成。TF即词频。我们把原始数据转换为向量特征,目的是将事故文本中各个词的出现频率进行统计,并以此作为事故文本特征,根据统计的词条出现...
本系统基于TF-IDF算法和朴素贝叶斯分类算法对轨道交通运行故障文本进行分类。TF-IDF由两部分组成。TF即词频。我们把原始数据转换为向量特征,目的是将事故文本中各个词的出现频率进行统计,并以此作为事故文本特征,根据统计的词条出现频率进行初步划分。而IDF指的是逆文本频率,通过这个值可以体现出一个词在全部的文本中出现的频率,如果一个词在较多的文本中出现,那么它的IDF值应该低,反之,若一个词在较少的文本中出现,那么它的IDF值应该高。因此,IDF值表示这个词的重要程度,通过对IDF值的计算,进而修正仅仅使用词频来表示的词频特征值。朴素贝叶斯分类算法是统计学的贝叶斯算法中最简单的一种,它在进行文本分类的时候只做了最原始、最简单的分辨。朴素贝叶斯要求特征之间相互独立并且每个特征的重要性是相同的。在应用实现铁路事故文本分类时,拥有在属性相关性较小时效果好,可处理多类别的分类问题的有点,其算法逻辑简单且易于实现。
展开更多
关键词
文本分类
TF-IDF
机器学习
轨道交通
朴素贝叶斯
下载PDF
职称材料
题名
基于文本机器学习的轨道交通运行故障智能分类方法研究
1
作者
陈德威
张曙皓
吕陈浩
机构
北京交通大学
出处
《中国科技期刊数据库 工业A》
2022年第6期186-189,共4页
文摘
本系统基于TF-IDF算法和朴素贝叶斯分类算法对轨道交通运行故障文本进行分类。TF-IDF由两部分组成。TF即词频。我们把原始数据转换为向量特征,目的是将事故文本中各个词的出现频率进行统计,并以此作为事故文本特征,根据统计的词条出现频率进行初步划分。而IDF指的是逆文本频率,通过这个值可以体现出一个词在全部的文本中出现的频率,如果一个词在较多的文本中出现,那么它的IDF值应该低,反之,若一个词在较少的文本中出现,那么它的IDF值应该高。因此,IDF值表示这个词的重要程度,通过对IDF值的计算,进而修正仅仅使用词频来表示的词频特征值。朴素贝叶斯分类算法是统计学的贝叶斯算法中最简单的一种,它在进行文本分类的时候只做了最原始、最简单的分辨。朴素贝叶斯要求特征之间相互独立并且每个特征的重要性是相同的。在应用实现铁路事故文本分类时,拥有在属性相关性较小时效果好,可处理多类别的分类问题的有点,其算法逻辑简单且易于实现。
关键词
文本分类
TF-IDF
机器学习
轨道交通
朴素贝叶斯
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于文本机器学习的轨道交通运行故障智能分类方法研究
陈德威
张曙皓
吕陈浩
《中国科技期刊数据库 工业A》
2022
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部