题名 基于改进TF-IDF特征的中文文本分类系统
被引量:12
1
作者
但唐朋
许天成
张姝涵
机构
华中师范大学计算机学院
出处
《计算机与数字工程》
2020年第3期556-560,共5页
基金
华中师范大学国家级大学生创新创业训练计划(编号:201810511002)
华中师范大学院级大学生创新创业训练计划(编号:CA20180418221834349C)资助。
文摘
随着Internet技术的发展,人们不仅可以从网络获取信息,也能够在网络上表达个人观点、分享自身体验。自Web2.0以来网络已经由原来的阅读式网络转换成为了当今的交互式网络。而伴随网络发展的是成几何速率增长的网络信息。文本信息是网络信息的重要组成部分,不同文本信息可以分成新闻、娱乐、时评、财经等不同类别。进行中文文本分类不仅能为建立文本语料库提供便利还能够应用到其它数据挖掘领域。论文基于改进TF-IDF特征并结合SVM模型设计了一种自动化的中文文本分类系统。实验证明,对比传统特征提取方式,采用改进TF-IDF特征策略进行文本分类能够获得更高的准确度。
关键词
文本分类
自然语言处理
BOW模型
机器学习
改进TF-IDF特征
Keywords
text classification
natural language processing
BOW model
machine learning
improved TF-IDF feature
分类号
P315.69
[天文地球—地震学]
题名 基于虚假评论识别的微博评论情感分析的研究与应用
被引量:4
2
作者
罗昌银
但唐朋
李艳红
陈昌昊
王泰
机构
华中师范大学计算机学院
中南民族大学计算机科学学院
华中师范大学国家数字化学习工程技术研究中心
出处
《计算机应用与软件》
北大核心
2019年第4期55-62,共8页
基金
国家自然科学基金项目(61309002)
湖北省自然科学基金项目(2017CFB135)
+1 种基金
中央高校基金项目(CCNU18QN017
CZZ17003)
文摘
微博作为时下热门的社交网络平台,针对其所产生的评论文本进行情感分析已经成为人工智能领域的一个研究热点。考虑到虚假评论会降低情感分析的准确度,从评论用户的状态和行为出发,提出一种基于用户状态与行为的可信度评价体系,用于提取虚假评论特征。结合该特征与PU(Positive and unlabeled)学习算法进行虚假评论识别;运用SVM分类器和随机梯度下降回归模型对去除虚假评论的文本进行主观句分类与情感分析。实验表明,进行虚假评论识别后的情感分析准确率、召回率分别达到0.88和0.89,比传统方法具有更高的分析效能。
关键词
机器学习
情感分析
自然语言处理
虚假评论识别
PU学习算法
Keywords
Machine learning
Sentimental analysis
Natural language processing
Fake comments recognition
Positive and unlabeled learning
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
题名 基于YOLO模型的目标检测软件
被引量:2
3
作者
但唐朋
柴永磊
姚祉含
机构
华中师范大学计算机学院
出处
《科技视界》
2019年第21期118-119,共2页
基金
华中师范大学创新创业训练计划(105112019020055)
文摘
人工智能领域的发展拖动着社会的进步,而作为人工智能领域的重要部分,图像识别近年来受到了学术界与工业界的广泛关注。图像识别中的目标检测技术能够帮助人们实现自动驾驶、无人机导航、图像检索等应用。而YOLO模型的提出极大地提高了目标检测任务的效率,使得我们可以在本地搭建起系统来完成实时目标检测。本文从YOLO模型出发,对比了基于YOLO模型的深度学习方法与传统目标检测算法的差异,并利用YOLO模型进行编程在桌面端实现了目标检测。
关键词
目标检测
YOLO模型
应用实现
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
题名 基于位置的发布/订阅索引结构
被引量:3
4
作者
罗昌银
唐玉茹
李子蹊
李艳红
但唐朋
机构
华中师范大学计算机学院
法国国立应用科学学院机械系
中南民族大学计算机科学学院
出处
《中南民族大学学报(自然科学版)》
CAS
2019年第2期285-290,共6页
基金
国家自然科学基金资助项目(61309002)
湖北省自然科学基金资助项目(2017CFB135)
+1 种基金
中央高校基本科研业务费专项资金资助项目(CCNU18QN017,CZZ17003)
中南民族大学2017年教研项目(JYX17032)
文摘
为了使空间文本数据的处理更加快捷准确,针对基于位置的发布/订阅提出了将R-tree与布尔表达式有效结合的索引结构TR-tree.TR-tree主要由文本索引与空间索引组成,其中文本索引根据订阅中谓词的数量和不同的关键谓词将空间文本数据进行订阅分组和谓词分组.文本索引中使用了操作符列表储存谓词,以达到避免重复储存谓词、减少内存使用的目的.空间索引根据关键谓词与谓词数量构建不同的R-tree,增强了空间修剪的性能.实验结果表明TR-tree具有高效的匹配能力与较好的内存管理性能.
关键词
空间关键词
基于位置的发布/订阅
索引结构
布尔表达式
Keywords
spatial keyword
location-aware publish/subscribe
index structure
Boolean expression
分类号
TP319.56
[自动化与计算机技术—计算机软件与理论]
题名 基于QQBot的个人资讯管理系统设计与实现
5
作者
许天成
张姝涵
但唐朋
王思懿
机构
华中师范大学计算机学院
出处
《电子技术与软件工程》
2018年第3期70-71,共2页
文摘
随着信息技术的发展,用户自身的描述性信息也变得更加复杂。大数据时代下的个人信息与传统的个人信息不同,不仅含有较多维度且具有时空特性。为了解决这种情况下用户个人资讯难以管理的问题,本文设计了一种基于QQBot的个人资讯管理系统。本系统从多个角度管理用户的资讯信息,功能丰富高效且不臃肿,实现了对复杂的个人资讯的有效管理。
关键词
个人信息管理
移动社交网络
移动计算
QQBot
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]