-
题名知识图谱增强的科普文本分类模型
被引量:1
- 1
-
-
作者
唐望径
许斌
仝美涵
韩美奂
王黎明
钟琦
-
机构
清华大学计算机科学与技术系
北京交通大学计算机与信息技术学院
清华大学深圳国际研究生院
中国科普研究所
-
出处
《计算机应用》
CSCD
北大核心
2022年第4期1072-1078,共7页
-
基金
中国科普研究所2020年委托合作项目“自然语言处理方法在科普领域的应用研究”(200110EMR028)支持。
-
文摘
科普文本分类是将科普文章按照科普分类体系进行划分的任务。针对科普文章篇幅超过千字,模型难以聚焦关键信息,造成传统模型分类性能不佳的问题,提出一种结合知识图谱进行两级筛选的科普长文本分类模型,来减少主题无关信息的干扰,提升模型的分类性能。首先,采用四步法构建科普领域的知识图谱;然后,将该知识图谱作为距离监督器,并通过训练句子过滤器来过滤掉无关信息;最后,使用注意力机制对过滤后的句子集做进一步的信息筛选,并实现基于注意力的主题分类模型。在所构建的科普文本分类数据集(PSCD)上的实验结果表明,基于领域知识图谱的知识增强的文本分类算法模型具有更高的F1-Score,相较于TextCNN模型和BERT模型,在F1-Score上分别提升了2.88个百分点和1.88个百分点,验证了知识图谱对于长文本信息筛选的有效性。
-
关键词
科普文本分类
知识图谱
两级筛选
长文本分类
注意力
-
Keywords
popular science text classification
knowledge graph
two-level screening
long text classification
attention
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名智能垃圾分类监管系统
- 2
-
-
作者
马俊杰
岳坤
雷雨晴
韩韧
-
机构
上海理工大学光电信息与计算机工程学院
上海理工大学管理学院
-
出处
《软件工程与应用》
2022年第1期160-170,共11页
-
文摘
本文设计了一种系统可通过智能垃圾桶及垃圾分类移动应用程序对垃圾类型进行有效识别。系统将保留投错类型、投放时间、地点、垃圾截图等一些列数据,通过政府监控系统获取垃圾错投人员相关信息,并以短信方式告知该人员。通过短信还可下载移动应用查看违规记录,依靠强制力手段规范居民垃圾分类行为。针对用户的垃圾分类情况对其进行相应积分的加减。积分进行等级划分,不同等级者将获得不同奖励。针对难以有效辨别垃圾类型的用户,可使用基于MobileNet技术的移动应用垃圾分类识别功能帮助他们学习识别垃圾类型。为了提高垃圾投放站点使用效率,该系统可收集投放参数,整合数据,计算最佳投放时间及投放地点。该系统通过普及知识,强制管理,等级奖励制度,优化投放点设置等方法推进实现垃圾分类的目标。
-
关键词
垃圾分类
智能识别
分类科普
-
分类号
X705
[环境科学与工程—环境工程]
-