-
题名基于句法CYK图神经网络的知识增强文本分类
- 1
-
-
作者
章巍
陈学奇
韩剑锋
虞小江
吴海燕
-
机构
浙江浙能临海海上风力发电有限公司
杭州蓝城新能源科技有限公司
浙江财经大学信息技术与人工智能学院
-
出处
《计算机应用》
CSCD
北大核心
2024年第S01期11-17,共7页
-
基金
国家自然科学基金资助项目(62306267)
浙江省自然科学基金资助项目(LY22F020027)。
-
文摘
句子分类方法主要分为基于特征工程的机器学习方法、序列化模型和结构化模型,但基于特征工程的机器学习方法对词序不敏感易产生稀疏向量,序列化模型忽略了句子的短语、依存关系等句法结构信息,结构化模型如句法树、二叉树等的准确率受句法解析工具影响。针对上述问题,构建基于句法CYK(Cocke Younger Kasami)图神经网络(GNN)的知识增强文本分类模型S-CYK,对输入句子分别构建对应的短语树和CYK图以形成句法CYK图,并利用关系图注意力网络(RGAT)进行句子分类。在公共数据集AG’s News、DBpedia、ARP(Amazon Review Polarity)和ARF(Amazon Review Full)上的实验结果表明,与现有先进模型半监督变分自编码器(SSVAE)、对抗性微调BERT(AFTB)、基于GloVe的ABLSTM(GloVe+ABLSTM)和融合FastText的CNN(CNN with FastText)相比,S-CYK模型在4个数据集的准确率提升了0.04%~1.21%。S-CYK使用句法CYK图结构进行知识增强,能有效增强聚合句子信息的能力。
-
关键词
句法知识
CYK算法
知识增强
图神经网络
文本分类
-
Keywords
syntactic knowledge
CYK(Cocke Younger Kasami)algorithm
knowledge enhancement
Graph Neural Network(GNN)
text classification
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名游台湾阿里山
- 2
-
-
作者
虞小江
-
机构
浙江省嘉善县实验小学
-
出处
《生活教育》
2013年第10期114-114,共1页
-
文摘
七月三日上午,我们台湾游学团去游阿里山。
阿里山平均海拔2000米左右,在台湾嘉义县东北。在夏天人们称它为"避暑胜地"。阿里山的资源和自然景观极为丰富,日出、云海、晚霞、铁道与神木列为"阿里山五奇",阿里云海被列为名胜台湾八景之一。我们沿着山路驱车一小时,又走了一段山路后,就到了山脚的小站,乘坐小火车到神木。到了神木,一股清新的空气沁人心脾,在阿里山主峰的神木车站东侧,
-
关键词
阿里山
台湾地区
避暑胜地
自然景观
嘉义县
云海
山路
-
分类号
F592.7
[经济管理—旅游管理]
-