-
题名基于时间递归序列模型的短文本语义简化
- 1
-
-
作者
蔺伟斌
杨世瀚
-
机构
广西民族大学软件与信息安全学院
昆明理工大学管理与经济学院
-
出处
《物联网技术》
2019年第5期57-62,共6页
-
基金
广西"八桂学者"专项资助
广西民族大学研究生教育创新计划项(gxun-chxzs2017116)
-
文摘
针对传统循环神经网络训练算法无法处理梯度消失和梯度爆炸等问题,基于循环神经网络建立LSTM模型和seq2seq模型,提出时间递归序列模型TRSM,处理序列中间隔和延迟相对较长的输入,使用BPTT反向传播算法对中文微博语料库进行训练。建立三组不同的实验作为对比,实验结果表明,TRSM模型处理后的微博文本更加简洁精炼,更适合文本语义的提取,大大减少了计算量,文字缩减率达到60%以上,语义保持率达到1.8,简化了用户要处理的大量信息,处理后的结果能够更好地用于几个关键中文语义的处理任务。
-
关键词
短文本信息
文本简化
LSTM模型
trsm模型
BPTT反向传播算法
循环神经网络
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-