摘要
金融文书的自然语言处理是目前金融科技领域的研究热点,相关研究大多数着眼于传统的分词和基于机器学习的语义场景分析等有监督的学习方法,难以满足当前金融监管行业快速处理金融文本的需求。 针对这一问题,文章构建了一个基于多层 BiLSTM 的中文金融文书摘要自动生成算法框架,通过 Seq2Seq 模型,基于 Attention 模型的强化学习框架,发现最优策略,对文本进行编码、解码,从 LSTM 编码器中抽取文本序列并输出摘要。 实验结果表明,多层 BiLSTM 结构相比传统 RNN 的ROUGE 更高,具有较好的学习能力。