-
题名基于预训练模型的无监督剧本摘要
被引量:1
- 1
-
-
作者
苏琦
王红玲
王中卿
-
机构
苏州大学计算机科学与技术学院
-
出处
《计算机科学》
CSCD
北大核心
2023年第2期310-316,共7页
-
基金
国家自然科学基金(61976146)。
-
文摘
剧本是一种特殊的文本结构,以人物的对话和对场景的描述信息组成文本。无监督剧本摘要是指对篇幅很长的剧本进行压缩、提取,形成能够概括剧本信息的短文本。提出了一种基于预训练模型的无监督剧本摘要方法,首先在预训练过程中通过增加对文本序列处理的预训练任务,使得预训练生成的模型能够充分考虑剧本中对话的场景描述及人物说话的情感特点,然后使用该预训练模型作为训练器计算剧本中的句间相似度,结合TextRank算法对关键句进行打分、排序,最终抽取得分最高的句子作为摘要。实验结果表明,该方法相比基准模型方法取得了更好的效果,系统性能在ROUGE评价上有显著的提高。
-
关键词
训练模型
预训练任务
剧本摘要
无监督
句间相似度
对话
-
Keywords
Pre-trained model
Pre-training task
Script summary
Unsupervised
Sentence similarity
Dialogue
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-