在现有的新闻领域标注语料库研究的基础上,结合时政新闻文本的特点,构建了面向时政新闻文本的事件标注语料库(event annotation corpus for current political news,EACPN)。EACPN从事件元素、人物角色及事件子类别等多个层面对21455篇...在现有的新闻领域标注语料库研究的基础上,结合时政新闻文本的特点,构建了面向时政新闻文本的事件标注语料库(event annotation corpus for current political news,EACPN)。EACPN从事件元素、人物角色及事件子类别等多个层面对21455篇时政新闻进行标注,涵盖了128523个事件元素和17919个子类别,整体标注一致性达到85.9%。所构建的EACPN为今后的时政新闻文本事件抽取研究和事件知识图谱构建提供了数据基础。展开更多
文摘在现有的新闻领域标注语料库研究的基础上,结合时政新闻文本的特点,构建了面向时政新闻文本的事件标注语料库(event annotation corpus for current political news,EACPN)。EACPN从事件元素、人物角色及事件子类别等多个层面对21455篇时政新闻进行标注,涵盖了128523个事件元素和17919个子类别,整体标注一致性达到85.9%。所构建的EACPN为今后的时政新闻文本事件抽取研究和事件知识图谱构建提供了数据基础。