摘要
针对信息安全领域命名实体具有的更新换代快、中英文混杂多、缩写使用不规范等特点,提出了一种基于主动学习条件随机场的信息安全领域命名实体识别方法。建立附带权重的信息安全领域专业词库,按照词库中的权重顺序匹配并标注训练样本训练模型,最后对识别出的正确词汇更新其权重。实验表明,该方法能提高命名实体识别的准确率和召回率,正确识别的命名实体会后续识别产生正促进的影响,并能显著降低人工标注的工作量。
出处
《通信与信息技术》
2016年第1期61-63,共3页
Communication & Information Technology