-
题名基于语义分析的政策法规智能审核研究与实现
被引量:3
- 1
-
-
作者
衡宇峰
李俊
彭望龙
黄元稳
房冬丽
-
机构
中国电子科技网络信息安全有限公司
中国电子科技集团公司第三十研究所
-
出处
《通信技术》
2020年第4期937-942,共6页
-
文摘
随着人工智能应用越来越广泛,自然语言处理技术得到了快速发展。针对文本的语义分析、比对,一直是研究的热点与难点。因此,在自然语言处理语义相似度相关算法研究的基础上,针对垂直领域中的政策法规,依据政策法规用语规范、构成具有一定规律的特点,采用词向量、句法分析、深度神经网络LSTM模型结合规则库的一种多特征融合语义分析与比对方法,对政策法规进行智能审核,并通过相关实验证明了此方法的有效性。
-
关键词
自然语言处理
词向量
LSTM模型
语义相似度
-
Keywords
natural language process
word vector
LSTM model
semantic similarity
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种自动构建数据集的实体关系抽取方法
被引量:2
- 2
-
-
作者
房冬丽
陈正雄
黄元稳
衡宇峰
-
机构
中国电子科技集团公司第三十研究所
-
出处
《通信技术》
2021年第8期1862-1868,共7页
-
文摘
近年来,知识图谱领域中实体关系抽取技术得到快速发展,其准确性也大幅提升。然而,大部分文献都没有提供能够反映其内容的、直观的数据结构。依靠人工阅读文本产生实体、关系的方法,在多源、海量文档数据的今天越来越不能满足实际应用的需求,因此提出一种抽取文本中实体关系的方法。该方法基于哈工大语言技术平台(Language Technology Plantform,LTP)和双向编码器(Bidirectional Encoder Representations from Transformer,BERT)模型,可对文本内容实现自动化解析,解决了数据集生成难的问题。此外,通过对BERT模型的优化调整,解决了以往实体关系的抽取需依赖大量资源计算的问题。
-
关键词
实体
关系
抽取
语言技术平台(LTP)
双向编码器(BERT)
-
Keywords
entity
relationship
extract
LTP
BERT
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-