-
题名基于语义框架的电网缺陷文本挖掘技术及其应用
被引量:83
- 1
-
-
作者
曹靖
陈陆燊
邱剑
王慧芳
应高亮
张波
-
机构
浙江大学电气工程学院
国网浙江金华供电公司
-
出处
《电网技术》
EI
CSCD
北大核心
2017年第2期637-643,共7页
-
文摘
电网企业拥有大量蕴含着重要可靠性信息的设备缺陷文本,依靠人工进行挖掘不仅效率低而且准确性因人而异。以变压器缺陷文本为研究对象,通过分析文本的特点,建立了基于语义框架的电网缺陷文本挖掘模型,解决了缺陷文本句子成分难以划分、数字量无法精确提取等问题,为电网领域的非结构化数据挖掘提供了新技术。首先在建立本体词库基础上,对缺陷文本进行分词、词汇特征提取等预处理;然后定义了电力语义框架与语义槽,提出了槽填充和语义框架构建流程,并通过词串合并实现了本体字典自动完善;最后对缺陷文本挖掘结果在可靠性统计中的应用进行了研究。算例表明,所提出的挖掘技术应用于电网缺陷自动分类与统计中,具有可行性和有效性。
-
关键词
文本挖掘
语义框架
可靠性统计
缺陷文本
-
Keywords
text mining
semantic framework
reliability statistics
defect text
-
分类号
TM72
[电气工程—电力系统及自动化]
-