-
题名基于自然语言处理技术的电网招标资料查重系统研制
被引量:9
- 1
-
-
作者
刘玉林
郭雅娟
陈锦铭
陈昊
-
机构
国网江苏省电力公司电力科学研究院
-
出处
《电力信息与通信技术》
2018年第5期11-17,共7页
-
文摘
电网公司在项目招标采购过程中,一般要对招标资料进行查重工作,在历史项目资料库中查找是否存在类似项目,以防止项目重复招标的情况发生,避免资金浪费。文章使用潜在语义索引的方法,对文档中的语义进行分析,使用自然语言处理领域的中文分词、词向量转换、词权重计算、主题建模等技术构建了一套文档相似度分析系统,可在海量历史项目资料库中快速找出与目标文档相似的项目,并计算出文档相似度百分比,辅助招标采购专职判断招标资料是否合规。系统的研究与应用,对规范电网公司项目招标采购管理具有重要实用价值。
-
关键词
文档查重
中文分词
主题建模
语义分析
相似度计算
-
Keywords
document duplicated-checking
Chinese word segmentation
theme modeling
semantic analysis
similarity calculation
-
分类号
TP319
[自动化与计算机技术—计算机软件与理论]
-