-
题名基于约束条件随机场的Web对象属性标注
- 1
-
-
作者
吴秦
黄彦姣
-
机构
江南大学物联网工程学院
-
出处
《计算机科学与探索》
CSCD
2014年第9期1129-1136,共8页
-
基金
国家自然科学基金
教育部留学回国人员科研启动基金资助项目~~
-
文摘
条件随机场模型是目前处理Web对象属性标注问题的最佳统计模型。为解决条件随机场模型不能充分利用Web对象和属性标签之间的特征关系这一问题,提出了一种增强约束条件随机场模型。借鉴最大间隔的思想,在原有条件随机场模型中增加约束条件和增强因子以提高模型标注正确率。使用最大似然参数估计方法估计模型特征函数的权重参数,并用Viterbi算法进行预测。在数据集中引入验证集的概念,以获得最优增强因子。实验结果表明,该模型有效地提高了Web对象属性标注正确率。
-
关键词
约束条件随机场
增强因子
属性标注
WEB对象
最大间隔
-
Keywords
constrained conditional random fields
boosting factor
attribute labeling
Web object
maximum margin
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于增强约束条件随机场的Web对象信息抽取
被引量:1
- 2
-
-
作者
黄彦姣
吴秦
梁久祯
-
机构
江南大学物联网工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2015年第23期143-148,共6页
-
基金
国家自然科学基金(No.61202312
No.61170121)
-
文摘
线性链条件随机场模型难以处理Web对象与各个标注属性之间的特征关系,为解决此问题,提出一种增强约束条件随机场模型。通过将约束条件引入推理过程,改进线性链条件随机场模型的Viterbi算法;运用最大间隔理论的思想训练条件随机场模型,提高模型标注的正确率;将该模型与条件随机场模型及层次条件随机场模型进行对比。实验结果表明该模型能在提高标注正确率的基础上有效地解决Web对象信息抽取问题。
-
关键词
增强约束条件随机场
条件随机场
属性标注
WEB对象
信息抽取
-
Keywords
boosted constrained conditional random fields
conditional random fields
attribute label
Web object
infor-mation extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-