期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于有限状态自动机提取不规范表结构Web信息
1
作者 李石君 欧伟杰 +1 位作者 简伟 黄河 《武汉大学学报(工学版)》 CAS CSCD 北大核心 2005年第6期128-132,共5页
大量的不规范表结构信息是当前Web信息提取所必须解决的问题.在现有方法基础上,给出了归纳学习相邻属性间上下文规则集算法,提出了以Web页为粒度的属性转换机和有限状态自动机包装器概念,最后介绍了采用有限状态自动机包装器提取不规范... 大量的不规范表结构信息是当前Web信息提取所必须解决的问题.在现有方法基础上,给出了归纳学习相邻属性间上下文规则集算法,提出了以Web页为粒度的属性转换机和有限状态自动机包装器概念,最后介绍了采用有限状态自动机包装器提取不规范表结构Web信息的算法. 展开更多
关键词 信息提取 上下文规则集 有限状态自动机 自动机包装器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部