期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于启发式规则的多记录页面分隔符识别方法
被引量:
1
1
作者
胡大洋
《软件导刊》
2009年第9期50-51,共2页
从半结构化或者非结构化的Web文档中提取信息时通常要求指定记录集的边界符,如果不根据记录边界符将包含多记录的页面分成单个记录块,那么记录的提取就不能成功。介绍了一种根据启发式的规则发现Web文档中的记录分隔符的方法,能够很好...
从半结构化或者非结构化的Web文档中提取信息时通常要求指定记录集的边界符,如果不根据记录边界符将包含多记录的页面分成单个记录块,那么记录的提取就不能成功。介绍了一种根据启发式的规则发现Web文档中的记录分隔符的方法,能够很好地解决多记录页面记录分割的问题。
展开更多
关键词
信息提取
半结构化信息
非结构化信息
记录
边界
记录分隔符
下载PDF
职称材料
一种发现多记录Web文档记录分隔符的方法
2
作者
胡大洋
陈金鑫
《计算机与信息技术》
2008年第8期10-12,共3页
从半结构化或者非结构化的Web文档中提取信息时通常要求指定记录集的边界符。如果不根据记录边界符将包含多记录的页面分成单个记录块,那么记录的提取就不能成功。本文主要介绍了一种根据启发式的规则发现Web文档中的记录分隔符的方法,...
从半结构化或者非结构化的Web文档中提取信息时通常要求指定记录集的边界符。如果不根据记录边界符将包含多记录的页面分成单个记录块,那么记录的提取就不能成功。本文主要介绍了一种根据启发式的规则发现Web文档中的记录分隔符的方法,能够很好地解决多记录页面记录分割的问题。实验证明该方法具有很高的准确性。
展开更多
关键词
信息提取
半结构化信息
非结构化信息
记录
边界
记录分隔符
原文传递
采用CNMARC格式著录时应注意的几个问题
3
作者
翟可菊
《晋图学刊》
1997年第1期48-49,共2页
关键词
CNMARC格式著录
子字段
并列题名
指示符
200字段
机读目录
标识系统
功能块
记录分隔符
著录项目
下载PDF
职称材料
巧用AWK编制查询程序
4
作者
张玉海
辛晓春
《中国金融电脑》
1996年第6期59-60,共2页
巧用AWK编制查询程序工商银行河北省张家口市分行科技科张玉海建设银行河北省张家口市分行人事处辛晓春XENIX系统是目前国内外比较流行的多用户分时操作系统,特别在金融界的应用日益广泛。银行业务由于其特殊性,大量“无用”...
巧用AWK编制查询程序工商银行河北省张家口市分行科技科张玉海建设银行河北省张家口市分行人事处辛晓春XENIX系统是目前国内外比较流行的多用户分时操作系统,特别在金融界的应用日益广泛。银行业务由于其特殊性,大量“无用”数据仍须长期保存,以备需要时查询使...
展开更多
关键词
字段
分隔符
记录分隔符
命令文件
河北省张家口市
查询程序
动作语句
正则表达式
数据库
命令行
当前
记录
下载PDF
职称材料
题名
基于启发式规则的多记录页面分隔符识别方法
被引量:
1
1
作者
胡大洋
机构
盐城工学院计算机应用中心
出处
《软件导刊》
2009年第9期50-51,共2页
文摘
从半结构化或者非结构化的Web文档中提取信息时通常要求指定记录集的边界符,如果不根据记录边界符将包含多记录的页面分成单个记录块,那么记录的提取就不能成功。介绍了一种根据启发式的规则发现Web文档中的记录分隔符的方法,能够很好地解决多记录页面记录分割的问题。
关键词
信息提取
半结构化信息
非结构化信息
记录
边界
记录分隔符
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一种发现多记录Web文档记录分隔符的方法
2
作者
胡大洋
陈金鑫
机构
盐城工学院计算机应用中心
南京师范大学教育技术系
出处
《计算机与信息技术》
2008年第8期10-12,共3页
文摘
从半结构化或者非结构化的Web文档中提取信息时通常要求指定记录集的边界符。如果不根据记录边界符将包含多记录的页面分成单个记录块,那么记录的提取就不能成功。本文主要介绍了一种根据启发式的规则发现Web文档中的记录分隔符的方法,能够很好地解决多记录页面记录分割的问题。实验证明该方法具有很高的准确性。
关键词
信息提取
半结构化信息
非结构化信息
记录
边界
记录分隔符
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
原文传递
题名
采用CNMARC格式著录时应注意的几个问题
3
作者
翟可菊
机构
山西大学师范学院图书馆
出处
《晋图学刊》
1997年第1期48-49,共2页
关键词
CNMARC格式著录
子字段
并列题名
指示符
200字段
机读目录
标识系统
功能块
记录分隔符
著录项目
分类号
G254.3 [文化科学—图书馆学]
下载PDF
职称材料
题名
巧用AWK编制查询程序
4
作者
张玉海
辛晓春
机构
工商银行河北省张家口市分行科技科
出处
《中国金融电脑》
1996年第6期59-60,共2页
文摘
巧用AWK编制查询程序工商银行河北省张家口市分行科技科张玉海建设银行河北省张家口市分行人事处辛晓春XENIX系统是目前国内外比较流行的多用户分时操作系统,特别在金融界的应用日益广泛。银行业务由于其特殊性,大量“无用”数据仍须长期保存,以备需要时查询使...
关键词
字段
分隔符
记录分隔符
命令文件
河北省张家口市
查询程序
动作语句
正则表达式
数据库
命令行
当前
记录
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于启发式规则的多记录页面分隔符识别方法
胡大洋
《软件导刊》
2009
1
下载PDF
职称材料
2
一种发现多记录Web文档记录分隔符的方法
胡大洋
陈金鑫
《计算机与信息技术》
2008
0
原文传递
3
采用CNMARC格式著录时应注意的几个问题
翟可菊
《晋图学刊》
1997
0
下载PDF
职称材料
4
巧用AWK编制查询程序
张玉海
辛晓春
《中国金融电脑》
1996
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部