期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
彝文网页文本分词平台 被引量:2
1
作者 孙善通 王嘉梅 +1 位作者 李炳泽 胡刚 《计算机系统应用》 2016年第11期243-246,共4页
在机器翻译、自动分类、搜索引擎等技术中,彝文分词具有很重要的作用,同时也是彝文信息处理至关重要的环节.本文以当前的彝文分词技术为基础,通过构建彝文词库,并用彝文网页获取平台抓取彝文网页文本,结合彝文特有的优势,从分词词库、... 在机器翻译、自动分类、搜索引擎等技术中,彝文分词具有很重要的作用,同时也是彝文信息处理至关重要的环节.本文以当前的彝文分词技术为基础,通过构建彝文词库,并用彝文网页获取平台抓取彝文网页文本,结合彝文特有的优势,从分词词库、分词算法、结构流程、系统界面和模块、实验结果等方面进行了详细的分析,最终实现彝文网页文本分词平台.最后的结果表明,本平台分词准确率较高,实用性和通用性也较好. 展开更多
关键词 彝文网页 词典分词 词库 彝文分词 分词平台
下载PDF
彝文网页信息采集技术研究 被引量:3
2
作者 张建营 王嘉梅 +1 位作者 汤雪 胡刚 《网络安全技术与应用》 2014年第12期6-8,共3页
本文通过对中文网页采集流程、网络爬虫工作基本原理的分析,再结合彝文网页的特点,对彝文网页信息的采集技术进行了研究,通过聚焦网络爬虫来实现彝文网页信息的采集,并依此来建立一个内容全面的彝文网页信息资源库。
关键词 彝文网页 网络爬虫 信息采集
原文传递
彝文网络信息获取平台的研究 被引量:1
3
作者 孙善通 王嘉梅 +2 位作者 李炳泽 弓盼 胡刚 《电子技术与软件工程》 2015年第13期44-46,168,共4页
随着互联网技术的发展和广泛应用,彝文网页数量不断增多,获取彝文信息的范围也越来越大,但查询所需信息的难度也相对增加。文章通过对传统中文网络信息获取平台技术的研究分析,结合彝文网页自身的结构特点,研究了彝文网页信息采集技术... 随着互联网技术的发展和广泛应用,彝文网页数量不断增多,获取彝文信息的范围也越来越大,但查询所需信息的难度也相对增加。文章通过对传统中文网络信息获取平台技术的研究分析,结合彝文网页自身的结构特点,研究了彝文网页信息采集技术和彝文网页信息抽取技术,实现了彝文网络信息获取平台。最后对该平台进行测试,达到了预期结果。 展开更多
关键词 彝文网页 网络爬虫 信息采集 信息抽取
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部