期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
Spark平台下的凸包问题研究 被引量:3
1
作者 李格非 马蔚吟 李力 《计算机工程与应用》 CSCD 北大核心 2018年第22期67-73,112,共8页
随着移动互联网时代的到来,越来越多的含地理位置信息的空间数据需要处理,如何在海量的空间数据中进行常见的几何查询成为一个挑战,凸包问题因其在模式识别、图像处理、统计学、地理信息系统、博弈论、图论等领域中被广泛应用成为近些... 随着移动互联网时代的到来,越来越多的含地理位置信息的空间数据需要处理,如何在海量的空间数据中进行常见的几何查询成为一个挑战,凸包问题因其在模式识别、图像处理、统计学、地理信息系统、博弈论、图论等领域中被广泛应用成为近些年研究的一个热点。凸包问题的研究始于单机版的算法,进而过渡到Hadoop等基于硬盘的分布式系统,但是受限于单节点的计算存储能力的瓶颈以及Hadoop平台基于硬盘的特性,其计算性能尚不能达到人们的在线实时计算的需求。研究基于内存的分布式计算框架Spark下的凸包问题,给出基于Spark平台的凸包查询整体框架,框架从查询接口、语法解析和物理执行等多方面结合SparkSQL引擎。随后,给出基于Andrew单调链算法的单机算法CHStand,分析单机算法并行度上的问题后,提出基于Spark的CHSpark算法,进一步优化算法并提出一种Spark平台下的优化算法CHGeom。通过实验对比说明三种算法的相对性能提升,实验发现Spark平台下的解决方案相对传统的单机平台下的解决方案有着较大的性能提升,所提算法具有良好的拓展性和广泛的实际应用价值。 展开更多
关键词 Spark平台 分布式计算 空间几何查询 凸包运算
下载PDF
基于Spark的指纹定位数据处理方法 被引量:2
2
作者 陈熙宁 马蔚吟 李力 《计算机工程与应用》 CSCD 北大核心 2019年第4期79-83,共5页
指纹定位技术是一种简单高效的无线定位技术,它不受无线信号多径效应和反射造成的干扰,具有较好的定位精度。然而指纹定位技术需要建立庞大的离线指纹数据库,随着指纹数据库规模的扩大,传统的指纹定位算法已经难以满足大数据应用中实时... 指纹定位技术是一种简单高效的无线定位技术,它不受无线信号多径效应和反射造成的干扰,具有较好的定位精度。然而指纹定位技术需要建立庞大的离线指纹数据库,随着指纹数据库规模的扩大,传统的指纹定位算法已经难以满足大数据应用中实时性的需求。结合指纹定位算法的特点和Spark计算引擎基于内存计算的优势,设计并实现了基于Spark的指纹定位数据处理方法。在Map阶段分别找到查询点在每个分区内的K近邻,在Reduce阶段规约各分区K近邻获得全局K近邻,最后通过加权求值获得最终的定位坐标。集群实验表明,基于Spark的指纹定位数据处理方法在一定并行度下有较好的加速比,在大规模指纹数据库下有实时定位处理的能力。 展开更多
关键词 无线定位技术 指纹定位 Spark计算引擎 加权K NN 分布式计算
下载PDF
基于混合相似度的高效图像检索方案 被引量:1
3
作者 曾梦琪 马蔚吟 李力 《计算机工程》 CAS CSCD 北大核心 2019年第11期262-268,共7页
融合文本和视觉信息进行图像检索可避免图像低层视觉特征与高层语义之间的语义鸿沟,但在提高检索质量的同时难以保证检索效率。为此,针对基于文本和内容的混合图像检索,通过结合曼哈顿哈希、倒排索引和R树等技术,设计一个新型的索引结构... 融合文本和视觉信息进行图像检索可避免图像低层视觉特征与高层语义之间的语义鸿沟,但在提高检索质量的同时难以保证检索效率。为此,针对基于文本和内容的混合图像检索,通过结合曼哈顿哈希、倒排索引和R树等技术,设计一个新型的索引结构CAT树和相应的top-k检索算法,并由此提出三段式图像检索方案。在基准图像数据集上的实验结果表明,该方案可以在保持准确率的前提下,显著提升图像检索的效率。 展开更多
关键词 图像检索 语义鸿沟 索引 视觉特征 R树
下载PDF
光滑函数实根计算的渐进显式公式
4
作者 祝平 陈小雕 +1 位作者 马维银 姜霓裳 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2021年第2期143-150,共8页
求根问题在计算机图形学、机器人技术、地磁导航等领域应用广泛。基于重新参数化方法(reparamaterization-basedmethod,RBM),给出了用于计算给定光滑函数在某区间内唯一实根的渐进式显式公式。给定光滑函数f(t),用有理多项式Ai(s)对曲线... 求根问题在计算机图形学、机器人技术、地磁导航等领域应用广泛。基于重新参数化方法(reparamaterization-basedmethod,RBM),给出了用于计算给定光滑函数在某区间内唯一实根的渐进式显式公式。给定光滑函数f(t),用有理多项式Ai(s)对曲线C(t)=(t,f(t))进行插值,得到重新参数化函数t=φ_(i)(s),使得A_(i)(s_(j))=C(φ_(i)(s_(j)))。提出了基于重新参数化函数φ_(i)(s)的显式公式用于渐进式逼近f(t)对应的实根,在n个函数计算的成本下,收敛阶可达到3·2^(n-2),其中n≥3。与类牛顿法相比,本文方法提高了计算稳定性,且收敛速度更快、计算效率更高。与裁剪法相比,本文方法不需要求解包围多项式,且可用于非多项式函数计算,计算效率更高。数值实例表明,每增加一个插值点,逼近阶可提高一倍,且可获得较传统裁剪法更高的计算效率。 展开更多
关键词 求根计算 重新参数化 裁剪方法 数值迭代法 收敛阶
下载PDF
Effective Analysis of Chinese Word-Segmentation Accuracy
5
作者 ma weiyin 《现代电子技术》 2007年第4期108-110,共3页
Automatic word-segmentation is widely used in the ambiguity cancellation when processing large-scale real text,but during the process of unknown word detection in Chinese word segmentation,many detected word candidate... Automatic word-segmentation is widely used in the ambiguity cancellation when processing large-scale real text,but during the process of unknown word detection in Chinese word segmentation,many detected word candidates are invalid.These false unknown word candidates deteriorate the overall segmentation accuracy,as it will affect the segmentation accuracy of known words.In this paper,we propose several methods for reducing the difficulties and improving the accuracy of the word-segmentation of written Chinese,such as full segmentation of a sentence,processing the duplicative word,idioms and statistical identification for unknown words.A simulation shows the feasibility of our proposed methods in improving the accuracy of word-segmentation of Chinese. 展开更多
关键词 中文信息处理 汉字处理 自动分割 效率分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部