期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
科学数据出版调查与分析 被引量:8
1
作者 黎建辉 吴超 +2 位作者 张丽丽 李成赞 胡良霖 《中国科学数据(中英文网络版)》 2016年第1期64-74,共11页
现代科学活动对数据的依赖日益增强,这使得推动科学数据开放共享逐渐成为现代科学研究的必然诉求。然而科学数据共享实践仍存在诸多障碍。为了更好地协调科学数据开放共享相关利益者的权益分配、减少数据开放的阻力,科学数据出版提供了... 现代科学活动对数据的依赖日益增强,这使得推动科学数据开放共享逐渐成为现代科学研究的必然诉求。然而科学数据共享实践仍存在诸多障碍。为了更好地协调科学数据开放共享相关利益者的权益分配、减少数据开放的阻力,科学数据出版提供了一种积极的模式探索。立足现代科研活动背景,本文面向在ESSD、ESA、GBIF、DRYAD、PANGAEN等机构发表数据论文的上千名作者展开数据出版调查。本调查于2014年8月至12月进行,重点围绕数据出版动力、数据出版方式、数据出版运营模式以及数据出版质量评价展开。调查结果显示,数据出版作为推动科学数据共享的途径之一,已获得较广泛共识。当前数据出版发展初具规模并进入快速上升期。与传统出版相比,数据出版在树立学术地位和行业认可度等方面还有待提升。运营模式尚不成熟,数据权益保护、运营机制等仍是数据共享的关注焦点。数据引用评价源于传统学术体系又有所不同,亟待建立一套高效合理的质量控制与评价激励机制。 展开更多
关键词 科学数据 科学数据出版 数据共享 调查统计
下载PDF
大数据可视分析综述 被引量:418
2
作者 任磊 杜一 +2 位作者 马帅 张小龙 戴国忠 《软件学报》 EI CSCD 北大核心 2014年第9期1909-1936,共28页
可视分析是大数据分析的重要方法.大数据可视分析旨在利用计算机自动化分析能力的同时,充分挖掘人对于可视化信息的认知能力优势,将人、机的各自强项进行有机融合,借助人机交互式分析方法和交互技术,辅助人们更为直观和高效地洞悉大数... 可视分析是大数据分析的重要方法.大数据可视分析旨在利用计算机自动化分析能力的同时,充分挖掘人对于可视化信息的认知能力优势,将人、机的各自强项进行有机融合,借助人机交互式分析方法和交互技术,辅助人们更为直观和高效地洞悉大数据背后的信息、知识与智慧.主要从可视分析领域所强调的认知、可视化、人机交互的综合视角出发,分析了支持大数据可视分析的基础理论,包括支持分析过程的认知理论、信息可视化理论、人机交互与用户界面理论.在此基础上,讨论了面向大数据主流应用的信息可视化技术——面向文本、网络(图)、时空、多维的可视化技术.同时探讨了支持可视分析的人机交互技术,包括支持可视分析过程的界面隐喻与交互组件、多尺度/多焦点/多侧面交互技术、面向Post-WIMP的自然交互技术.最后,指出了大数据可视分析领域面临的瓶颈问题与技术挑战. 展开更多
关键词 大数据 可视化 信息可视化 可视分析 人机交互 云计算
下载PDF
面向信息可视化的语义Focus+Context人机交互技术 被引量:11
3
作者 任磊 魏永长 +2 位作者 杜一 张小龙 戴国忠 《计算机学报》 EI CSCD 北大核心 2015年第12期2488-2498,共11页
大数据成为继云计算和物联网之后,国际学术界和产业界所共同瞩目的又一个研究热点.信息可视化是辅助用户洞悉大数据背后隐藏的知识和规律的重要方法和有力工具.如何在图形用户界面中对大规模信息以符合认知规律的方式进行可视化,并且使... 大数据成为继云计算和物联网之后,国际学术界和产业界所共同瞩目的又一个研究热点.信息可视化是辅助用户洞悉大数据背后隐藏的知识和规律的重要方法和有力工具.如何在图形用户界面中对大规模信息以符合认知规律的方式进行可视化,并且使得计算机能够智能化的理解用户意图以配合其进行高效的人机交互,是信息可视化面临的挑战之一.文中提出一种面向信息可视化的语义Focus+Context人机交互技术.首先,在基于空间距离的经典Focus+Context数学模型基础上对其进行语义建模和扩展,建立了面向信息空间和可视化表征空间的语义距离模型以及语义关注度模型,定义了交互中的焦点对象与语义上下文.其次,在此基础上建立了语义Focus+Context用户界面模型,给出了界面抽象元素和实体元素以及映射关系的形式化描述,同时建立了Focus+Context交互循环机制.最后,给出了应用于经典Focus+Context及鱼眼数学模型的描述,表明文中提出方法具有很好的兼容性描述能力;同时,给出了面向文件系统主题聚集的语义Focus+Context应用,给出了基于主题语义关注度与嵌套圆鱼眼视图的动态可视化实例,应用实例表明文中提出技术能够有效支持用户在信息可视化界面中对大规模信息进行智能化的可视化和交互探索. 展开更多
关键词 信息可视化 人机交互 用户界面 焦点+上下文 大数据 可视分析
下载PDF
基于NoSQL的RDF数据存储与查询技术综述 被引量:21
4
作者 王林彬 黎建辉 沈志宏 《计算机应用研究》 CSCD 北大核心 2015年第5期1281-1286,共6页
随着语义网的发展和RDF(resource description framework,资源描述框架)数据量的快速增长,利用NoSQL数据库存储和管理大规模RDF数据已经成为了当前的研究热点。介绍了No SQL数据库的种类划分和各类型特点,阐述了RDF数据在各类No SQL数... 随着语义网的发展和RDF(resource description framework,资源描述框架)数据量的快速增长,利用NoSQL数据库存储和管理大规模RDF数据已经成为了当前的研究热点。介绍了No SQL数据库的种类划分和各类型特点,阐述了RDF数据在各类No SQL数据库中存储结构设计和并行查询算法的研究现状,分析比较了不同方法的优缺点。最后,讨论了利用No SQL数据库管理RDF的优势,总结了现有研究的不足之处,并展望了未来的研究方向。 展开更多
关键词 资源描述框架 NOSQL数据库 数据模型 存储结构设计 RDF并行查询算法
下载PDF
基于BLAST的数据清洗与质量控制方案 被引量:1
5
作者 刘奇 孟珍 +5 位作者 刘勇 董慧 林小光 杲艳平 周园春 黎建辉 《计算机工程》 CAS CSCD 北大核心 2011年第4期73-75,共3页
研究基本局部比对搜索工具(BLAST)在陆地植物系统发育平台中的应用。数据清洗方面结合基于基因注释的数据抽提与基于BLAST的相似性比对抽提,提取过滤相关的序列信息,控制序列质量,并剔除原始基因注释错误的序列。自测序列质量控制方面... 研究基本局部比对搜索工具(BLAST)在陆地植物系统发育平台中的应用。数据清洗方面结合基于基因注释的数据抽提与基于BLAST的相似性比对抽提,提取过滤相关的序列信息,控制序列质量,并剔除原始基因注释错误的序列。自测序列质量控制方面结合基于blastn的打分比对和基于blastp的模板比对,报告序列整体质量,控制污染序列和假基因的入库。 展开更多
关键词 序列比对 数据清洗 基本局部比对搜索工具 陆地植物系统发育平台
下载PDF
一种大规模时空数据处理与可视化平台 被引量:1
6
作者 杜一 郭旦怀 +1 位作者 周园春 黎建辉 《计算机研究与发展》 EI CSCD 北大核心 2014年第S2期10-17,共8页
当前大多数时空数据处理与可视化工具在数据规模增大时不能够对数据进行快速地处理与可视化.为解决该问题,通过对任务模型、数据模型及可视映射策略的重新定义,给出一种大规模时空数据处理与可视化平台.平台能够支持多种不同类型的时空... 当前大多数时空数据处理与可视化工具在数据规模增大时不能够对数据进行快速地处理与可视化.为解决该问题,通过对任务模型、数据模型及可视映射策略的重新定义,给出一种大规模时空数据处理与可视化平台.平台能够支持多种不同类型的时空数据,通过分布式的数据存储、数据重新组织、分布式检索、空间索引、分段预取等技术,能够实现大规模数据的快速处理与可视化. 展开更多
关键词 大数据 时空数据处理 时空数据可视化 软件架构 模型驱动的架构
下载PDF
释放大数据的能量
7
作者 黎建辉 《中国教育网络》 2016年第4期1-1,共1页
3月,谷歌AlphaGo与韩国围棋国手李世石的“人机世纪大战”,刷爆全球舆论圈。说到底,AlphaGo获胜,在于拥有人类历史高手海量的棋局和不断试错改进的自我学习能力。大数据+深度学习,造就了AlphaGo的胜利。海量数据的汇聚,促成了大数据时... 3月,谷歌AlphaGo与韩国围棋国手李世石的“人机世纪大战”,刷爆全球舆论圈。说到底,AlphaGo获胜,在于拥有人类历史高手海量的棋局和不断试错改进的自我学习能力。大数据+深度学习,造就了AlphaGo的胜利。海量数据的汇聚,促成了大数据时代的到来,然而,问题普遍存在,那些希望通过海量数据总结和发现科学的规律,或者是刻画用户画像的设想,遭遇了诸多挑战。 展开更多
关键词 李世石 高校信息化 谷歌 试错 自我学习能力 第四范式 隐私保护 ALPHA 应用服务 科研成果
下载PDF
支持向量机理论及算法研究综述 被引量:204
8
作者 汪海燕 黎建辉 杨风雷 《计算机应用研究》 CSCD 北大核心 2014年第5期1281-1286,共6页
介绍了SVM的理论基础和它的多种主要算法及这些算法的利弊与发展现状,并介绍了SVM在现实生活中的应用原理及应用现状。最后分析了SVM在发展中的不足之处,指出了其研究方向及前景,并提出在分布式支持向量机这个方向上可以进行更深层次的... 介绍了SVM的理论基础和它的多种主要算法及这些算法的利弊与发展现状,并介绍了SVM在现实生活中的应用原理及应用现状。最后分析了SVM在发展中的不足之处,指出了其研究方向及前景,并提出在分布式支持向量机这个方向上可以进行更深层次的研究。 展开更多
关键词 支持向量机 统计学习理论 训练算法 模糊支持向量机 多分类支持向量机 模式识别
下载PDF
一种模型驱动的可视化生成系统 被引量:11
9
作者 杜一 郭旦怀 +2 位作者 陈昕 任磊 戴国忠 《软件学报》 EI CSCD 北大核心 2016年第5期1199-1211,共13页
随着可视化与可视分析需求的增加,可视化开发所需的总成本不断提高.模型驱动的开发方法能够提高软件开发的效率,但在可视化开发中并没有发挥应有的作用.在此背景下,给出DVDL(data visualization description language)——一种模块化、... 随着可视化与可视分析需求的增加,可视化开发所需的总成本不断提高.模型驱动的开发方法能够提高软件开发的效率,但在可视化开发中并没有发挥应有的作用.在此背景下,给出DVDL(data visualization description language)——一种模块化、层次化描述的可视化描述语言,利用DVDL可以对组成可视化的各个部分进行不同抽象层次上的描述.在DVDL基础上,给出一种模型驱动的可视化生成系统DVIZ(data visualization).该系统通过数据源选择、可视化配置、发布与分享这3个步骤以及所见即所得的配置,实现可视化的快速生成;系统支持多可视化图形之间的交互与关联配置;并且该系统基于Web开发,支持多种社交平台,易于分享与传播. 展开更多
关键词 可视化系统 用户界面描述语言 模型驱动的开发方法 最终用户编程
下载PDF
E-UIDL用户界面描述语言下的开发方法 被引量:3
10
作者 杜一 田丰 戴国忠 《软件学报》 EI CSCD 北大核心 2015年第7期1772-1784,共13页
当前的用户界面开发过程需要产品经理、交互设计师、视觉设计师及用户界面开发工程师等多个角色的共同参与,各个角色的分工越来越细致,并且不同的角色在开发过程中使用的工具各不相同,这导致了界面开发过程中沟通成本的增加以及工作效... 当前的用户界面开发过程需要产品经理、交互设计师、视觉设计师及用户界面开发工程师等多个角色的共同参与,各个角色的分工越来越细致,并且不同的角色在开发过程中使用的工具各不相同,这导致了界面开发过程中沟通成本的增加以及工作效率的降低.介绍了一种基于用户界面描述语言的开发方法,该方法能够降低用户界面开发过程中不同角色之间的沟通成本及转换成本,提高用户界面开发的效率.首先介绍E-UIDL(extensible user interface description language)——一种新的用户界面描述语言,并在此基础上设计了基于E-UIDL的开发方法及辅助开发工具,最后,通过实例介绍了利用基于E-UIDL的开发工具进行界面开发的过程,证明了基于用户界面描述语言的开发方法的可行性及优势. 展开更多
关键词 界面描述语言 交互技术 用户界面开发方法 计算机辅助设计
下载PDF
陆地植物系统发育研究的工作平台构建 被引量:1
11
作者 孟珍 陈之端 +7 位作者 黎建辉 刘红梅 何星 林小光 张寿洲 李勇 胡良霖 周园春 《计算机工程》 CAS CSCD 北大核心 2010年第20期272-274,共3页
在讨论利用基因和基因组信息构建生命之树的历史推进、有效策略和方法的基础上,针对生命之树的建设进行业务流程和应用设计分析,构建面向陆地植物的系统发育平台。平台实现基因数据从国际数据库的自动获取、清洗与自测数据的提交、整理... 在讨论利用基因和基因组信息构建生命之树的历史推进、有效策略和方法的基础上,针对生命之树的建设进行业务流程和应用设计分析,构建面向陆地植物的系统发育平台。平台实现基因数据从国际数据库的自动获取、清洗与自测数据的提交、整理功能,给出系统树的流程化构建,整合数据抽提、多重序列比对、编辑清洗、分模型构树、组装评估、可视化编辑等系列分析算法和模型,经若干交互界面,得到系统树的自动生成、辅助实验决策。 展开更多
关键词 系统发育 生命之树 数据抽提 自动建树
下载PDF
基于大数据的食源性疾病事件探测与风险评估 被引量:19
12
作者 郭旦怀 崔文娟 +1 位作者 郭云昌 黎建辉 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2015年第10期2523-2530,共8页
食源性疾病由于其症状轻重不一常被低估,但近年来,食源性疾病的爆发在全国范围内呈上升趋势,准确探测食源性疾病事件并对其进行风险评估有重要意义.本文分别对哨点医院监测数据、食品检测数据和来自互联网的数据建立事件探测模型,实现... 食源性疾病由于其症状轻重不一常被低估,但近年来,食源性疾病的爆发在全国范围内呈上升趋势,准确探测食源性疾病事件并对其进行风险评估有重要意义.本文分别对哨点医院监测数据、食品检测数据和来自互联网的数据建立事件探测模型,实现风险评估,并分析比较模型优劣,最后建立统一的时空框架,引入人口、交通、食品生产等大数据对风险预测结果进行综合集成.通过对某大城市2014年食源性疾病事件的探测结果对比,实证结果表明,综合模型预测的时空精度更高,对防控更具操作性. 展开更多
关键词 食源性疾病 大数据 事件探测 风险评估 集成时空框架
原文传递
中国陆地生态系统碳收支集成研究的e-Science系统构建 被引量:7
13
作者 何洪林 张黎 +3 位作者 黎建辉 周园春 任小丽 于贵瑞 《地球科学进展》 CAS CSCD 北大核心 2012年第2期246-254,共9页
全球/区域生态系统碳循环研究具有多台站联网观测、多源异构数据、多模型综合分析、跨领域科学家协同工作等特点。以中国陆地生态系统通量观测研究网络(ChinaFLUX)为基础平台,论述建立碳循环科研信息化环境(e-Carbon Science)的迫切性,... 全球/区域生态系统碳循环研究具有多台站联网观测、多源异构数据、多模型综合分析、跨领域科学家协同工作等特点。以中国陆地生态系统通量观测研究网络(ChinaFLUX)为基础平台,论述建立碳循环科研信息化环境(e-Carbon Science)的迫切性,系统阐述e-Carbon Science的目标、组成、关键技术及研究进展,构建了由"四环境(碳循环数据集成与服务环境、模型模拟环境、可视化分析环境、科研协同工作环境)、三系统(站点、区域、全国尺度陆地生态系统碳收支评估应用系统)"组成的ChinaFLUX e-Carbon Science,形成ChinaFLUX通量数据采集—传输—存储—管理—处理—可视化—共享服务的一体化系统,实现不同尺度的碳收支快速评估与模拟,支撑并促进我国陆地生态系统碳循环研究和生态信息学发展,对我国野外台站网络信息化起到引领和示范作用。 展开更多
关键词 生态系统碳收支 科研信息化环境 陆地生态系统 中国陆地生态系统通量观测研究网络 中国生态系统研究网络
原文传递
基于知识规则的数据质量检验方法在农田土壤监测中的应用 被引量:4
14
作者 施建平 沈志宏 +1 位作者 苏贤明 宋歌 《科研信息化技术与应用》 2012年第2期53-61,共9页
土壤长期监测数据为土壤质量和公共健康保护决策提供输入判据,数据质量保证和质量控制的重要性不容忽视。本文研究了基于知识规则的农田土壤监测数据质量检验方法,包括长期监测数据质量检验的需求分析,质量控制背景数据库的建立,数据挖... 土壤长期监测数据为土壤质量和公共健康保护决策提供输入判据,数据质量保证和质量控制的重要性不容忽视。本文研究了基于知识规则的农田土壤监测数据质量检验方法,包括长期监测数据质量检验的需求分析,质量控制背景数据库的建立,数据挖掘和基于专家经验和统计的知识规则提取。最后,介绍了基于上述方法开发的中国生态系统研究网络农田土壤监测数据质量检验系统的应用。 展开更多
关键词 知识规则 土壤监测 数据质量检验 数据挖掘
原文传递
中国陆地生态系统碳收支集成研究的e-Science环境建设探讨 被引量:5
15
作者 于贵瑞 何洪林 黎建辉 《科研信息化技术与应用》 2009年第2期21-31,共11页
以中国通量观测研究网络(ChinaFLUX)为基础平台,开展生态系统碳循环集成研究不仅是全球变化科学研究的重要内容,也是我国应对气候变化的重大科技任务。生态系统碳循环集成研究需要多台站联网观测、多源数据同化、多模型综合分析、以及... 以中国通量观测研究网络(ChinaFLUX)为基础平台,开展生态系统碳循环集成研究不仅是全球变化科学研究的重要内容,也是我国应对气候变化的重大科技任务。生态系统碳循环集成研究需要多台站联网观测、多源数据同化、多模型综合分析、以及跨区域、跨学科合作的协同工作环境,急迫需要开展e-Science应用和示范研究。本文论述了国内外生态系统碳循环集成研究的e-Science环境建设现状及其发展趋势,提出了建立服务于中国陆地生态系统碳收支集成研究的e-Science环境建设的目标和思路,阐述了以ChinaFLUX现有的8个野外观测台站为基础,通过一个由"三个工作环境"(数据集成环境,模型模拟环境,可视化协同工作环境)和"四个层次的应用系统"(典型生态系统、典型区域、中国区域、东亚区域)构成的中国陆地生态系统碳循环科学研究的e-Science应用示范体系的建设任务,并讨论了开展碳循环集成研究e-Science环境建设在中国生态系统研究网络(CERN)信息化建设,以及我国生态信息科学发展中的重要作用。 展开更多
关键词 生态系统碳收支 E-SCIENCE 陆地生态系统 中国通量观测研究网络(ChinaFLUX) 中国生
原文传递
一种基因序列测序数据质量控制方案
16
作者 孟珍 黎建辉 +4 位作者 周园春 董慧 胡良霖 陈之端 张寿洲 《科研信息化技术与应用》 2012年第2期25-34,共10页
生物分子数据的爆炸增长对数据挖掘结果有效性提出挑战,本文分析了当前生物数据尤其是基因序列数据在学科发展中的特点,综合数据规则和标准的研究以及数据清洗、质量控制工具的研究现状,结合具体项目实践中的特点和应用,初步提出了针对... 生物分子数据的爆炸增长对数据挖掘结果有效性提出挑战,本文分析了当前生物数据尤其是基因序列数据在学科发展中的特点,综合数据规则和标准的研究以及数据清洗、质量控制工具的研究现状,结合具体项目实践中的特点和应用,初步提出了针对基因序列数据的质量控制方案。在方案设计上,本文从公共数据的数据抽提部分和私有数据的质量控制部分进行阐述。前者主要涉及到对大量数据检索、序列比对和模型匹配等问题,后者主要涉及基因序列数据精度的计算、stop codons(终止密码子)和contaminants(污染序列段)的排除以及trace file数据质量的计算及系列相似性比较等。同时,该方案面对海量数据的处理,结合数据密集型计算特点进行了基于MapReduce的并行应用设计。 展开更多
关键词 基因序列 数据质量控制方案 系统发育
原文传递
基于知识规则的Excel数据质量校验工具 被引量:3
17
作者 苏贤明 沈志宏 刘宁 《科研信息化技术与应用》 2012年第3期29-37,共9页
在分析现有数据质量校验方法与校验工具的基础上,借鉴科研领域的数据质量校验经验和规则引擎的相关技术,实现了基于知识规则的Excel数据质量校验工具,进而解决科研观测数据中异常记录判别、异常原因标识、数据可视化分析等关键技术问题... 在分析现有数据质量校验方法与校验工具的基础上,借鉴科研领域的数据质量校验经验和规则引擎的相关技术,实现了基于知识规则的Excel数据质量校验工具,进而解决科研观测数据中异常记录判别、异常原因标识、数据可视化分析等关键技术问题。中国生态系统研究网络综合中心以及土壤分中心的应用表明,在不影响原有数据填报流程的前提下,该工具能很好地代替数据质量校验人员的手工查错工作,有效地提高数据质量校验的效率及准确性。 展开更多
关键词 知识规则 EXCEL 数据质量校验
原文传递
基于OGC WPS的碳循环模型服务平台的设计与实现 被引量:8
18
作者 吴楠 何洪林 +4 位作者 张黎 任小丽 周园春 于贵瑞 王晓峰 《地球信息科学学报》 CSCD 北大核心 2012年第3期320-326,共7页
碳循环模型是模拟陆地生态系统,估计和预测不同尺度碳收支格局和变率的重要手段。但传统碳循环模型应用中存在数据处理量大、运算复杂、互操作性差、难以推广等问题。由开放地理信息联盟(OGC)制定的网络处理服务(WPS)标准为实现碳循环... 碳循环模型是模拟陆地生态系统,估计和预测不同尺度碳收支格局和变率的重要手段。但传统碳循环模型应用中存在数据处理量大、运算复杂、互操作性差、难以推广等问题。由开放地理信息联盟(OGC)制定的网络处理服务(WPS)标准为实现碳循环模型的发布、共享、重用与组合,促进碳循环模型的发展和应用提供了一种新的途径。本文遵循OGC WPS标准,以SOA设计了碳循环模型服务平台的整体架构,详细描述了平台模型接口设计、模型算法开发、WPS服务的封装与发布、平台浏览器客户端界面开发等关键环节的实现方法,为用户提供了碳循环相关数据和模型服务的发布、管理、调用、组合、异步交互、状态监控和结果可视化等功能。并以VPM模型服务链为应用实例,演示碳循环模型WPS服务开发、封装、调用和组合的方法,展示了该服务平台的功能。该平台的建立为我国碳循环模型研究的发展提供了技术支撑。 展开更多
关键词 碳循环模型 OGC WPS 模型服务平台 VPM
原文传递
系列硫氧化还原酶(SOR)的同源建模 被引量:1
19
作者 孟珍 尤晓颜 +1 位作者 姜成英 马俊才 《应用与环境生物学报》 CAS CSCD 北大核心 2010年第3期424-428,共5页
硫氧化还原酶(Sulfur oxygenase/reductase,SOR)在嗜热酸古菌硫氧化代谢中具有关键性作用,其催化机理和分子工程等都得到广泛关注.对SOR所涉及的亚基进行分子同源建模研究,并评估其可用性,通过1)序列相似性搜索,2)序列和结构比对,3)初... 硫氧化还原酶(Sulfur oxygenase/reductase,SOR)在嗜热酸古菌硫氧化代谢中具有关键性作用,其催化机理和分子工程等都得到广泛关注.对SOR所涉及的亚基进行分子同源建模研究,并评估其可用性,通过1)序列相似性搜索,2)序列和结构比对,3)初始建模,4)分析和评估,5)精修和优化获得未知三维结构SOR的三维模型.同时讨论了此类蛋白质结构建模、评估策略、特征数据提取等. 展开更多
关键词 同源建模 模型合理性评估 硫氧化还原酶
原文传递
基于地名相似度算法与空间场景相似性评价的地址规范化研究 被引量:1
20
作者 向雯婷 郭旦怀 《科研信息化技术与应用》 2013年第1期67-73,共7页
地理编码技术通过将位置信息的文字表述转化为经纬度坐标为地理位置信息相关的科研提供数据支持。在地理编码过程中,地址描述性文字可能存在大量内容不正确、不准确、错别字、同音字等问题,从而导致无法进行准确地址匹配。该文针对以上... 地理编码技术通过将位置信息的文字表述转化为经纬度坐标为地理位置信息相关的科研提供数据支持。在地理编码过程中,地址描述性文字可能存在大量内容不正确、不准确、错别字、同音字等问题,从而导致无法进行准确地址匹配。该文针对以上问题提出了一种地址规范化的方法,通过地名相似度算法将待规范地名与标准地名库记录进行匹配,并结合空间场景相似性对结果进行评价,从而提高地址匹配的准确度。最后通过相关公共卫生数据验证了方法的可行性与准确性。 展开更多
关键词 地理编码 地址匹配 地址规范化 地名相似度算法 空间场景相似性
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部