期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
多维特征学习与模型融合的地理命名实体识别
1
作者 马浩然 王金华 《测绘通报》 CSCD 北大核心 2024年第9期129-134,共6页
地理命名实体识别是地理信息抽取的核心任务,而地理信息抽取支撑着地理信息系统的构建。但目前的地理命名实体识别研究面临两大核心挑战:一是地理领域文本的标注数据稀缺,导致传统依赖大量标注数据的通用模型难以全面捕捉并识别地理文... 地理命名实体识别是地理信息抽取的核心任务,而地理信息抽取支撑着地理信息系统的构建。但目前的地理命名实体识别研究面临两大核心挑战:一是地理领域文本的标注数据稀缺,导致传统依赖大量标注数据的通用模型难以全面捕捉并识别地理文本中所有潜在的命名实体;二是地理数据的标签密度较为稀疏,模型在区分不同地理命名实体时往往无法区分其边界,进而无法精准定位。针对上述问题,本文提出了一种面向地理领域文本特征的命名实体识别算法AM_NER。首先,利用Albert进行词向量训练,该模型是面向小样本的轻量级预训练模型,能够更为全面地学习地理领域的语义信息;然后,设计了名为M_NER的神经元结构,该神经元基于模型融合思想,利用多个模型从不同维度对语义特征进行学习,进而准确识别出命名实体的边界。相较于此前的研究,AM_NER在地理领域数据集中的各项指标提升了2.05%~2.67%。 展开更多
关键词 地理命名实体识别 深度学习 特征学习 模型融合
下载PDF
基于Electra语言模型的地理命名实体识别
2
作者 袁跃飞 杨久东 贾闻远 《电脑知识与技术》 2024年第9期5-7,共3页
地理命名实体识别是构建高质量地理知识图谱的关键环节,需要从大量的非结构化文本中提取地理实体名称,为了提高识别效率和自动化水平,文章选取百度百科和中文地址要素解析任务的部分数据构建语料库,采用轻量化语言模型Electra与CRF相结... 地理命名实体识别是构建高质量地理知识图谱的关键环节,需要从大量的非结构化文本中提取地理实体名称,为了提高识别效率和自动化水平,文章选取百度百科和中文地址要素解析任务的部分数据构建语料库,采用轻量化语言模型Electra与CRF相结合对唐山市地区的地理命名实体进行了自动识别研究。研究表明:Electra-CRF语言模型有很好的鲁棒性,以唐山市百度百科词条为例进行模型评估,该方法对于地理命名实体的平均解析准确率达80%以上,可以运用在构建地理知识图谱或者地理知识库的命名实体识别任务当中。 展开更多
关键词 ELECTRA 地理命名实体 混淆矩阵
下载PDF
人在回路学习增强的地理命名实体识别 被引量:4
3
作者 杨盈 邱芹军 +3 位作者 谢忠 田苗 郑诗语 郑帅 《测绘通报》 CSCD 北大核心 2023年第8期155-160,177,共7页
地理命名实体识别是高质量地理知识图谱构建的重要环节,被广泛应用于地理编码、语义检索及地理知识推理等方面。主流的深度学习模型存在标注语料库耗时费力、模型可解释性差等问题。为发挥人在回路机制推动学习模型利用少量样本学习的优... 地理命名实体识别是高质量地理知识图谱构建的重要环节,被广泛应用于地理编码、语义检索及地理知识推理等方面。主流的深度学习模型存在标注语料库耗时费力、模型可解释性差等问题。为发挥人在回路机制推动学习模型利用少量样本学习的优势,本文提出了一种人在回路学习增强的地理命名实体识别方法。即以部分标注及未标注地理语料为输入,基于BERT-BiLSTM-CRF模型进行训练并对待标注语料库进行识别,对于模型识别错误的句子提供人工干预形式对其进行纠正,并将纠正之后的句子重新输送到学习模型中进行迭代训练,最终形成标准地理命名实体数据集及人在回路强化后的抽取模型。以地理大百科全书数据为例进行模型性能评估,该方法对于多数地理命名实体识别解析准确率达90%以上,相比已有深度学习模型,该方法仅需要少量标注样本且识别效果更优,对多种地理命名实体识别类型能够保持较好性能。 展开更多
关键词 地理命名实体识别 人在回路 深度学习 预训练模型 BERT-BiLSTM-CRF
下载PDF
中文文本的地理命名实体标注 被引量:27
4
作者 张雪英 朱少楠 张春菊 《测绘学报》 EI CSCD 北大核心 2012年第1期115-120,共6页
地理信息的语义解析有效地解决自然语言与地理信息系统之间的语义障碍问题。在分析中文文本和地理信息系统中地理实体描述和表达机制差异的基础上,结合地理命名实体描述的语言特点,制定中文文本的地理命名实体标注体系和标注规范,并以GA... 地理信息的语义解析有效地解决自然语言与地理信息系统之间的语义障碍问题。在分析中文文本和地理信息系统中地理实体描述和表达机制差异的基础上,结合地理命名实体描述的语言特点,制定中文文本的地理命名实体标注体系和标注规范,并以GATE(General Architecture for Text Engineering)作为标注平台,构建基于《中国大百科全书中国地理》的大规模标注语料库,以解决当前相关标准和规模化标准数据匮乏的问题。 展开更多
关键词 中文文本 地理命名实体 标注体系 标注语料库 自然语言
下载PDF
基于CRF和规则相结合的地理命名实体识别方法 被引量:67
5
作者 何炎祥 罗楚威 胡彬尧 《计算机应用与软件》 CSCD 2015年第1期179-185,202,共8页
为了识别文本中海量的地理命名信息,以CRF(条件随机场)模型识别为基础,加入制定的规则,来提高CRF模型识别的召回率,从而提高整体的地理命名实体识别效果。通过选取适合的地理命名实体识别的特征模板,验证特征的有效性以及分析CRF模型识... 为了识别文本中海量的地理命名信息,以CRF(条件随机场)模型识别为基础,加入制定的规则,来提高CRF模型识别的召回率,从而提高整体的地理命名实体识别效果。通过选取适合的地理命名实体识别的特征模板,验证特征的有效性以及分析CRF模型识别结果中的未识别实体样本,设计针对未识别实体的规则用以修正识别结果。实验表明,对地名和组织名结合规则进行修正后的F值达到了91.61%和85.74%,有了显著提高。 展开更多
关键词 地理命名实体识别 特征模版 条件随机场 修正规则 结合修正
下载PDF
面向GIS的地理命名实体识别研究 被引量:10
6
作者 李玉森 张雪英 袁正午 《重庆邮电大学学报(自然科学版)》 2008年第6期719-724,共6页
自然语言与GIS的结合是实现GIS智能化和大众化的重要基础。实现自然语言中地理命名实体识别不仅能够丰富GIS的信息来源,而且能够提升GIS的表达能力和可理解性。自然语言中地理命名实体表达方式的多样性、语义模糊性是地理命名实体识别... 自然语言与GIS的结合是实现GIS智能化和大众化的重要基础。实现自然语言中地理命名实体识别不仅能够丰富GIS的信息来源,而且能够提升GIS的表达能力和可理解性。自然语言中地理命名实体表达方式的多样性、语义模糊性是地理命名实体识别研究中的主要难题。重点阐述和分析了中文文本中地理命名实体识别的基本问题、研究方法及其在GIS中的应用前景,并提出了当前该领域面临的主要问题。 展开更多
关键词 地理命名实体识别 自然语言 地理信息系统
下载PDF
联合词汇增强的中文细粒度地理命名实体识别模型研究 被引量:2
7
作者 李发东 王海起 +7 位作者 孔浩然 刘峰 王志海 王琼 徐建波 单宇飞 周啸宇 闫峰 《地球信息科学学报》 EI CSCD 北大核心 2023年第6期1106-1120,共15页
命名实体识别(NER)是自然语言处理众多研究基础,其可以被定义为分类任务,旨在从非结构化文本中定位出命名实体,同时将命名实体分类成预定义类别。与英文相比,中文构词灵活、不具有边界性,且缺乏高质量中文NER数据集,导致中文命名实体识... 命名实体识别(NER)是自然语言处理众多研究基础,其可以被定义为分类任务,旨在从非结构化文本中定位出命名实体,同时将命名实体分类成预定义类别。与英文相比,中文构词灵活、不具有边界性,且缺乏高质量中文NER数据集,导致中文命名实体识别难度较大。细粒度实体是粗粒度实体的细分类型,中文细粒度命名实体尤其是地理命名实体识别难度更大。中文地理命名实体识别无法同时兼顾精度和召回率,改善中文细粒度地理命名实体识别性能至关重要。因此,本文提出2种联合词汇增强模型的中文细粒度地理命名实体识别模型。首先,将词汇作为“知识”注入模型,基于词汇增强方式探究适合细粒度命名实体识别方法,并找出适合细粒度命名实体识别方法BERT-FLAT以及LEBERT;其次,为进一步提升细粒度地理命名实体识别性能,针对上述2种方法在预训练模型、对抗训练以及随机权重平均3个方面进行改进,形成联合词汇增强模型RoBERTa-wwm-FLAT以及LE-RoBERTa-wwm;最后,对联合词汇增强模型进行消融实验,探究不同改进策略对于地理命名实体识别性能影响。基于CLUENER数据集和1个微博数据集的实验表明:(1)与无词汇增强功能模型相比,具有词汇增强功能模型在细粒度命名实体识别任务中F1-score提升了10%左右;(2)针对词汇增强方法进行的3处改进使模型在细粒度地理命名实体识别任务中F1-score提升了0.36%~2.35%;(3)与对抗训练改进、随机权重平均改进相比,预训练模型改进对地理命名实体识别精度的影响最大。 展开更多
关键词 命名实体识别 自然语言处理 中文细粒度实体 地理命名实体识别 词汇增强 预训练模型 对抗训练 随机权重平均
原文传递
地理命名实体分类体系的设计与应用分析 被引量:23
8
作者 张雪英 张春菊 闾国年 《地球信息科学学报》 CSCD 北大核心 2010年第2期220-227,共8页
自然语言是一种重要的空间数据来源,从自然语言中获取地理空间信息是地理信息科学的重要研究议题。完善的地理命名实体分类体系,有助于实现自然语言中地理空间信息的解析、存贮、组织、管理、分析及共享应用。现有的基础地理要素分类体... 自然语言是一种重要的空间数据来源,从自然语言中获取地理空间信息是地理信息科学的重要研究议题。完善的地理命名实体分类体系,有助于实现自然语言中地理空间信息的解析、存贮、组织、管理、分析及共享应用。现有的基础地理要素分类体系、地名分类体系和组织机构分类体系,分别侧重于不同的应用领域,只能表达自然语言中的部分地理命名实体,没有考虑时空关联特性。本文在参照大量相关标准的基础上,根据大量自然语言文本的标注结果,以地理命名实体所指代的空间位置、地理特征和属性作为分类标准,采用主分表和复分表相结合的方式,设计了地理命名实体分类体系(简称"GNEC")。采用定量和定性相结合的方法,分析了GNEC与GB/T18521-2001,GB/T13923-2006,CHG IS的地名分类体系、ADL的FTT词表之间的兼容性,并以中文文本的地理命名实体解析和地图服务为例,验证了GNEC的应用性能。多样性是自然语言中地理实体描述的重要特征,而分类体系主要实现地理命名实体的概念化操作。因此,在GNEC基础上构建本体,将成为解决这一问题的有效途径。 展开更多
关键词 地理命名实体 分类体系 地理信息系统 信息共享
原文传递
基于可视化技术的海底地理实体命名现状分析
9
作者 王风帆 吴云帆 +2 位作者 杨锦坤 刘志杰 孔敏 《海洋测绘》 CSCD 2020年第6期78-82,共5页
利用数据可视化技术,基于国际海底地名词典,聚焦各国的提案申请情况,对国际海底地名总体情况、各国参与情况、中国参与情况以及和其他国家对比进行了分析,结果发现近几十年来国际对海底地理实体命名工作的参与程度日益增强,其中2000年... 利用数据可视化技术,基于国际海底地名词典,聚焦各国的提案申请情况,对国际海底地名总体情况、各国参与情况、中国参与情况以及和其他国家对比进行了分析,结果发现近几十年来国际对海底地理实体命名工作的参与程度日益增强,其中2000年之后以日本通过的提案数量和参与频率最高;中国虽然起步晚,但参与频率高,年度通过提案数量也在逐年上升。因此,利用可视化技术可以有效、快捷地了解国际海底地理实体命名现状,方便开展相关分析研究。 展开更多
关键词 海底地形地貌 海底地理实体命名 数据分析 可视化技术 海底地名词典
下载PDF
基于条件随机场挖掘文本史料中事件信息的方法与实证研究——以《拉贝日记》数字人文研究为例 被引量:1
10
作者 赵小萱 陈刚 黄紫荆 《图书馆杂志》 北大核心 2024年第3期101-108,115,共9页
文本史料被广泛数字化,如何从文本中提取地理命名实体及相关信息,有效开展地理信息挖掘成为重要研究课题。本文针对历史档案文档的特点,提出一种以地理命名实体为核心,使语义信息与地理位置关联,将文本描述的事件信息转化为各个地理命... 文本史料被广泛数字化,如何从文本中提取地理命名实体及相关信息,有效开展地理信息挖掘成为重要研究课题。本文针对历史档案文档的特点,提出一种以地理命名实体为核心,使语义信息与地理位置关联,将文本描述的事件信息转化为各个地理命名实体的属性数据的事件抽取理念,提取出有关时间、地点、人物、事物、事件、现象等与地理命名实体相关的事件要素。研究以《拉贝日记》中收录的《日本士兵在南京安全区的暴行》档案为实证案例,采用条件随机场方法,抽取事件信息,结合历史地图等相关资料,将地理信息最终映射到地图上。本文方法有助于拓展文本资料在数字信息时代的开发利用方式,开辟文本挖掘分析与知识发现的新思路。 展开更多
关键词 条件随机场 特征模板 数字人文 信息提取 地理命名实体
下载PDF
海底地理实体命名对大陆架划界的影响--以日本为例 被引量:5
11
作者 黄文星 朱本铎 +1 位作者 刘丽强 张金鹏 《地球科学进展》 CAS CSCD 北大核心 2016年第8期811-819,共9页
对日本大陆架划界案相关海域的海底地理实体命名进行动态跟踪,结果显示日本在大陆架划界案提交前后,命名了坂东海盆(Bando Basin),删除了半月海槽(Hangetsu Trough)新月海穴(Shingetsu Hole)和冲大东海槽(Oki-Daito Trough),修改了小笠... 对日本大陆架划界案相关海域的海底地理实体命名进行动态跟踪,结果显示日本在大陆架划界案提交前后,命名了坂东海盆(Bando Basin),删除了半月海槽(Hangetsu Trough)新月海穴(Shingetsu Hole)和冲大东海槽(Oki-Daito Trough),修改了小笠原海底高原(Ogasawara Plateau)和冲大东海脊(Oki-Daito Ridge)附近的命名方案,这些命名和更名动作违背了一般的命名更名规则,其目的是扩展其大陆架边界。建议加强海底地理实体命名与海洋权益相关关系的研究工作,为维护国家海洋权益提供技术支撑。 展开更多
关键词 海底地理实体命名 大陆架划界 日本划界案
原文传递
基于深度学习的公民参与城市治理的时空格局研究——以苏州市为例 被引量:3
12
作者 沈安南 王亮绪 高峻 《地理信息世界》 2020年第2期44-48,共5页
公民共同参与城市治理对于城市的发展具有重要的作用,准确地识别公众参与讨论的主题内容是城市治理中亟待解决的问题。目前,对于公民参与的研究多集中在对平台的评价,对发布的文本内容分析较少。深度学习作为一种以数据为导向的新技术,... 公民共同参与城市治理对于城市的发展具有重要的作用,准确地识别公众参与讨论的主题内容是城市治理中亟待解决的问题。目前,对于公民参与的研究多集中在对平台的评价,对发布的文本内容分析较少。深度学习作为一种以数据为导向的新技术,在自然语言处理相关领域都得到了广泛应用且效果良好。基于政务网站论坛的文本数据,采用大数据和神经网络的方法,设计苏州市公民参与的定量化模型,研究公民在政府网站上的行为,并在不同的时空尺度上研究公民参与度的时空格局演化规律,结合苏州出台的相应政策数据验证方法可靠性。有助于认识一个城市的基层治理能力,评价一个城市可持续性。 展开更多
关键词 城市治理 神经网络 地理命名实体识别 时空格局
下载PDF
国际海底命名争端案例研究及其启示 被引量:4
13
作者 黄文星 朱本铎 +1 位作者 刘丽强 张金鹏 《地球科学进展》 CAS CSCD 北大核心 2016年第1期78-85,共8页
通过分析国际海底地名分委会(SCUFN)会议纪要,研究日本与俄罗斯帝王海山链(Emperor Seamount Chain)之争、日本与俄罗斯日本平顶海山群(Japanese Guyots)之争和日本与美国幸运星海脊(Lucky Star Ridge)之争的过程。根据SCUFN的命名规则... 通过分析国际海底地名分委会(SCUFN)会议纪要,研究日本与俄罗斯帝王海山链(Emperor Seamount Chain)之争、日本与俄罗斯日本平顶海山群(Japanese Guyots)之争和日本与美国幸运星海脊(Lucky Star Ridge)之争的过程。根据SCUFN的命名规则,探讨其处理争端的主要依据,并对我国当前的命名工作提出建议。 展开更多
关键词 海底地理实体命名 历史争端 海洋权益
原文传递
韩喜球——在大洋中乘风破浪
14
作者 陈晓华(指导) 《作文与考试(高中版)》 2024年第8期34-34,共1页
在中国的大洋科考活动中有这样一位女科学家,她带领团队执行了多个中国大洋科考航次,在国际海底区域发现了12处多金属硫化物矿床(点),为新勘测发现的16个大洋海底地理实体命名,她就是中国大洋科考史上首位女首席专家韩喜球。
关键词 国际海底区域 多金属硫化物矿床 海底地理实体命名 大洋科考
原文传递
基于过滤文本和社交网络的用户常驻位置预测
15
作者 王海起 孔浩然 李学伟 《地球信息科学学报》 CSCD 北大核心 2021年第10期1778-1786,共9页
社交用户的文本具有地理差异性,并且社交关系密切的用户之间居住位置更近,因而文本和社交网络均可用于推断用户常驻位置。现有基于文本和社交网络的用户常驻位置预测方法对文本的位置指示性特征挖掘不充分,而用户文本中地名等位置指示... 社交用户的文本具有地理差异性,并且社交关系密切的用户之间居住位置更近,因而文本和社交网络均可用于推断用户常驻位置。现有基于文本和社交网络的用户常驻位置预测方法对文本的位置指示性特征挖掘不充分,而用户文本中地名等位置指示信息却提供了最有用的位置信号。因此,本文提出一种基于地理命名实体识别(GER)和图卷积神经网络(GCN)的社交用户位置预测方法。首先,通过地理命名实体识别方法对用户文本进行过滤以凸显位置指示性特征;其次,基于提及关系和关注与被关注关系抽取社交网络;再次,结合社交网络和用户文本内容,采用基于图卷积神经网络的方法进行用户常驻位置预测;最后,将GER-GCN与GCN以及最新研究成果进行比较,并探究该模型的小样本学习能力及其影响因素。基于Geotext数据集和2个微博数据集的实验表明:①GER文本过滤方法可显著提升用户位置预测精度;②在所有实验中,GER-GCN的预测精度最高,并在基准数据集GeoText上比最新研究成果提升1%~2%;③在最小监督的现实场景中,本文印证了GER-GCN模型的小样本学习能力,并发现社交网络质量对其小样本学习能力起到决定性作用。实验结果验证了GER-GCN方法的先进性,且该方法符合社交媒体现实场景的应用需求。 展开更多
关键词 社交用户 常驻位置 地名 社交网络 多视图 地理命名实体识别 图卷积神经网络 小样本学习
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部