-
题名中文文本中时间信息抽取及规范化方法
被引量:9
- 1
-
-
作者
宋国民
张三强
贾奋励
姜松言
-
机构
信息工程大学
[
-
出处
《测绘科学技术学报》
北大核心
2019年第5期538-544,共7页
-
基金
国家重点研发项目(2017YFB0503500)
国家自然科学基金项目(41671407,41701457,41801317)。
-
文摘
时间信息抽取和规范化表达在时空泛在信息处理、关联、聚合和内容服务中具有重要作用。设计并实现了一种基于规则的时间信息抽取和规范化表达的方法。首先,结合中文文本中时间信息描述的特点,定义了基本时间单元和派生时间单元,并由时间单元组合形成不同的时间表达式;然后,构建了时间词汇词典和时间表达式抽取的正则表达式模板;最后,设计了时间推理和计算的方法,实现了时间信息的规范化表达。基于中文文本语料进行了时间信息抽取测试。实验结果表明,本文方法具有较好的时间信息抽取效果。
-
关键词
中文文本
时间
信息抽取
规范化
时间表达式
正则表达式
时间推理
-
Keywords
Chinese text
temporal
information extraction
normalization
temporal expression
regular expression
temporal reasoning
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
-
-
题名结合地名知识和位置信息的中文地名匹配方法
被引量:4
- 2
-
-
作者
姜松言
宋国民
贾奋励
陈令羽
张蓝天
-
机构
信息工程大学
北京市遥感信息研究所
-
出处
《测绘通报》
CSCD
北大核心
2022年第5期120-125,共6页
-
基金
国家自然科学基金(42171456)
国家重点研发计划(2017YFB0503503)
国家自然科学基金青年基金(41801317)。
-
文摘
针对中文地名数据中存在的“同名异地”“异地同名”等歧义问题,本文提出了一种结合地名知识和位置信息的地名匹配方法。首先基于特征词的规则匹配模式对地名名称结构进行了解析。然后结合地名的位置信息实现中文地名匹配;同时,基于地名的行政区划信息和实体信息关联多源地名数据,构建地名知识库。最后以兴趣点数据为例,基于名称相似度和位置相似度匹配地名数据中的地名信息,并以知识图谱的形式进行存储和表达。
-
关键词
地名知识
地名匹配
相似度计算
数据消歧
-
Keywords
toponymy knowledge
place names matching
similarity calculation
data disambiguation
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
-
-
题名基于席尔宾斯基地毯的矢量地理数据关键属性信息伪装
- 3
-
-
作者
陈令羽
姜松言
宋国民
-
机构
信息工程大学
-
出处
《信息工程大学学报》
2022年第1期103-107,共5页
-
基金
国家自然科学基金资助项目(41801317)。
-
文摘
为提高矢量地理数据关键属性的无损性和安全性,提出一种基于分形图案对矢量地理数据关键属性信息进行伪装的方法。首先,根据输入参数生成相应的分形图案;其次,依据分形图案和性质对矢量数据中包含的多个关键属性逐级进行伪装变换;最后,输出伪装后的矢量地理数据。结果表明,基于该发明进行的矢量地理数据关键信息伪装,能够增强数据的保密性和迷惑性,伪装后的数据既保持了原来的数据格式,又对其中的关键信息进行了保护。
-
关键词
信息伪装
矢量地理数据
席尔宾斯基地毯
关键属性
-
Keywords
information disguising
vector geographic data
sierpinski carpet
key attributes
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
-