中文实体抽取(Chinese named entity recognition,CNER)是中文信息抽取任务中的关键一步,是问答系统、机器翻译和知识图谱等下游任务的基础,其方法主要分为知识驱动和数据驱动两大类。然而基于规则、词典与机器学习的传统知识驱动方法...中文实体抽取(Chinese named entity recognition,CNER)是中文信息抽取任务中的关键一步,是问答系统、机器翻译和知识图谱等下游任务的基础,其方法主要分为知识驱动和数据驱动两大类。然而基于规则、词典与机器学习的传统知识驱动方法存在忽视上下文语义信息、计算成本高和低召回率的问题,限制了CNER技术的发展。介绍了CNER的定义和发展历程。详细整理了CNER任务的典型数据集、训练工具、序列标注方式和模型评价指标。对基于数据驱动的方法进行了总结,将数据驱动的方法划分为基于深度学习、预训练语言模型和中文实体关系联合抽取等方法,并分析了数据驱动方法在不同领域的实际应用场景。对CNER任务的未来研究方向进行了展望,为新方法的提出提供一定参考。展开更多
卡林型金矿中金的赋存状态一直是矿物学和矿床学的研究重点之一。我国右江盆地卡林型金矿中金的赋存状态长期存在纳米金颗粒(包裹体金)和晶格金之争(Feng Hongye et al.,2021)。黄铁矿在金矿床中通常作为主要载金矿物出现,其晶体内部结...卡林型金矿中金的赋存状态一直是矿物学和矿床学的研究重点之一。我国右江盆地卡林型金矿中金的赋存状态长期存在纳米金颗粒(包裹体金)和晶格金之争(Feng Hongye et al.,2021)。黄铁矿在金矿床中通常作为主要载金矿物出现,其晶体内部结构及微量元素组份特征可以用来限定成矿流体的性质、来源与演化规律、反映成矿过程、约束矿床成因等,离散不可见金的形成途径.展开更多
文摘中文实体抽取(Chinese named entity recognition,CNER)是中文信息抽取任务中的关键一步,是问答系统、机器翻译和知识图谱等下游任务的基础,其方法主要分为知识驱动和数据驱动两大类。然而基于规则、词典与机器学习的传统知识驱动方法存在忽视上下文语义信息、计算成本高和低召回率的问题,限制了CNER技术的发展。介绍了CNER的定义和发展历程。详细整理了CNER任务的典型数据集、训练工具、序列标注方式和模型评价指标。对基于数据驱动的方法进行了总结,将数据驱动的方法划分为基于深度学习、预训练语言模型和中文实体关系联合抽取等方法,并分析了数据驱动方法在不同领域的实际应用场景。对CNER任务的未来研究方向进行了展望,为新方法的提出提供一定参考。
文摘卡林型金矿中金的赋存状态一直是矿物学和矿床学的研究重点之一。我国右江盆地卡林型金矿中金的赋存状态长期存在纳米金颗粒(包裹体金)和晶格金之争(Feng Hongye et al.,2021)。黄铁矿在金矿床中通常作为主要载金矿物出现,其晶体内部结构及微量元素组份特征可以用来限定成矿流体的性质、来源与演化规律、反映成矿过程、约束矿床成因等,离散不可见金的形成途径.