期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
SOM-NCSCM+:抽取式神经网络中文标题生成方法研究
1
作者 资康莉 王石 曹存根 《高技术通讯》 CAS 2023年第8期836-848,共13页
标题生成作为文本摘要任务的一个分支,能够帮助人们高效获取信息。本文针对中文标题生成任务面临的大规模、高质量中文标注数据缺乏的问题,利用标题往往可由原文中的词语来构成的特点,从将无监督学习模型与有监督的序列标注模型结合的... 标题生成作为文本摘要任务的一个分支,能够帮助人们高效获取信息。本文针对中文标题生成任务面临的大规模、高质量中文标注数据缺乏的问题,利用标题往往可由原文中的词语来构成的特点,从将无监督学习模型与有监督的序列标注模型结合的角度出发,提出了融合聚类模型和主题模型的抽取式深度神经网络中文标题生成方法和模型。在缺乏人工分类标注信息的中文新闻数据集上,该模型可利用聚类和主题模型自动挖掘数据内部潜在的特征信息,获得不同的数据簇及各簇内的主题词来辅助中文新闻标题生成,使模型在具有潜在主题类别特征的、标题质量参差的中文新闻数据集上都具有较好的适用性。本文提出的中文标题生成模型在互联网上公开的中文新闻标题数据集上的实验结果也表明其在微观F1、BLEU、ROUGE、压缩率等评价指标上都取得了较基准模型更好的效果。 展开更多
关键词 中文标题生成 神经网络模型 主题模型 聚类模型 序列标注
下载PDF
基于BiLSTM-CRF的中文分组单字错误识别方法研究 被引量:4
2
作者 曹阳 曹存根 +1 位作者 资康莉 王石 《中文信息学报》 CSCD 北大核心 2023年第4期156-165,共10页
近十多年来,中文自动校对取得了许多重要进展,但是单字错别字识别精度和召回率低一直是该领域的一个重要问题。该文提出一种基于BiLSTM-CRF的神经网络模型和单字分组策略识别中文错别字的方法。首先,该文提出一种构建分组单字混淆集的方... 近十多年来,中文自动校对取得了许多重要进展,但是单字错别字识别精度和召回率低一直是该领域的一个重要问题。该文提出一种基于BiLSTM-CRF的神经网络模型和单字分组策略识别中文错别字的方法。首先,该文提出一种构建分组单字混淆集的方法,并根据采集的分组单字混淆集自动生成错别字识别训练语料,构造了一个含有13组的汉字单字错别字识别训练语料。其次,针对传统的错别字识别方法在单字错别字召回率较低的问题,该文对错别字识别训练语料中错别字采用多标签标记的策略。再次,针对训练样本存在的数据稀疏问题,该文对训练数据集中的人名、地名、时间和机构名称这四类词语进行抽象。最后,该文利用BiLSTM-CRF的模型在错别字识别训练语料上进行训练。实验结果表明,该文提出的单字错别字识别方法在13组单字上的平均识别精确率为87.30%,平均召回率为84.36%。 展开更多
关键词 BiLSTM-CRF 分组策略 分组单字混淆集 错别字识别训练语料
下载PDF
从地缘政治看云南在“一带一路”中的机遇和作用 被引量:1
3
作者 资康莉 《丝路视野》 2017年第9期67-68,71,共3页
2014年11月8日在加强互联互通伙伴关系对话会上,习近平总书记指出:共同建设丝绸之路经济带和21世纪海上丝绸之路与互联互通相融相近、相辅相成,如果将“一带一路”比喻为亚洲腾飞的两只翅膀,那么互联互通就是两只翅膀的血脉经络。2... 2014年11月8日在加强互联互通伙伴关系对话会上,习近平总书记指出:共同建设丝绸之路经济带和21世纪海上丝绸之路与互联互通相融相近、相辅相成,如果将“一带一路”比喻为亚洲腾飞的两只翅膀,那么互联互通就是两只翅膀的血脉经络。2015年3月28日,国家发展改革委、外交部、商务部联合发布了《推动共建丝绸之路经济带和21世纪海上丝绸之路的愿景与行动》,其中提出了:“发挥云南区位优势,推进与周边国家的国际运输通道建设,打造大湄公河次区域经济合作新高地,建设成为面向南亚、东南亚的辐射中心。”本文将借助地缘政治及其理论对云南在“一带一路”中的机遇和作用作一定的探究,旨在引发更多的思考,以便集思广益、群策群力、最大限度地发挥云南的现有条件及其潜力,使云南在稳步推进“一带一路”的建设和发展中发挥更大或应有的作用。 展开更多
关键词 地缘政治 一带一路 云南
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部