期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
多粒度信息关系增强的多标签文本分类 被引量:3
1
作者 李芳芳 苏朴真 +2 位作者 段俊文 张师超 毛星亮 《软件学报》 EI CSCD 北大核心 2023年第12期5686-5703,共18页
基于深度学习的多标签文本分类方法存在两个主要缺陷:缺乏对文本信息多粒度的学习,以及对标签间约束性关系的利用.针对这些问题,提出一种多粒度信息关系增强的多标签文本分类方法.首先,通过联合嵌入的方式将文本与标签嵌入到同一空间,... 基于深度学习的多标签文本分类方法存在两个主要缺陷:缺乏对文本信息多粒度的学习,以及对标签间约束性关系的利用.针对这些问题,提出一种多粒度信息关系增强的多标签文本分类方法.首先,通过联合嵌入的方式将文本与标签嵌入到同一空间,并利用BERT预训练模型获得文本和标签的隐向量特征表示.然后,构建3个多粒度信息关系增强模块:文档级信息浅层标签注意力分类模块、词级信息深层标签注意力分类模块和标签约束性关系匹配辅助模块.其中,前两个模块针对共享特征表示进行多粒度学习:文档级文本信息与标签信息浅层交互学习,以及词级文本信息与标签信息深层交互学习.辅助模块通过学习标签间关系来提升分类性能.最后,所提方法在3个代表性数据集上,与当前主流的多标签文本分类算法进行了比较.结果表明,在主要指标Micro-F1、Macro-F1、nDCG@k、P@k上均达到了最佳效果. 展开更多
关键词 注意力机制 多标签文本分类 标签关系 多粒度信息
下载PDF
全局和局部信息融合的案情关键要素识别
2
作者 毛星亮 陈晓红 +2 位作者 宁肯 李芳芳 张师超 《软件学报》 EI CSCD 北大核心 2023年第12期5724-5736,共13页
司法人工智能中主要挑战性问题之一是案情关键要素识别,现有方法仅将案情要素作为一个命名实体识别任务,导致识别出的多数信息是无关的.另外,也缺乏对文本的全局信息和词汇局部信息的有效利用,导致要素边界识别的效果不佳.针对这些问题... 司法人工智能中主要挑战性问题之一是案情关键要素识别,现有方法仅将案情要素作为一个命名实体识别任务,导致识别出的多数信息是无关的.另外,也缺乏对文本的全局信息和词汇局部信息的有效利用,导致要素边界识别的效果不佳.针对这些问题,提出一种融合全局和局部信息的关键案情要素识别方法.所提方法首先利用BERT模型作为司法文本的输入共享层以提取文本特征.然后,在共享层之上建立司法案情要素识别、司法文本分类(全局信息)、司法中文分词(局部信息)这3个子任务进行联合学习模型.最后,在两个公开数据集上测试所提方法的效果,结果表明:所提方法F1值均超过了现有的先进方法,提高了要素实体分类的准确率并减少了识别边界错误问题. 展开更多
关键词 信息融合 多任务联合学习 关键案情 要素识别
下载PDF
基于语义关联的中文网页主题词提取方法研究 被引量:5
3
作者 李芳芳 葛斌 +1 位作者 毛星亮 汤大权 《计算机应用研究》 CSCD 北大核心 2011年第1期105-107,123,共4页
提出了一种基于语义关联的中文网页主题词提取方法,首先借助滑动窗口和"知网"计算词语间的语义相似度,形成候选名词对集合;然后基于该集合生成无向图表示词语间的语义联系,并通过该无向图对主题词权重进行建模;最后选取权值... 提出了一种基于语义关联的中文网页主题词提取方法,首先借助滑动窗口和"知网"计算词语间的语义相似度,形成候选名词对集合;然后基于该集合生成无向图表示词语间的语义联系,并通过该无向图对主题词权重进行建模;最后选取权值较高的名词作为主题词。实验结果表明,相比未建立语义关联的主题词提取方法,本方法在查准率、召回率和F1测度值上均有一定的提高,当提取主题词个数为7时,本方法召回率和F1测度值达到最大值,且分别较传统方法最大值提高了12.5%和9.53%。 展开更多
关键词 语义关联 中文网页 主题词 权重
下载PDF
基于多任务联合训练的法律文本机器阅读理解模型 被引量:5
4
作者 李芳芳 任星凯 +2 位作者 毛星亮 林中尧 刘熙尧 《中文信息学报》 CSCD 北大核心 2021年第7期109-117,125,共10页
随着裁判文书等司法大数据不断积累,如何将人工智能与法律相结合成为了法律智能研究的热点。该文针对2020中国法研杯司法人工智能挑战赛(CAIL2020)的机器阅读理解任务,提出了一种基于多任务联合训练的机器阅读理解模型。该模型将阅读理... 随着裁判文书等司法大数据不断积累,如何将人工智能与法律相结合成为了法律智能研究的热点。该文针对2020中国法研杯司法人工智能挑战赛(CAIL2020)的机器阅读理解任务,提出了一种基于多任务联合训练的机器阅读理解模型。该模型将阅读理解任务划分为四个子模块:文本编码模块、答案抽取模块、答案分类模块和支持句子判别模块。此外,该文提出了一种基于TF-IDF的"问题-文章句子"相似度匹配的数据增强方法。该方法对中国法研杯2019的训练集进行重新标注,实现数据增强。通过以上方法,最终该集成模型在2020中国法研杯机器阅读理解任务中联合F1值为74.49,取得全国第一名。 展开更多
关键词 中国法研杯 机器阅读理解 多任务联合训练
下载PDF
我国公共卫生安全应急情报区块链共享体系研究 被引量:12
5
作者 陈晓红 徐雪松 +4 位作者 邵红燕 胡东滨 粟芸 毛星亮 唐湘博 《中国工程科学》 CSCD 北大核心 2021年第5期41-50,共10页
新型冠状病毒肺炎疫情(以下简称“新冠肺炎疫情”)已经造成严重的人员伤亡和经济损失,加强突发性公共卫生安全应急情报协同机制研究,构建更加高效可信的情报共享体系,已经成为完善和优化我国公共卫生安全情报管理的核心问题。本文分析... 新型冠状病毒肺炎疫情(以下简称“新冠肺炎疫情”)已经造成严重的人员伤亡和经济损失,加强突发性公共卫生安全应急情报协同机制研究,构建更加高效可信的情报共享体系,已经成为完善和优化我国公共卫生安全情报管理的核心问题。本文分析了新冠肺炎疫情下公共卫生安全应急情报的结构特征和内涵,提出了我国突发疫情应急情报组织管理的新架构。结合区块链分布式信任机制,构建了分层级的应急部门情报共享区块链模型,深入阐述了应急情报联盟区块链、区块结构以及侧链交互机制的实现方式,给出了应急情报的上传、共享、下载与回溯流程。以南京市疫情发展为实证,通过情景模拟来验证本模型的有效性,并提出应对疫情的政策建议。为我国构建一个满足重大疫情防控需求且有力支撑平战结合、平疫结合应急管理的新型公共卫生情报体系提供决策参考及可行路径。 展开更多
关键词 新冠疫情 公共卫生安全 应急情报 共享 联盟链
下载PDF
Detection of artificial pornographic pictures based on multiple features and tree mode 被引量:3
6
作者 MAO Xing-liang LI Fang-fang +1 位作者 LIU Xi-yao ZOU Bei-ji 《Journal of Central South University》 SCIE EI CAS CSCD 2018年第7期1651-1664,共14页
It is easy for teenagers to view pornographic pictures on social networks. Many researchers have studied the detection of real pornographic pictures, but there are few studies on those that are artificial. In this wor... It is easy for teenagers to view pornographic pictures on social networks. Many researchers have studied the detection of real pornographic pictures, but there are few studies on those that are artificial. In this work, we studied how to detect artificial pornographic pictures, especially when they are on social networks. The whole detection process can be divided into two stages: feature selection and picture detection. In the feature selection stage, seven types of features that favour picture detection were selected. In the picture detection stage, three steps were included. 1) In order to alleviate the imbalance in the number of artificial pornographic pictures and normal ones, the training dataset of artificial pornographic pictures was expanded. Therefore, the features which were extracted from the training dataset can also be expanded too. 2) In order to reduce the time of feature extraction, a fast method which extracted features based on the proportionally scaled picture rather than the original one was proposed. 3) Three tree models were compared and a gradient boost decision tree (GBDT) was selected for the final picture detection. Three sets of experimental results show that the proposed method can achieve better recognition precision and drastically reduce the time cost of the method. 展开更多
关键词 multiple feature artificial pornographic pictures picture detection gradient boost decision tree
下载PDF
高楼:还要多高?
7
作者 毛星亮 《宁波经济(财经视点)》 2011年第1期46-46,56,共2页
最后一根钢梁起吊完毕时,站在直播视频前观看这一仪式的人激动不已,现场响起掌声。17个月,天津环球金融中心津塔写字楼实现了结构封顶。从天津火车站走出来,可以轻易“搜索”到它的身影。
关键词 高楼 金融中心 写字楼 火车站 天津
下载PDF
SIFT算法优化及其用于遥感影像自动配准 被引量:61
8
作者 李芳芳 肖本林 +1 位作者 贾永红 毛星亮 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2009年第10期1245-1249,共5页
对传统SIFT算法从特征点提取时间和匹配精度上进行了优化,基于优化算法提取的特征点对构建三角网进行小面元微分纠正配准。试验结果表明,该方法是一种有效的遥感影像自动配准方法。
关键词 SIFT算法 小面元微分纠正 影像配准
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部