期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
面向知识产权的科技资源画像构建方法 被引量:4
1
作者 杨佳鑫 杜军平 +2 位作者 邵蓥侠 李昂 奚军庆 《软件学报》 EI CSCD 北大核心 2022年第4期1439-1450,共12页
大数据时代,面向知识产权的科技资源呈现数据规模大、时效性高和价值密度较低等趋势,为有效利用知识产权资源带来严峻的挑战.同时,各个国家对知识产权中隐匿信息挖掘的需求日益增加,使得面向知识产权的科技资源画像构建成为当下的研究热... 大数据时代,面向知识产权的科技资源呈现数据规模大、时效性高和价值密度较低等趋势,为有效利用知识产权资源带来严峻的挑战.同时,各个国家对知识产权中隐匿信息挖掘的需求日益增加,使得面向知识产权的科技资源画像构建成为当下的研究热点.目标是通过智能化的数据获取、实体识别以及可视化的方式对知识产权进行画像构建.然而,现有的科技资源画像构建方法只适用于结构化数据,忽略了词语的词性对句子语义理解的影响.因此,提出了一种新颖的面向知识产权的科技资源画像构建算法,针对自动获取的知识产权资源,通过引入词性级别的注意力机制提高实体识别准确率,并以可视化的形式构建知识产权科技资源画像.相比于现有方法,所提出的面向知识产权的科技资源画像构建方法具有以下优势:1)该算法利用词语的词性信息学习句子语义层面的含义,并融合注意力机制,以有监督的方式避免语义理解中的歧义;2)该模型能够智能自动地完成科技数据获取、命名实体识别、科技资源画像构建;3)大量实验结果表明,所提方法利用词语的词性进行有监督学习,在命名实体识别任务中综合性能优于对比算法. 展开更多
关键词 科技资源画像 实体识别 数据获取 知识产权
下载PDF
面向科技学术会议的命名实体识别研究 被引量:3
2
作者 于润羽 杜军平 +2 位作者 薛哲 徐欣 奚军庆 《智能系统学报》 CSCD 北大核心 2022年第1期50-58,共9页
针对通用领域的命名实体识别算法难以充分挖掘到科技学术会议论文数据中语义信息的问题,提出一种结合关键词-字符长短期记忆网络和注意力机制的科技学术会议命名实体识别算法。首先对论文数据集中的关键词特征进行预训练,获得词汇层面... 针对通用领域的命名实体识别算法难以充分挖掘到科技学术会议论文数据中语义信息的问题,提出一种结合关键词-字符长短期记忆网络和注意力机制的科技学术会议命名实体识别算法。首先对论文数据集中的关键词特征进行预训练,获得词汇层面的潜在语义信息,将其与字符级别的语义信息融合,解决错误的词汇边界影响识别准确率的问题。然后,将双向长短期记忆网络和注意力机制输出的向量进行融合,同时考虑上下文和全局信息。最后利用条件随机场进行实体的识别。实验表明,所提出的算法在不同数据集上都取得了较好的识别效果,和对比算法相比,准确率、召回率、F_(1)指数均有一定程度的提升。 展开更多
关键词 命名实体识别 长短期记忆网络 注意力机制 字词融合 精准画像 自然语言处理 信息抽取 预训练模型
下载PDF
分布式系统设计中NewSQL数据库技术的应用 被引量:4
3
作者 奚军庆 李绍俊 李波 《长江信息通信》 2021年第5期64-67,共4页
数据库是信息化关键支撑技术,伴随着物联网、移动互联网、云计算及数据采集技术的发展,分布式系统成为信息化主流,对数据的存储和管理在数据量及处理模式上提出了新的挑战。首先分析了基于传统集中式存储与管理模式在处理和应用大数据... 数据库是信息化关键支撑技术,伴随着物联网、移动互联网、云计算及数据采集技术的发展,分布式系统成为信息化主流,对数据的存储和管理在数据量及处理模式上提出了新的挑战。首先分析了基于传统集中式存储与管理模式在处理和应用大数据方面的局限性,然后在分析数据库发展历程的基础上,结合大数据存储对数据库存储能力的可扩展性及数据处理和访问的高并发以及一致性要求,厘清分布式数据库的概念、主要特征及发展趋势,剖析NewSQL数据库关键技术,探讨分布式数据应用的结构体系和策略。 展开更多
关键词 分布式系统 关系数据库 NewSQL数据库 弹性扩缩容 分布式一致性
下载PDF
面向司法大数据的文本主题OLAP系统 被引量:1
4
作者 王玲 刘晓清 +2 位作者 何震瀛 奚军庆 项焱 《智能计算机与应用》 2021年第9期28-34,41,共8页
随着大数据技术的发展,加强司法大数据应用成为推进司法现代化建设的重要手段,如何处理司法大数据中的非结构化数据亟待解决。为此,本文提出了面向司法大数据的文本主题OLAP系统。在离线数据处理模块中,设计了Span数据模型,并定义了多... 随着大数据技术的发展,加强司法大数据应用成为推进司法现代化建设的重要手段,如何处理司法大数据中的非结构化数据亟待解决。为此,本文提出了面向司法大数据的文本主题OLAP系统。在离线数据处理模块中,设计了Span数据模型,并定义了多种针对该模型的操作符;设计了基于规则的文本行政区划归类方法,并构建了主题立方体。在线上查询模块中,实现了基于倒排索引的关键词搜索方法和最大独特主题范围查询,提供了上卷、下钻、切片等功能。通过在大规模的真实数据集上对系统进行测试,实验结果证明了该系统的合理性和实用性。 展开更多
关键词 大数据处理 OLAP 行政区划归类 独特主题
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部