期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
Echo:以语音交互为入口的软件定义音箱 被引量:2
1
作者 颜永红 《网络新媒体技术》 2018年第2期12-15,共4页
亚马逊Echo,作为智能音箱的鼻祖,自上市以来取得了举世瞩目的成功。Echo涉及了语音交互的完整生态链,是第一款严格意义上以语音交互技术为核心的成功产品,同时它也标志了软件定义家电时代的到来。本文试图对Echo的成功原因进行分析,希... 亚马逊Echo,作为智能音箱的鼻祖,自上市以来取得了举世瞩目的成功。Echo涉及了语音交互的完整生态链,是第一款严格意义上以语音交互技术为核心的成功产品,同时它也标志了软件定义家电时代的到来。本文试图对Echo的成功原因进行分析,希望对从事语音产品的研发人员有所启发。 展开更多
关键词 亚马逊Echo 智能音箱 语音交互 软件定义家电
下载PDF
结合注意力机制的雷达多信号动作识别方法
2
作者 高鹏 张岩 +2 位作者 唐新余 王蒙 季文飞 《计算机技术与发展》 2023年第1期157-164,共8页
雷达动作特征谱图对走、摔等较为宽幅的人体动作表征效果差,单一特征和不匹配特征数据结构的分类方法会降低动作识别的性能。针对以上问题,提出一种结合注意力机制的雷达多信号特征动作识别方法。首先,使用配置时分复用模式的多输入多... 雷达动作特征谱图对走、摔等较为宽幅的人体动作表征效果差,单一特征和不匹配特征数据结构的分类方法会降低动作识别的性能。针对以上问题,提出一种结合注意力机制的雷达多信号特征动作识别方法。首先,使用配置时分复用模式的多输入多输出毫米波雷达采集动作回波,将回波处理成短时能量、频率质心、相位变化(水平、俯仰)四维时序信号特征;然后,根据信号特征数据结构设计了多信号序列融合分类网络,该网络由1DCNN对信号抽取高维特征,再将特征送入GRU以充分提取时序规律,并引入Attention机制对重要特征映射加权赋予GRU隐含状态不同的权重,最终通过SoftMax层完成动作分类;最后,在实际采集的雷达多信号数据集上进行实验,结果表明,多信号序列特征可以充分表征人体动作,所设计的网络收敛速度快,对8种不同的动作分类,平均正确率达到了98.5%。 展开更多
关键词 人体动作识别 毫米波雷达 多信号特征 卷积神经网络 注意力机制
下载PDF
基于动态可配置规则的数据清洗方法 被引量:17
3
作者 朱会娟 蒋同海 +3 位作者 周喜 程力 赵凡 马博 《计算机应用》 CSCD 北大核心 2017年第4期1014-1020,共7页
针对传统数据清洗方法通过硬编码方法来实现业务逻辑而导致系统的可重用性、可扩展性与灵活性较差等问题,提出了一种基于动态可配置规则的数据清洗方法——DRDCM。该方法支持多种类型规则间的复杂逻辑运算,并支持多种脏数据修复行为,集... 针对传统数据清洗方法通过硬编码方法来实现业务逻辑而导致系统的可重用性、可扩展性与灵活性较差等问题,提出了一种基于动态可配置规则的数据清洗方法——DRDCM。该方法支持多种类型规则间的复杂逻辑运算,并支持多种脏数据修复行为,集数据检测、数据修复与数据转换于一体,具有跨领域、可重用、可配置、可扩展等特点。首先,对DRDCM方法中的数据检测和数据修复的概念、实现步骤以及实现算法进行描述;其次,阐述了DRDCM方法中支持的多种规则类型以及规则配置;最后,对DRDCM方法进行实现,并通过实际项目数据集验证了该实现系统在脏数据修复中,丢弃修复行为具有很高的准确率,尤其是对需遵守法定编码规则的属性(例如身份证号码)处理时其准确率可达100%。实验结果表明,DRDCM实现系统可以将动态可配置规则无缝集成于多个数据源和多种不同应用领域且该系统的性能并不会随着规则条数增加而极速降低,这也进一步验证了DRDCM方法在真实环境中的切实可行性。 展开更多
关键词 大数据 数据质量 数据清洗 动态可配置规则 数据预处理
下载PDF
前端整合框架及在科研安全生产平台中的应用 被引量:1
4
作者 张睿 张斌 《计算机工程与设计》 北大核心 2017年第4期1086-1092,共7页
为提高应用系统的前端性能及开发效率,提出一种前端整合框架,剖析其整合原理及整合的关键技术。以AngularJS为核心js框架,Node.js作为基础环境,集成gulp、bower及一系列插件,融合组件化页面的前端开发思想,具有自动化构建、模块化的目... 为提高应用系统的前端性能及开发效率,提出一种前端整合框架,剖析其整合原理及整合的关键技术。以AngularJS为核心js框架,Node.js作为基础环境,集成gulp、bower及一系列插件,融合组件化页面的前端开发思想,具有自动化构建、模块化的目录结构和开发策略以及组件化开发过程的特点;根据前端整合框架以及科研安全生产理论,设计实现跨终端、基于角色的科研安全生产平台。实验结果表明,前端整合框架在跨终端的、企业级的、任意规模的应用开发中具有广阔的应用前景。 展开更多
关键词 前端 框架 模块化 自动化构建 科研安全生产平台
下载PDF
使用深度学习的多通道水下目标识别 被引量:16
5
作者 李琛 黄兆琼 +3 位作者 徐及 郭新毅 宫在晓 颜永红 《声学学报》 EI CSCD 北大核心 2020年第4期506-514,共9页
为解决低信噪比条件下水下目标识别率低的问题,提出一种适用于多通道水听器阵列的深度学习水下目标识别方法。首先是采用子通道特征级联的方法利用多通道信息;在特征提取方面,采用对信号的不同频率区间进行加权的特征提取器,并对提取的... 为解决低信噪比条件下水下目标识别率低的问题,提出一种适用于多通道水听器阵列的深度学习水下目标识别方法。首先是采用子通道特征级联的方法利用多通道信息;在特征提取方面,采用对信号的不同频率区间进行加权的特征提取器,并对提取的特征进行正则规整;最后采用深度神经网络(Deep Neural Network,DNN)实现目标识别。实验首先在仿真条件下对所提出方法的有效性进行验证,结果表明在-15 dB信噪比条件下的五目标识别任务中,使用多通道级联特征的深度神经网络的识别正确率达到96.7%,显著高于基于支持向量机(Support Vector Machine,SVM)的方法。在后续的湖上试验中,深度神经网络的平均正确率达到96.0%,进一步验证了所提出方法的有效性。 展开更多
关键词 深度神经网络 深度学习 水下目标识别 通道特征 特征提取 平均正确率 水听器阵列 频率区间
下载PDF
基于词向量的维吾尔语词项归一化方法 被引量:5
6
作者 罗延根 李晓 +3 位作者 蒋同海 杨雅婷 周喜 王磊 《计算机工程》 CAS CSCD 北大核心 2018年第2期220-225,共6页
使用无监督的方法,将口语文本中的非正规维吾尔语词项归一化到正规文本中意思相近的正规词,基于神经网络,利用大规模语料将维吾尔语单词映射到低维向量空间,对向量空间的非正规词进行聚类。引入一个贪心解码器对非正规词做归一化处理,... 使用无监督的方法,将口语文本中的非正规维吾尔语词项归一化到正规文本中意思相近的正规词,基于神经网络,利用大规模语料将维吾尔语单词映射到低维向量空间,对向量空间的非正规词进行聚类。引入一个贪心解码器对非正规词做归一化处理,并进行重采样迭代,从而将之前未能成功归一化的非正规词归一化。实验结果表明,使用该方法对维汉机器翻译的待翻译口语文本进行前编辑后,生成的译文质量有显著提高。该方法给维汉口语文本机器翻译系统提供一个前处理的流程,在缺乏双语口语平行语料的情况下也能有效提高机器翻译系统性能。 展开更多
关键词 维吾尔语口语文本 非正规词 归一化 神经网络 重采样
下载PDF
关系型数据的知识抽取和RDF转换框架及实现 被引量:8
7
作者 张永威 张岩 +1 位作者 唐新余 王蒙 《计算机工程与应用》 CSCD 北大核心 2022年第17期213-223,共11页
关系数据库是行业中广泛使用的数据存储和管理方案,根据自定义的本体模型从关系型数据中进行知识抽取并转换成RDF是构建行业知识图谱的关键步骤。但是当前关系数据的知识抽取方案,需要进行大量的查询语句和映射的编辑工作,映射语句编码... 关系数据库是行业中广泛使用的数据存储和管理方案,根据自定义的本体模型从关系型数据中进行知识抽取并转换成RDF是构建行业知识图谱的关键步骤。但是当前关系数据的知识抽取方案,需要进行大量的查询语句和映射的编辑工作,映射语句编码的工作量和映射的维护是关系型数据的知识抽取的主要障碍。针对以上问题提出一种能够自动解析关系数据和本体模型并生成对应关系,支持可视化调整和修正的关系型知识抽取转换框架。该框架简化了映射编辑和维护工作,提供了更自动化和简单易用的关系型数据的知识抽取的解决方案。最后应用该框架进行知识图谱的构建的实验表明,该框架能够较为高效地对关系数据进行知识抽取并转换成RDF。 展开更多
关键词 知识图谱 知识抽取 关系型数据 RDB2RDF 本体模型
下载PDF
基于循环时间卷积网络的序列流推荐算法 被引量:6
8
作者 李太松 贺泽宇 +2 位作者 王冰 颜永红 唐向红 《计算机科学》 CSCD 北大核心 2020年第3期103-109,共7页
针对循环神经网络(Recurrent Neural Network,RNN)模型在序列流推荐中只能从宏观上捕捉序列的演变模式,忽略了物品(Item)间内部的微观联系,无法长程建模序列数据的变化规律的问题,提出了多维度序列建模算法循环时间卷积网络(Recurrent T... 针对循环神经网络(Recurrent Neural Network,RNN)模型在序列流推荐中只能从宏观上捕捉序列的演变模式,忽略了物品(Item)间内部的微观联系,无法长程建模序列数据的变化规律的问题,提出了多维度序列建模算法循环时间卷积网络(Recurrent Temporal Convolutional Network,RTCN)。首先,将每个物品表示成定长向量,采用多层因果卷积和扩张卷积操作扩大感受野范围,建立序列元素间的长程依赖关系。利用残差连接网络提取不同层次的特征信息,解决反向传播中梯度衰减甚至消失的问题。综合设计时间卷积网络(Temporal Convolutional Network,TCN)提取序列流中前后物品间的局部特征,将物品信息映射到隐藏空间,得到细粒度的特征向量。为进一步建立元素间的宏观联系,将特征向量依次输入门限循环单元(Gated Recurrent Unit,GRU),迭代更新现有隐藏状态并预测下一时刻的输出。RTCN通过时间卷积网络,从输入序列流提取出长时间、多维度、细粒度的局部关联特征;经过门限循环网络,建模序列间的长距离依赖关系,捕捉序列元素的演变模式,并预测下一个出现的物品。利用网站、手机应用和音乐3个不同场景中的数据对模型进行了实验。实验结果显示,RTCN模型在召回率(Recall)和平均排序倒数(MRR)两个指标上比RNN模型高出6%~13%,比传统推荐算法高出9%~59%。通过对比不同的损失函数,模型在交叉熵损失函数下表现最优。此外,由于TCN中的卷积层具有多通道的结构,当数据维度丰富时,该模型对物品和用户的上下文信息具有很强的综合能力。 展开更多
关键词 推荐系统 深度学习 序列流推荐 时间卷积网络 循环神经网络
下载PDF
基于语义元数据的医养数据融合研究与实现 被引量:3
9
作者 季文飞 蒋同海 +2 位作者 王蒙 唐新余 陈光 《计算机应用与软件》 北大核心 2020年第5期38-43,共6页
传统的数据融合系统在进行医养数据融合时由于缺乏灵活性和扩展性,存在无法有效解决数据模型不统一、数据质量较差、无法进行统一可视化和数据访问等问题。针对以上问题,基于五元组表示的语义元数据,对数据模型、清洗和融合规则、数据... 传统的数据融合系统在进行医养数据融合时由于缺乏灵活性和扩展性,存在无法有效解决数据模型不统一、数据质量较差、无法进行统一可视化和数据访问等问题。针对以上问题,基于五元组表示的语义元数据,对数据模型、清洗和融合规则、数据可视化和访问进行建模和描述,研究并实现了医养数据融合系统,提供基于五元组描述的统一数据建模模型、数据清洗融合模型、数据可视化和访问模型。应用案例和实验结果表明,采用该系统能够动态进行建模和规则定制,满足区域医养数据融合对灵活性和扩展性的要求,同时满足对一定数据量下的处理响应时间的要求。 展开更多
关键词 智慧养老 医养融合 数据融合 数据可视化 语义元数据
下载PDF
调序规则表的深度过滤研究 被引量:4
10
作者 孔金英 李晓 +2 位作者 王磊 杨雅婷 罗延根 《计算机科学与探索》 CSCD 北大核心 2017年第5期785-793,共9页
机器翻译系统中调序规则表和翻译表一般规模都很大,对翻译表进行优化过滤一直都是研究热点,而过滤调序规则表的研究却近乎空白。将调序规则表的过滤当成短文本分类问题,提出了一种基于自动编码机(Autoencoder)的调序规则表过滤模型。该... 机器翻译系统中调序规则表和翻译表一般规模都很大,对翻译表进行优化过滤一直都是研究热点,而过滤调序规则表的研究却近乎空白。将调序规则表的过滤当成短文本分类问题,提出了一种基于自动编码机(Autoencoder)的调序规则表过滤模型。该模型首先使用一种基于自动编码机的分类器对调序规则进行打分评价,然后对调序规则表进行基于最小差异策略的过滤,最后使用过滤得到的调序规则表重新计算调序规则得分表用于机器翻译的解码过程。实验表明,在公开的英汉语料和维汉语料上使用该模型,可以在调序规则表减少40%的基础上分别将BLEU(bilingual evaluation understudy)值提高0.19和0.26。 展开更多
关键词 自动编码机 过滤模型 调序规则表 机器翻译
下载PDF
基于双语句对覆盖度的维汉机器翻译语料选取技术 被引量:1
11
作者 朱少林 杨雅婷 +2 位作者 米成刚 李晓 王磊 《中国科学技术大学学报》 CAS CSCD 北大核心 2017年第4期283-289,共7页
在进行语料的选取时,语料中的冗余信息包括词汇和句子层面的冗余.目前的方法主要集中在词汇层次的语料覆盖度进行选取,这种方法可以有效地降低词或者短语的信息冗余,但是没有考虑句子层次的覆盖度.为了从大规模的双语语料中选取较小规... 在进行语料的选取时,语料中的冗余信息包括词汇和句子层面的冗余.目前的方法主要集中在词汇层次的语料覆盖度进行选取,这种方法可以有效地降低词或者短语的信息冗余,但是没有考虑句子层次的覆盖度.为了从大规模的双语语料中选取较小规模的训练语料,得到与大规模训练相同甚至更优的翻译系统,基于双语句对覆盖度进行平行语料的选取,提出一种将unseen n-grams和编辑距离相结合进行语料的选取的方法.实验结果表明,该方法可以在使用较少训练语料的情况下,得到与原始训练翻译效果相同的翻译系统. 展开更多
关键词 统计机器翻译 双语句对 语料选取
下载PDF
面向维汉机器翻译的语料筛选技术研究 被引量:2
12
作者 孔金英 温政阳 +2 位作者 杨雅婷 王磊 李晓 《计算机应用研究》 CSCD 北大核心 2016年第12期3654-3657,共4页
统计机器翻译是目前主流的机器翻译技术,其在维汉翻译中良好的性能已经得到了广泛的认可。维汉统计机器翻译的最终结果同样是受这几方面的影响:翻译模型、语言模型、语料质量和规模等。旨在通过对维汉双语训练语料的筛选来提高最终的机... 统计机器翻译是目前主流的机器翻译技术,其在维汉翻译中良好的性能已经得到了广泛的认可。维汉统计机器翻译的最终结果同样是受这几方面的影响:翻译模型、语言模型、语料质量和规模等。旨在通过对维汉双语训练语料的筛选来提高最终的机器翻译性能。在相关学者的研究基础上,提出了改进的IBM1模型评价句对齐质量、双语语言模型困惑度进行语料筛选和多种筛选指标综合求交集的方法。这些方法没有语言特性的依赖,支持维汉双语语料的筛选。通过实验可证明,使用笔者提出的方法可以得到更优的维汉机器翻译结果。 展开更多
关键词 维汉机器翻译 语料筛选 语言模型
下载PDF
基于多策略的维吾尔文网页识别方法
13
作者 阿力木.木拉提 艾孜尔古丽 +1 位作者 杨雅婷 李晓 《中文信息学报》 CSCD 北大核心 2017年第1期133-139,共7页
经过对大量维吾尔文网站的调查与分析,该文从多语种混合网页中针对维吾尔文网页识别进行了研究,这对维吾尔语信息处理工作起着关键作用。首先该文探讨了维吾尔文不规范网页的字符编码转换规则及原理,以此对不规范维吾尔文字符进行了相... 经过对大量维吾尔文网站的调查与分析,该文从多语种混合网页中针对维吾尔文网页识别进行了研究,这对维吾尔语信息处理工作起着关键作用。首先该文探讨了维吾尔文不规范网页的字符编码转换规则及原理,以此对不规范维吾尔文字符进行了相应的处理,之后介绍了基于修改的N-Gram方法和基于维吾尔语常用词特征向量的两种方法,其中后者融合了维吾尔文常用候选词语料库及向量空间模型(Vector Space Model)。使用三种不同类型的维吾尔文网页文本作为本研究的数据集,在此基础上验证了该文提出的网页识别方法,以及采用不同的方法进行了网页识别的实验。实验结果表明,基于N-Gram的方法对正文较长的新闻或论坛网页的识别性能最佳,反而基于常用词特征向量的方法对短文本的网页识别性能优越N-Gram。所提方法对维吾尔文网页识别的整体性能达到90%以上,并验证了这两种方法的有效性。 展开更多
关键词 维吾尔文 网页识别 N-Gram方法 常用词 向量空间模型
下载PDF
维吾尔语和韩语形态分析之模型构建 被引量:3
14
作者 徐春 蒋同海 +1 位作者 于凯 姜文斌 《北京邮电大学学报》 EI CAS CSCD 北大核心 2018年第1期88-94,共7页
为维吾尔语和韩语形态分析建立了一种图状结构的判别式模型,该模型将语句的形态分析建模为形态成分的图状结构,通过灵活丰富的特征设计描述了词语内部形态成分之间以及分属相邻词语的形态成分之间的关联约束.相比传统的线性模型,图状模... 为维吾尔语和韩语形态分析建立了一种图状结构的判别式模型,该模型将语句的形态分析建模为形态成分的图状结构,通过灵活丰富的特征设计描述了词语内部形态成分之间以及分属相邻词语的形态成分之间的关联约束.相比传统的线性模型,图状模型更好地考虑了各形态成分之间的语言学关联,从而取得更高的整句分析性能.在维吾尔语和韩语上的实验结果表明,图状模型相比线性模型的性能有一定提升,形态分析词级准确率分别提升了4.4%和2.8%. 展开更多
关键词 形态分析 黏着语 图状模型 线性模型
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部