期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于字符嵌入与BiGRU的命名实体识别 被引量:1
1
作者 甘晨阳 李明 +1 位作者 万义程 张庆达 《软件导刊》 2023年第4期72-76,共5页
在命名实体识别任务中,一般使用词级嵌入向量化句子,忽略了字符级特征所包含的信息。为此,提出一种将字符级特征与词级特征将结合的模型,首先使用BiLSTM捕捉字符级信息,结合输出的字符向量与Glove模型获取词向量输入BiGRU网络,然后引入... 在命名实体识别任务中,一般使用词级嵌入向量化句子,忽略了字符级特征所包含的信息。为此,提出一种将字符级特征与词级特征将结合的模型,首先使用BiLSTM捕捉字符级信息,结合输出的字符向量与Glove模型获取词向量输入BiGRU网络,然后引入自注意力层机制重新分配特征权重,最后使用CRF层输出具有全局最优节的标注序列。实验表明,该方法相较于BiGRU-CRF模型在命名实体识别任务中的性能更好,在CoNLL-2003、OntoNotes5.0数据集上的F1值分别达到91.69%、88.97%,对提高命名实体识别任务的性能有所帮助。 展开更多
关键词 命名实体识别 字符嵌入 双向门控循环单元 自注意力机制 条件随机场
下载PDF
基于深度学习和字符嵌入的细胞穿透肽预测 被引量:2
2
作者 方春 孙福振 +1 位作者 李彩虹 邢林林 《计算机仿真》 北大核心 2019年第10期353-358,共6页
针对传统细胞穿透肽的预测方法严重依赖于繁琐的特征抽取和特征重建步骤、算法复杂且准确度不高等问题,提出了一种利用自然语言处理中的字符嵌入方法结合CNN-LSTM组合机器学习框架来预测细胞穿透肽的方法.方法采用字符嵌入将氨基酸的代... 针对传统细胞穿透肽的预测方法严重依赖于繁琐的特征抽取和特征重建步骤、算法复杂且准确度不高等问题,提出了一种利用自然语言处理中的字符嵌入方法结合CNN-LSTM组合机器学习框架来预测细胞穿透肽的方法.方法采用字符嵌入将氨基酸的代表字符通过网络学习映射到紧凑表示的向量空间中,每种氨基酸字符对应一个紧凑表示的向量,然后将肽序列通过由训练得到的嵌入向量转化为数值矩阵作为CNN-LSTM模型的输入,模型自行抽取特征后自动对输入序列的细胞穿透性进行预测.实验结果显示,在相同数据集进行实验时,研究的方法在测试集上的AUC (the area under ROC curve)值达到0.97,正确指数达到0.846,优于其它方法,说明上述方法能够简单、高效地进行细胞穿透肽的预测. 展开更多
关键词 深度学习 字符嵌入 细胞穿透肽 预测
下载PDF
低对比度嵌入型钢坯字符识别方法 被引量:3
3
作者 洪汉玉 王澍 +1 位作者 朱浩 俞喆俊 《武汉工程大学学报》 CAS 2012年第12期38-43,共6页
针对嵌入型钢坯字符具有低对比度、边缘特征不稳定等特点,提出基于轮廓测度LoG算子.首先使用多角度的卷积模版对图像进行卷积运算,有效地增强了字符各方向上的边缘轮廓信息,通过对零交叉点的检测获得候选区域闭合的边缘轮廓,其次使用区... 针对嵌入型钢坯字符具有低对比度、边缘特征不稳定等特点,提出基于轮廓测度LoG算子.首先使用多角度的卷积模版对图像进行卷积运算,有效地增强了字符各方向上的边缘轮廓信息,通过对零交叉点的检测获得候选区域闭合的边缘轮廓,其次使用区域填充算法对闭合轮廓区域进行填充获得候选联通域,最后根据字符与噪声在形态学特征上的差异去除噪声,进而完成字符串信息的完整提取.实验结果表明,基于边缘检测的嵌入型钢坯号识别方法识别效率高,具有较高鲁棒性,检测结果中的字符信息保留完整,能够很好用于字符识别过程,为嵌入型钢坯字符在实际生产线的应用提供了的关键技术支持. 展开更多
关键词 图像处理 嵌入型钢坯字符 区域填充 形态学去噪
下载PDF
基于ARM9的Linux嵌入式字符驱动GPIO设计 被引量:2
4
作者 刘进 肖克亮 邓睿 《电子设计工程》 2015年第15期115-117,共3页
为了实现嵌入式linux的移植和开发,本文采用了ARM9完成了的嵌入式Linux字符驱动开发,为后续更复杂的开发奠定了基础。本文介绍了设计字符驱动开发的基本流程,完成了linux的移植以及驱动程序的开发,并且利用LED和蜂鸣器的开断来验证字符... 为了实现嵌入式linux的移植和开发,本文采用了ARM9完成了的嵌入式Linux字符驱动开发,为后续更复杂的开发奠定了基础。本文介绍了设计字符驱动开发的基本流程,完成了linux的移植以及驱动程序的开发,并且利用LED和蜂鸣器的开断来验证字符驱动开发的效果。同时,为了使验证更加直观和便捷,引入了图形化界面Q4的应用程序开发了友好的测试界面。实验测试通过对触摸屏的操作,顺利的点灭LED以及开断蜂鸣器,从而验证了字符驱动开发在系统中的成功应用。 展开更多
关键词 ARM9 嵌入式Linux字符驱动 GPIO QT4
下载PDF
基于多层卷积模型的恶意URL特征自动提取 被引量:3
5
作者 张婷 钱丽萍 +1 位作者 汪立东 张慧 《计算机工程与设计》 北大核心 2020年第7期1821-1828,共8页
针对恶意仿冒URL的有效识别问题,提出一种基于skip-gram和连续多层卷积层的模型相结合的网络模型完成对恶意仿冒URL进行特征提取并检测。根据URL结构特性将其切分为5个部分,使用skip-gram对字符进行稠密编码将URL数据信息进行转化;使用... 针对恶意仿冒URL的有效识别问题,提出一种基于skip-gram和连续多层卷积层的模型相结合的网络模型完成对恶意仿冒URL进行特征提取并检测。根据URL结构特性将其切分为5个部分,使用skip-gram对字符进行稠密编码将URL数据信息进行转化;使用连续多个卷积层的CNN模型针对URL的每个部分完成独立特征提取,将特征提取结果进行整合;使用贝叶斯、随机森林等多种分类器对模型提取特征空间进行评估。实验结果表明,该方法能够快速有效地对恶意仿冒URL进行检测,检测准确率可达97%,效果优于典型的eXpose多核卷积模型。 展开更多
关键词 恶意仿冒URL 卷积神经网络 字符嵌入 特征提取 深度学习
下载PDF
基于双层Bi-LSTM-CRF模型的糖尿病领域命名实体识别 被引量:6
6
作者 何春辉 王梦贤 何小波 《邵阳学院学报(自然科学版)》 2020年第1期21-26,共6页
随着信息技术的发展,电子文档在糖尿病领域的信息记录中得到了大量应用,通过自动化技术对这些电子文档进行分析具有重大的意义。由于现有的命名实体识别方法在糖尿病领域中识别准确率偏低。为了改变这种现状,提出了双层的双向长短时记... 随着信息技术的发展,电子文档在糖尿病领域的信息记录中得到了大量应用,通过自动化技术对这些电子文档进行分析具有重大的意义。由于现有的命名实体识别方法在糖尿病领域中识别准确率偏低。为了改变这种现状,提出了双层的双向长短时记忆神经网络条件随机场模型(Bi-LSTM-CRF),并将其应用到糖尿病领域命名实体识别任务中。实验结果表明该模型在包含15种实体类别的数据集上准确率达到了89.14%,且在外部测试集上平均F 1值为72.89%,充分揭示了双层Bi-LSTM-CRF模型的有效性。 展开更多
关键词 糖尿病 命名实体识别 字符嵌入 Bi-LSTM-CRF
下载PDF
基于改进GAN的恶意域名数据增强
7
作者 傅伟 钱丽萍 朱晓慧 《计算机应用与软件》 北大核心 2022年第3期308-315,共8页
近年来以恶意域名为依托的网络攻击事件频发。针对主流检测方法识别DGA(Domain Generation Algorithm)变体域名面临的训练数据受限和时效性不足问题,提出一种基于改进WGAN模型的伪DGA域名生成方法。将skip-gram和WGAN结合,通过skip-gra... 近年来以恶意域名为依托的网络攻击事件频发。针对主流检测方法识别DGA(Domain Generation Algorithm)变体域名面临的训练数据受限和时效性不足问题,提出一种基于改进WGAN模型的伪DGA域名生成方法。将skip-gram和WGAN结合,通过skip-gram完成域名有效转换,WGAN模型深度挖掘数据编码中包含的特征,学习并生成伪DGA域名。为验证模型生成数据的有效性,采用多种机器学习方法对生成的域名进行有效性评估。实验结果表明,基于此模型生成的数据具备原数据的特性,可以模拟真实域名用于扩充恶意域名数据集,缓解现有域名检测算法中缺乏DGA变体域名的问题。 展开更多
关键词 恶意域名 数据增强 域名生成算法 字符嵌入 生成对抗网络 检测
下载PDF
利用AutoCAD创建煤矿地测图件所需的线型 被引量:1
8
作者 贾社芹 郭敏 卫永生 《中州煤炭》 2011年第1期73-74,共2页
利用AutoCAD可以创建煤矿地测图件所需的线型,以解决煤矿地测图纸绘制过程中线型种类不足的问题。以最常用的断层上盘断煤交线、保护煤柱、断层下盘断煤交线为例,介绍了利用AutoCAD的自定义功能创建简单线型和复杂线型的过程。
关键词 AUTOCAD 线型定义 图案描述符 嵌入字符
下载PDF
一种基于BERT-Stacking的钓鱼网站检测方法 被引量:2
9
作者 胡强 周杭霞 刘倩 《中国计量大学学报》 2022年第1期49-54,共6页
目的:设计一种新型的钓鱼网站检测技术,以提高检测的精确率。方法:提出了一种利用BERT(Bidirectional Encoder Representations from Transformers)提取HTML字符串嵌入特征的方法,将HTML文档转化为词嵌入向量。同时提出一种结合四种分... 目的:设计一种新型的钓鱼网站检测技术,以提高检测的精确率。方法:提出了一种利用BERT(Bidirectional Encoder Representations from Transformers)提取HTML字符串嵌入特征的方法,将HTML文档转化为词嵌入向量。同时提出一种结合四种分类器的Stacking集成学习模型,使用HTML字符串嵌入特征以及筛选出的URL特征进行钓鱼网站检测。结果:在10万级数据集上精确率达到98.52%,F_(1)值达到98.81%。且相较只使用URL特征,引入上述HTML字符串嵌入特征后,检测钓鱼网站的精确率提升了近两个百分点。结论:本文所提出的基于BERT提取的HTML字符串嵌入特征对于检测钓鱼网站具有显著提升。 展开更多
关键词 钓鱼网站 BERT算法 特征提取 字符嵌入 集成学习
下载PDF
Embedding Sign Representation in Mobile Phones to Assist Disabled 被引量:1
10
作者 Adhinarayanan VenkataSubramaniam Karthikeswaran Duraisamy +1 位作者 Dinakar Subramaniam Marikkani Chelladurai 《Computer Technology and Application》 2011年第1期42-47,共6页
Sign Writing, a writing system for sign language, is becoming a useful and convenient communication aid for people who are deaf. Principally, people who are deaf find it difficult to communicate with the hearing commu... Sign Writing, a writing system for sign language, is becoming a useful and convenient communication aid for people who are deaf. Principally, people who are deaf find it difficult to communicate with the hearing community and due to recent technological advancement they communicate amongst themselves and with the hearing community via text messaging on mobile phones. Existing messaging function is limited to writing based on the Roman alphabets or pictographic languages like Mandarin; writing in signs is deemed to be deficient in a mobile context. Hence, the aim of this paper is to examine the feasibility of writing and reading text messages in signs as an alternative communication mean besides Short Messaging Service (SMS). Initial experimental results have significantly exemplified that sign writing gains well acceptance and is preferred among the hearing-impaired community to communicate within or between the hearing communities. 展开更多
关键词 Sign writing MANDARIN alternate communication SMS hearing-impaired.
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部