期刊文献+
共找到133篇文章
< 1 2 7 >
每页显示 20 50 100
改进RepSurf的点云语义分割
1
作者 高学壮 禹龙 +3 位作者 田生伟 伊洋洋 张波 罗培新 《现代电子技术》 北大核心 2024年第5期143-147,共5页
点云分析一直以来都是一个具有挑战性的问题,主要是因为点云数据的非结构化特性所致。为了解决这个问题,RepSurf基于PointNet++提出了一种多曲面表示局部点云特征的方法。然而,RepSurf中的集合抽象层仅通过一个MLP学习局部特征,这远远... 点云分析一直以来都是一个具有挑战性的问题,主要是因为点云数据的非结构化特性所致。为了解决这个问题,RepSurf基于PointNet++提出了一种多曲面表示局部点云特征的方法。然而,RepSurf中的集合抽象层仅通过一个MLP学习局部特征,这远远不够。为此,引入了两个模块,即倒置残差模块和注意力模块。这两个简单但有效的即插即用模块可以更好地学习局部特征。倒置残差模块通过添加更多的MLP层,丰富了特征提取过程;而注意力模块则包括通道注意力和空间注意力,更加关注关键点特征的学习,使得学习到的特征更具代表性。在公共基准数据集S3DIS上评估了文中的方法,在语义分割任务中mIoU指标达到72.3%,比RepSurf高出2.5%。 展开更多
关键词 点云 语义分割 倒置残差 注意力 RepSurf MLP
下载PDF
基于MacBERT和标签平滑的新冠疫情公众情感分析研究
2
作者 王坤朋 禹龙 +2 位作者 王博 周铁军 田生伟 《东北师大学报(自然科学版)》 CAS 北大核心 2024年第2期83-90,共8页
针对BERT预训练与下游任务微调阶段存在不匹配差异,以及人工对文本数据进行情感倾向性标注可能存在误差的问题,提出一种基于MacBERT和标签平滑的网络模型(MacLMC).首先,在BERT的基础上引入MLM as correction策略,利用近义词替换被掩码词... 针对BERT预训练与下游任务微调阶段存在不匹配差异,以及人工对文本数据进行情感倾向性标注可能存在误差的问题,提出一种基于MacBERT和标签平滑的网络模型(MacLMC).首先,在BERT的基础上引入MLM as correction策略,利用近义词替换被掩码词,通过MacBERT预训练模型获取词向量;其次,经过双层LSTM学习长距离依赖;再次,采用双通道多卷积核的卷积操作,分别提取信息的最大特征和均值特征;最后,利用标签平滑策略降低模型预测类别的概率,提升模型对于标签的容错能力,提高模型泛化性.实验结果表明:与现有主流模型相比,本文模型在多种数据集上性能表现更佳,能够更好地用于新冠疫情公众情感分析任务. 展开更多
关键词 新冠疫情 MacBERT 标签平滑 情感分析
下载PDF
基于局部区域动态覆盖的3D点云分类方法 被引量:2
3
作者 王昌硕 王含 +2 位作者 宁欣 田生伟 李卫军 《软件学报》 EI CSCD 北大核心 2023年第4期1962-1976,共15页
局部几何形状的描述能力,对不规则的点云形状表示是十分重要的.然而,现有的网络仍然很难有效地捕捉准确的局部形状信息.在点云中模拟深度可分离卷积计算方式,提出一种新型的动态覆盖卷积(dynamic cover convolution, DC-Conv),以聚合局... 局部几何形状的描述能力,对不规则的点云形状表示是十分重要的.然而,现有的网络仍然很难有效地捕捉准确的局部形状信息.在点云中模拟深度可分离卷积计算方式,提出一种新型的动态覆盖卷积(dynamic cover convolution, DC-Conv),以聚合局部特征. DC-Conv的核心是空间覆盖算子(space cover operator, SCOP),该算子通过在局部区域中构建各向异性的空间几何体覆盖局部特征空间,以加强局部特征的紧凑性.DC-Conv通过在局部邻域中动态组合多个SCOP,实现局部形状的捕捉.其中,SCOP的注意力系数通过数据驱动的方式由点位置自适应地学习得到.在3D点云形状识别基准数据集ModelNet40, ModelNet10和ScanObjectNN上的实验结果表明,该方法能有效提高3D点云形状识别的性能和对稀疏点云的鲁棒性.最后,也提供了充分的消融实验验证该方法的有效性.开源代码发布在https://github.com/changshuowang/DC-CNN. 展开更多
关键词 点云分类 动态覆盖卷积 空间覆盖算子 局部邻域 注意力系数
下载PDF
融合RoBERTa和注意力机制的隐喻方面级情感分析 被引量:2
4
作者 马圆圆 禹龙 +2 位作者 田生伟 钱梦莹 张立强 《小型微型计算机系统》 CSCD 北大核心 2023年第10期2236-2241,共6页
针对目前大多数隐喻情感分析方法存在对方面情感注意力引入不足的问题,提出一种用于隐喻方面级情感分类的模型.模型首先通过RoBERTa对具有方面情感信息的文本进行编码,将编码后的方面信息和多层情感注意力信息融合,形成多层方面注意力... 针对目前大多数隐喻情感分析方法存在对方面情感注意力引入不足的问题,提出一种用于隐喻方面级情感分类的模型.模型首先通过RoBERTa对具有方面情感信息的文本进行编码,将编码后的方面信息和多层情感注意力信息融合,形成多层方面注意力表征向量.将该表征向量与隐喻句的关联结果作为文本原始特征,利用注意力机制和方面信息对其解码,然后通过卷积网络计算隐喻句与方面词的关联度.将池化层输出结果和卷积计算结果合并,最后计算隐喻句不同方面词的情感极性的概率,完成隐喻情感分析.实验结果表明该模型对3种情感极性的平均判断准确率分别达到了83.26%,81.69%和56.68%,与基线实验相比均有所提升. 展开更多
关键词 隐喻情感分析 方面级情感分析 多层注意力机制 RoBERTa
下载PDF
快速联合实体和关系抽取模型
5
作者 杨冬 田生伟 +2 位作者 禹龙 周铁军 王博 《计算机工程与应用》 CSCD 北大核心 2023年第13期164-170,共7页
从纯文本中抽取实体和关系是知识和问答任务的关键技术。传统的多头模型预测所有片段对的关系类型,而由于关系的稀疏性,片段对的负标签数量远大于正标签。同时,该计算方式导致计算量与句长度的二次方成正比,降低了模型的实用性。为解决... 从纯文本中抽取实体和关系是知识和问答任务的关键技术。传统的多头模型预测所有片段对的关系类型,而由于关系的稀疏性,片段对的负标签数量远大于正标签。同时,该计算方式导致计算量与句长度的二次方成正比,降低了模型的实用性。为解决该问题,快速实体关系抽取模型被提出。对于命名实体识别任务,实体的开始和结束标签分别对两个指针网络预测。在关系抽取任务中删除了不包含实体结束标签的语义片段对。该方法减少了片段对的数量并加快了关系抽取任务的推理速度。为了证明模型的有效性,在英语新闻数据集ACE05和荷兰语房地产数据集DREC上进行了实验。实验结果表明,与基线模型相比,该模型取得了有竞争力的性能,其推理速度在ACE05上提高了约1.4倍,在DREC上提高了约2.1倍。 展开更多
关键词 实体识别 关系抽取 神经网络 自然语言处理 信息抽取
下载PDF
基于双向LSTM的维吾尔语事件因果关系抽取 被引量:16
6
作者 田生伟 周兴发 +3 位作者 禹龙 冯冠军 艾山.吾买尔 李圃 《电子与信息学报》 EI CSCD 北大核心 2018年第1期200-208,共9页
针对传统方法不能有效抽取维吾尔语事件因果关系的问题,该文提出一种基于双向LSTM(Bidirectional Long Short-Term Memory,Bi LSTM)的维吾尔语事件因果关系抽取方法。通过对维吾尔语语言以及事件因果关系特点的研究,提取出10项基于事件... 针对传统方法不能有效抽取维吾尔语事件因果关系的问题,该文提出一种基于双向LSTM(Bidirectional Long Short-Term Memory,Bi LSTM)的维吾尔语事件因果关系抽取方法。通过对维吾尔语语言以及事件因果关系特点的研究,提取出10项基于事件内部结构信息的特征;同时为充分利用事件语义信息,引入词嵌入作为Bi LSTM的输入,提取事件句隐含的深层语义特征并利用批样规范化(Batch Normalization,BN)算法加速Bi LSTM的收敛;最后融合这两类特征作为softmax分类器的输入进而完成维吾尔语事件因果关系抽取。实验结果表明,该方法用于维吾尔语事件因果关系的抽取准确率为89.19%,召回率为83.19%,F值为86.09%,证明了该文提出的方法在维吾尔语事件因果关系抽取上的有效性。 展开更多
关键词 语言信号处理 事件因果关系 维吾尔语 双向LSTM 词嵌入 批样规范化
下载PDF
多策略汉维句子对齐 被引量:8
7
作者 田生伟 吐尔根.依布拉音 +2 位作者 禹龙 加米拉.吾守尔 杨飞宇 《计算机科学》 CSCD 北大核心 2010年第4期215-218,292,共5页
提出了一种错误抑制的多策略算法对齐汉维语句子。针对长度对齐算法无法避免错误蔓延的特点,提出了一种新的错误蔓延抑制策略:利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,结合句子长度特征,寻找1:1模式的句对作为锚点,将错误... 提出了一种错误抑制的多策略算法对齐汉维语句子。针对长度对齐算法无法避免错误蔓延的特点,提出了一种新的错误蔓延抑制策略:利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,结合句子长度特征,寻找1:1模式的句对作为锚点,将错误蔓延抑制在锚点内;在锚点之间,利用标点符号和长度混合方法进行句子对齐。算法实验结果验证了该多策略算法寻找的锚点的精度高,有效抑制了对齐错误的蔓延;采用的混合对齐算法,避免了基于词汇对齐算法的高时间复杂度的弱点,比传统的对齐算法性能有了较大提高,对齐准确率由95.0%提高到97.6%,召回率由96.8%提高到98.2%,采用的对齐正确性评价算法可以有效发现自动对齐中的噪音对齐。 展开更多
关键词 双语语料 错误抑制 句子对齐 混合策略 汉维句子
下载PDF
一种维吾尔语句子相似度算法的研究 被引量:10
8
作者 田生伟 吐尔根.依布拉音 +2 位作者 禹龙 买合木提.木合买提 艾山.吾买尔 《计算机工程与应用》 CSCD 北大核心 2009年第26期144-146,共3页
基于实例的机器翻译是一种重要的机器翻译技术,句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的维吾尔语机器翻译研究,维吾尔语句子相似度衡量的准确性,直接影响到最后翻译结果的输出。提出了一种维吾尔语... 基于实例的机器翻译是一种重要的机器翻译技术,句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的维吾尔语机器翻译研究,维吾尔语句子相似度衡量的准确性,直接影响到最后翻译结果的输出。提出了一种维吾尔语句子相似度的计算方法,采用的基于词形特征的粗选算法、散列单词倒排索引能够有效提高算法的查找速度,快速从语料库中筛选出候选句子集合;多策略精选算法中采用基于维吾尔语词频的单词区分度算法、连续单词序列抽取算法,可以有效衡量两个维吾尔语句子的相似程度,实验结果证明算法是有效的。 展开更多
关键词 机器翻译 基于实例机器翻译 维吾尔语句子相似度
下载PDF
基于Bi-LSTM的维吾尔语人称代词指代消解 被引量:3
9
作者 田生伟 秦越 +2 位作者 禹龙 吐尔根.依布拉音 冯冠军 《电子学报》 EI CAS CSCD 北大核心 2018年第7期1691-1699,共9页
针对维吾尔语人称代词指代现象,提出利用双向长短时记忆网络(Bi-directional long short term memory,Bi-LSTM)的深度学习机制进行基于深层语义信息的维吾尔语人称代词指代消解.首先将富含语义和句法信息的word embedding向量作为Bi-LST... 针对维吾尔语人称代词指代现象,提出利用双向长短时记忆网络(Bi-directional long short term memory,Bi-LSTM)的深度学习机制进行基于深层语义信息的维吾尔语人称代词指代消解.首先将富含语义和句法信息的word embedding向量作为Bi-LSTM的输入,挖掘维吾尔语隐含的上下文语义层面特征;其次对维吾尔语人称代词指代现象进行探索,提取针对人称代词指代研究的24个hand-crafted特征;然后利用多层感知器(multilayer perception,MLP)融合Bi-LSTM学习到的上下文语义层面特征与hand-crafted特征;最后使用融合的两类特征训练softmax分类器完成维吾尔语人称代词指代消解任务.实验结果表明,充分利用两类特征的优势,维吾尔语人称代词指代消解的F1值达到76.86%.实验验证了Bi-LSTM与单向LSTM、浅层机器学习算法的SVM和ANN相比更具备挖掘隐含上下文深层语义信息的能力,而hand-crafted层面特征的引入,则有效提高指代消解性能. 展开更多
关键词 指代消解 双向长短时记忆网络 词向量 深度学习 维吾尔语 自然语言处理
下载PDF
维吾尔语情感分类算法 被引量:5
10
作者 田生伟 禹龙 王宇光 《计算机工程与应用》 CSCD 北大核心 2011年第36期147-150,共4页
情感分类是一项具有实用价值的分类技术。目前英语和汉语的情感分类的研究比较多,而针对维吾尔语的研究较少。以n-gram模型作为不同的文本表示特征,以互信息、信息增益、CHI统计量和文档频率作为不同的特征选择方法,选择不同的特征数量,... 情感分类是一项具有实用价值的分类技术。目前英语和汉语的情感分类的研究比较多,而针对维吾尔语的研究较少。以n-gram模型作为不同的文本表示特征,以互信息、信息增益、CHI统计量和文档频率作为不同的特征选择方法,选择不同的特征数量,以NaǐveBayes、ME(最大熵)和SVM(支持向量机)作为不同的文本分类方法,分别进行了维吾尔语情感分类实验,并对实验结果进行了比较,结果表明:采用UniGrams特征表示方法、在5000个特征数量和合适的特征选择函数,ME和SVM对维吾尔语情感分类能取得较好的效果。 展开更多
关键词 维吾尔语 情感分类 语言模型
下载PDF
维吾尔语多词领域术语的自动抽取 被引量:4
11
作者 田生伟 钟军 禹龙 《中文信息学报》 CSCD 北大核心 2015年第2期133-141,共9页
多词领域术语抽取是自然语言处理技术中的一个重点和难点问题,结合维吾尔语语言特征,该文提出了一种基于规则和统计相结合的维吾尔语多词领域术语的自动抽取方法。该方法分为四个阶段:1语料预处理,包括停用词过滤和词性标注;2对字串取N... 多词领域术语抽取是自然语言处理技术中的一个重点和难点问题,结合维吾尔语语言特征,该文提出了一种基于规则和统计相结合的维吾尔语多词领域术语的自动抽取方法。该方法分为四个阶段:1语料预处理,包括停用词过滤和词性标注;2对字串取N元子串,利用改进的互信息算法和对数似然比率计算子串内部的联合强度,结合词性构成规则,构建候选维吾尔语多词领域术语集;3利用相对词频差值,得到尽可能多的维吾尔语多词领域术语;4结合C_value值获取最终领域术语并作后处理。实验结果准确率为85.08%,召回率为73.19%,验证了该文提出的方法在维吾尔语多词领域术语抽取上的有效性。 展开更多
关键词 维吾尔语 多词领域术语 互信息 对数似然比率 相对词频差值
下载PDF
反馈平衡调节自适应机制在搜索引擎中的应用 被引量:3
12
作者 田生伟 刘胜全 禹龙 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第S1期387-389,共3页
介绍了反馈平衡调节自适应机制在循环工作链中的研究和实现 ,经实践证明运行效果良好 。
关键词 反馈平衡调节自适应 循环工作链 多线程 搜索引擎
下载PDF
智能组卷与评价系统在高校重点课程建设的应用 被引量:6
13
作者 田生伟 禹龙 《计算机工程》 CAS CSCD 北大核心 2004年第4期173-175,共3页
介绍了在高校重点课程建设中智能组卷与评价系统的设计思路、体系结构和实现要点。该系统能够为教学和学生的学习带来极大的帮助。
关键词 组卷模板 评价 重点课程
下载PDF
EBMT中高效的维吾尔语单词散列表构造算法 被引量:3
14
作者 田生伟 吐尔根.依布拉音 禹龙 《中文信息学报》 CSCD 北大核心 2009年第4期124-128,共5页
基于实例的机器翻译(EBMT)是一种高效的机器翻译方法,如何快速地从海量实例模式库中找出与待翻译句子相似的候选实例,是EBMT研究的关键技术之一。统计分析维吾尔语单词字母的分布特征,构造了基于维吾尔语单词的倒排索引散列表,在等概率... 基于实例的机器翻译(EBMT)是一种高效的机器翻译方法,如何快速地从海量实例模式库中找出与待翻译句子相似的候选实例,是EBMT研究的关键技术之一。统计分析维吾尔语单词字母的分布特征,构造了基于维吾尔语单词的倒排索引散列表,在等概率条件下,平均查找长度为1.59;依据散列冲突的同义词在维吾尔语料中出现的频率作为权值,提出了一种新颖的解决散列冲突的算法:同义词次优树算法。实验显示,算法的性能比传统的顺序查找和二分查找算法分别高出了27.5%,21.8%,证明了该算法在EBMT中有较高的检索效率。 展开更多
关键词 计算机应用 中文信息处理 EBMT 散列 平均查找长度 次优树
下载PDF
结合注意力机制的Bi-LSTM维吾尔语事件时序关系识别 被引量:11
15
作者 田生伟 胡伟 +3 位作者 禹龙 吐尔根.依布拉音 赵建国 李圃 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第3期393-399,共7页
针对维吾尔语事件时序关系识别问题,提出了一种结合注意力机制的双向长短时记忆模型.基于维吾尔语语言及事件时序关系的特点,抽取13项基于事件间内部结构信息的特征.将词向量作为双向长短时记忆模型的输入,挖掘给定事件句隐含的上下文... 针对维吾尔语事件时序关系识别问题,提出了一种结合注意力机制的双向长短时记忆模型.基于维吾尔语语言及事件时序关系的特点,抽取13项基于事件间内部结构信息的特征.将词向量作为双向长短时记忆模型的输入,挖掘给定事件句隐含的上下文语义信息.结合事件触发词建立注意力机制,获取该事件句的事件语义特征.将事件内部结构特征和语义特征相融合,作为softmax层的输入,进而完成事件时序关系的识别.实验结果表明,该方法在获取事件句隐含语义信息的同时也能获取对应的事件语义特征.融合事件内部结构特征后,识别准确率为89.42%,召回率为86.70%,衡量模型整体性能的F值为88.03%,从而证明了该方法在维吾尔语事件时序关系识别任务上的有效性. 展开更多
关键词 维吾尔语 时序关系 注意力机制 双向长短时记忆网络 词向量
下载PDF
混合策略的汉维句子对齐 被引量:3
16
作者 田生伟 吐尔根.依布拉音 禹龙 《计算机工程与应用》 CSCD 北大核心 2010年第34期143-145,170,共4页
提出了一种混合算法对齐汉维句子,不需要汉语分词、词性标注预处理,利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,作为基于词汇对齐的词典,并结合基于长度的方法进行句子对齐,实验结果验证了该混合算法的有效性,汉维语句子对齐... 提出了一种混合算法对齐汉维句子,不需要汉语分词、词性标注预处理,利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,作为基于词汇对齐的词典,并结合基于长度的方法进行句子对齐,实验结果验证了该混合算法的有效性,汉维语句子对齐的正确率和召回率,达到了97.5%和97.1%。 展开更多
关键词 双语语料 句子对齐 混合策略
下载PDF
基于动态预测和任务流整形的网格调度算法 被引量:1
17
作者 田生伟 吐尔根·依布拉音 禹龙 《计算机工程》 CAS CSCD 北大核心 2008年第8期120-122,共3页
针对网格环境下计算节点的自治性、异构性、分布性等特征,提出一种基于任务响应时间的动态修正预测和任务流整形的网格调度算法,该调度方法依据历史数据和最近访问过计算节点的任务请求提交时间、任务完成时间、网络通信延迟等信息,预... 针对网格环境下计算节点的自治性、异构性、分布性等特征,提出一种基于任务响应时间的动态修正预测和任务流整形的网格调度算法,该调度方法依据历史数据和最近访问过计算节点的任务请求提交时间、任务完成时间、网络通信延迟等信息,预测计算节点的将来任务响应时间,将任务提交给预测的轻负载或性能较优的计算节点完成。通过使用动态修正算法和任务流整形算法降低预测误差,提高资源利用率。实验结果表明,该方法在任务响应时间、任务的吞吐率等方面优于随机调度等传统算法,具有较好的综合性能。 展开更多
关键词 预测 响应时间 任务流整形 负载均衡
下载PDF
传送能量最小的传感路由算法 被引量:2
18
作者 田生伟 吐尔根.依布拉音 禹龙 《计算机工程与应用》 CSCD 北大核心 2009年第2期109-111,共3页
提出了一种传送能量最小MEP(Minimal Energy-consuming Path)的无线传感网络路由算法,该算法选择能使簇内节点总功耗小的节点作为簇头,避免Leach算法随机选择簇头导致簇内节点总功耗过大的弊端;在构造簇间路由树时,采用了距离幂作为代价... 提出了一种传送能量最小MEP(Minimal Energy-consuming Path)的无线传感网络路由算法,该算法选择能使簇内节点总功耗小的节点作为簇头,避免Leach算法随机选择簇头导致簇内节点总功耗过大的弊端;在构造簇间路由树时,采用了距离幂作为代价权,克服了以最短长度距离作为代价权不能保证转发数据总功耗最小的弱点,实现了在多跳转发数据时总的传送能量最小。仿真结果证明MEP能够有效地延长网络的生命周期。 展开更多
关键词 能量消耗 生存周期 最小能量路径
下载PDF
改进的自适应汉维句子对齐 被引量:1
19
作者 田生伟 禹龙 杨飞宇 《计算机工程与应用》 CSCD 北大核心 2011年第35期147-149,共3页
提出了改进的自适应汉维句子对齐算法对齐汉维语句子。针对传统对齐方法不能较好地适应语料类型的变化,算法利用当前待对齐汉维文本的字节长度比和历史匹配模式数据,动态修正对齐模型的参数,使其适应语料类型的变化,提高了汉维句子对齐... 提出了改进的自适应汉维句子对齐算法对齐汉维语句子。针对传统对齐方法不能较好地适应语料类型的变化,算法利用当前待对齐汉维文本的字节长度比和历史匹配模式数据,动态修正对齐模型的参数,使其适应语料类型的变化,提高了汉维句子对齐算法的性能,对齐的正确率和召回率较长度对齐模型分别提高了3.5个百分点和2.7个百分点,较混合对齐提高了1.9个百分点和1.8个百分点。实验结果验证了该算法能够有效地适应语料类型的变化。 展开更多
关键词 双语语料 句子对齐 自适应
下载PDF
关联规则挖掘在成绩录入、校对系统中的应用 被引量:5
20
作者 田生伟 禹龙 《微机发展》 2003年第8期67-68,107,共3页
为了达到实现数据录入、校对的准确和高效的目的,文章介绍了利用关联规则挖掘方法在成绩录入、校对与发布系统的设计思路、体系结构和实现要点,系统经过实际运行验证了该核心方法结论正确,达到了预期的目标,实现了数据录入、校对的准确... 为了达到实现数据录入、校对的准确和高效的目的,文章介绍了利用关联规则挖掘方法在成绩录入、校对与发布系统的设计思路、体系结构和实现要点,系统经过实际运行验证了该核心方法结论正确,达到了预期的目标,实现了数据录入、校对的准确性和高效性。 展开更多
关键词 成绩录入系统 成绩校对系统 关联规则 数据挖掘 知识模式 高校 招生 数据库
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部