期刊文献+
共找到192篇文章
< 1 2 10 >
每页显示 20 50 100
基于混合神经网络和注意力机制的生物医学事件触发词识别方法
1
作者 任永功 林禹竹 +2 位作者 唐玉洁 于博 何馨宇 《电子学报》 EI CAS CSCD 北大核心 2024年第9期3206-3216,共11页
生物医学事件作为生物医学文本挖掘的重要组成部分,在生物医学研究和疾病的预防中发挥着重要作用.触发词识别是生物医学事件抽取的关键和前提步骤,旨在提取描述事件类型的关键词.传统方法在特征提取过程中过分依赖自然语言处理工具,导... 生物医学事件作为生物医学文本挖掘的重要组成部分,在生物医学研究和疾病的预防中发挥着重要作用.触发词识别是生物医学事件抽取的关键和前提步骤,旨在提取描述事件类型的关键词.传统方法在特征提取过程中过分依赖自然语言处理工具,导致耗费人工成本.另外,由于生物医学文献的特殊性—长文本语句多,导致长距离依赖问题比较明显.为了解决这些问题,我们提出了一种混合结构,由残差卷积神经网络和双向长短期神经网络、混合神经网络和多头注意力机制组成.该模型利用残差卷积神经网络提取单词级特征并利用双向长短期神经网络提取上下文语义信息.此外,本文通过空间域滑动窗口将长句划分为等长短句,在不破坏上下文信息的前提下,避免了长距离依赖.实验结果表明,本文提出的方法在生物医学事件抽取通用语料MLEE(Multi-Level Event Extraction)上取得了较好的效果,F值达到81.15%. 展开更多
关键词 生物医学事件抽取 触发词识别 ReCNN-BiLSTM 空间域滑动窗口 MUH-Attention机制 混合神经网络
下载PDF
融合多尺度CNN和CRF的通用细粒度事件检测
2
作者 任永功 阎格 何馨宇 《小型微型计算机系统》 CSCD 北大核心 2024年第4期859-864,共6页
事件检测是自然语言处理领域中事件抽取的主要任务之一,它旨在从众多非结构化信息中自动提取出结构化的关键信息.现有的方法存在特征提取不全面、特征分布不均等情况.为了提高事件检测的准确率,提出了一种融合BERT预训练模型与多尺度CN... 事件检测是自然语言处理领域中事件抽取的主要任务之一,它旨在从众多非结构化信息中自动提取出结构化的关键信息.现有的方法存在特征提取不全面、特征分布不均等情况.为了提高事件检测的准确率,提出了一种融合BERT预训练模型与多尺度CNN的神经网络模型(BMCC,BERT+Multi-scale CNN+CRF).首先通过BERT(Bidirectional Encoder Representations from Transformers)预训练模型来进行词向量的嵌入,并利用其双向训练的Transformer机制来提取序列的状态特征;其次使用不同尺度的卷积核在多个卷积通道中进行卷积训练,以此来提取不同视野的语义信息,丰富其语义表征.最后将BIO机制融入到条件随机场(CRF)来对序列进行标注,实现事件的检测.实验结果表明,所提出的模型在MAVEN数据集上的F1值为65.17%,表现了该模型的良好性能. 展开更多
关键词 事件检测 BERT 多尺度CNN 条件随机场(CRF) 交叉验证
下载PDF
基于知识增强对比学习的长尾用户序列推荐算法
3
作者 任永功 周平磊 张志鹏 《通信学报》 EI CSCD 北大核心 2024年第6期210-222,共13页
序列推荐根据目标用户的历史交互序列,预测其可能感兴趣的下一个物品。现有的序列推荐方法虽然可以有效捕获用户的历史交互序列中的长期依赖关系,但是无法为交互序列较短且用户数量庞大的长尾用户提供精确推荐。为了解决此问题,提出了... 序列推荐根据目标用户的历史交互序列,预测其可能感兴趣的下一个物品。现有的序列推荐方法虽然可以有效捕获用户的历史交互序列中的长期依赖关系,但是无法为交互序列较短且用户数量庞大的长尾用户提供精确推荐。为了解决此问题,提出了一种基于知识增强对比学习的长尾用户序列推荐算法。首先,基于知识图谱中的丰富实体关系信息,构建一个基于语义的物品相似度度量,分别提取原始序列中物品的协同关联物品。然后,基于不同学习序列提出2种序列增强算子,通过增强自监督信号解决长尾用户序列训练数据不足的问题。最后,通过对比自监督任务和推荐主任务的网络参数共享的联合训练,为长尾用户提供更精确的序列推荐结果。在实际数据集上的实验结果表明,所提算法可以有效提高针对长尾用户的序列推荐精度。 展开更多
关键词 序列推荐 长尾用户 知识图谱 对比学习
下载PDF
基于信息增益的文本特征选择方法 被引量:31
4
作者 任永功 杨荣杰 +1 位作者 尹明飞 马名威 《计算机科学》 CSCD 北大核心 2012年第11期127-130,共4页
在类和特征分布不均时,传统信息增益算法的分类性能急剧下降。针对此不足,提出一种基于信息增益的文本特征选择方法(TDpIG)。首先对数据集按类进行特征选择,以减少数据集不平衡性对特征选取的影响。其次运用特征出现概率计算信息增益权... 在类和特征分布不均时,传统信息增益算法的分类性能急剧下降。针对此不足,提出一种基于信息增益的文本特征选择方法(TDpIG)。首先对数据集按类进行特征选择,以减少数据集不平衡性对特征选取的影响。其次运用特征出现概率计算信息增益权值,以降低低频词对特征选择的干扰。最后使用离散度分析特征在每类中的信息增益值,过滤掉高频词中的相对冗余特征,并对选取的特征应用信息增益差值做进一步细化,获取均匀精确的特征子集。通过对比实验表明,选取的特征具有更好的分类性能。 展开更多
关键词 特征选择 文本分类 信息增益值 冗余特征 不平衡数据集
下载PDF
基于遗传算法的粗糙集属性约简算法 被引量:32
5
作者 任永功 王杨 闫德勤 《小型微型计算机系统》 CSCD 北大核心 2006年第5期862-865,共4页
属性约简是粗糙集理论中的一个核心问题,为了有效获取属性最小相对约简,本文提出了一种基于遗传算法的粗糙集属性约简算法.该算法将核引入遗传算法的初始群体来提高算法的性能,依照决策属性对条件属性的依赖度,在加强局部搜索能力的同... 属性约简是粗糙集理论中的一个核心问题,为了有效获取属性最小相对约简,本文提出了一种基于遗传算法的粗糙集属性约简算法.该算法将核引入遗传算法的初始群体来提高算法的性能,依照决策属性对条件属性的依赖度,在加强局部搜索能力的同时保持了该算法全局寻优的特性,能够获得最佳的搜索效果.实验结果证明了该算法能够快速有效的进行属性约简. 展开更多
关键词 粗糙集 属性约简 遗传算法 相对约简
下载PDF
数据可视化技术的研究与进展 被引量:56
6
作者 任永功 于戈 《计算机科学》 CSCD 北大核心 2004年第12期92-96,共5页
可视化技术对于分析和探究大规模的多维数据集变得越来越重要。本文首先介绍了数据可视化的概念及其发展历程,然后分类、对比分析了已存在的可视化技术,最后对数据可视化技术的未来发展方向进行了探讨。
关键词 数据可视化 多维数据集 大规模 可视化技术 方向 对数 未来发展 概念 分类
下载PDF
基于信息增益特征关联树的文本特征选择算法 被引量:9
7
作者 任永功 杨雪 +1 位作者 杨荣杰 胡志冬 《计算机科学》 CSCD 北大核心 2013年第10期252-256,共5页
传统的信息增益算法在类和特征项分布不均时,分类性能明显下降。针对此不足,提出了一种基于信息增益特征关联树的文本特征选择算法(UDsIG)。首先,对数据集按类进行特征选择,降低类分布不均时对特征选择的影响。其次,利用特征分布均匀度... 传统的信息增益算法在类和特征项分布不均时,分类性能明显下降。针对此不足,提出了一种基于信息增益特征关联树的文本特征选择算法(UDsIG)。首先,对数据集按类进行特征选择,降低类分布不均时对特征选择的影响。其次,利用特征分布均匀度改善特征项在类内分布不均对特征选择的干扰,并采用特征关联树模型对类内特征进行处理,保留强相关特征,删除弱相关和不相关特征,降低特征冗余度。最后,使用类间加权离散度的信息增益公式进一步计算,得到更优特征子集。通过对比实验表明,选取的特征具有更好的分类性能。 展开更多
关键词 特征选择 特征关联树 信息增益值 不平衡数据集 离散度
下载PDF
一种新的基于Web日志的挖掘用户浏览偏爱路径的方法 被引量:4
8
作者 任永功 付玉 +1 位作者 张亮 吕君义 《计算机科学》 CSCD 北大核心 2008年第10期192-196,共5页
提出了一种新的基于Web日志的挖掘用户浏览偏爱路径的方法。该方法首先在单元数组存储结构(存储矩阵)基础上建立以浏览兴趣度为基本元素的会话矩阵和路径矩阵。然后,在会话矩阵上采用两个页面向量夹角余弦作为相似用户的页面距离公式进... 提出了一种新的基于Web日志的挖掘用户浏览偏爱路径的方法。该方法首先在单元数组存储结构(存储矩阵)基础上建立以浏览兴趣度为基本元素的会话矩阵和路径矩阵。然后,在会话矩阵上采用两个页面向量夹角余弦作为相似用户的页面距离公式进行页面聚类,求得相似用户的相关页面集。最后,利用路径选择偏爱度在相似用户的路径矩阵上挖掘出相似用户的浏览偏爱路径。实验证明此方法是合理有效的,能够得到更准确的偏爱路径。 展开更多
关键词 浏览兴趣度 路径选择偏爱度 WEB日志 矩阵 页面聚类
下载PDF
一种基于频繁模式树的最大频繁项目集挖掘算法 被引量:6
9
作者 任永功 张亮 付玉 《小型微型计算机系统》 CSCD 北大核心 2010年第2期317-321,共5页
目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,这类算法会产生巨大的候选集并且重复扫描数据库.针对这一问题,给出一种基于频繁模式树的最大频繁项目集挖掘算法FP-MFIA,该算法利用频繁模式树对最大频繁项目集进行检索,通过位... 目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,这类算法会产生巨大的候选集并且重复扫描数据库.针对这一问题,给出一种基于频繁模式树的最大频繁项目集挖掘算法FP-MFIA,该算法利用频繁模式树对最大频繁项目集进行检索,通过位图建树的方法有效的减少了扫描数据库的次数,从而节省了CPU的执行时间.另外,此算法运用独特的最大频繁项目集判断策略,同时运用投影技术进行超集检测,提高了遍历的效率,实验结果表明该算法是快速有效的. 展开更多
关键词 频繁项目集 最大频繁项目集 频繁模式树 深度优先搜索
下载PDF
基于用户相关性的动态网络媒体数据无监督特征选择算法 被引量:5
10
作者 任永功 王玉玲 +1 位作者 刘洋 张晶 《计算机学报》 EI CSCD 北大核心 2018年第7期1517-1535,共19页
移动互联网、社交媒体的快速发展,极大推动了各个领域对文本、图像、视频等网络媒体数据处理的需求.该类数据具有高维度、动态更新、内容复杂的特性,增加了特征计算以及分类难度.同时,当前网络媒体数据的特征选择方法主要针对静态数据,... 移动互联网、社交媒体的快速发展,极大推动了各个领域对文本、图像、视频等网络媒体数据处理的需求.该类数据具有高维度、动态更新、内容复杂的特性,增加了特征计算以及分类难度.同时,当前网络媒体数据的特征选择方法主要针对静态数据,并且对数据格式规范性要求较高.针对上述问题,为保证对动态网络媒体数据的实时特征提取,该文提出了一种基于用户相关性的动态网络媒体数据无监督特征选择算法(Unsupervised Feature Selection Algorithm for Dynamic Network Media Based on User Correlation,UFSDUC).首先,对社交网络中的交互用户进行关系分析,作为无监督特征选择的约束条件.然后,利用拉普拉斯算子构建用户相关性的特征选择模型,量化相关用户之间的关系强弱,通过拉格朗日乘子法给出特征模型中最优用户关系的数学方法.最后,基于梯度下降法设定动态网络媒体数据的阈值,用以计算非零特征权值来更新最优特征子集,达到对网络媒体数据进行有效分类的目的.该算法可在保证用户在相关性完整的基础上对动态网络媒体数据进行准确、实时的特征选择.该文采用3个标准网络媒体数据集,同时与5种目前较为流行的同类型算法进行对比以验证算法的有效性. 展开更多
关键词 动态网络媒体数据 无监督特征选择 相关性 梯度下降法 关系强弱
下载PDF
一种多维数据的聚类算法及其可视化研究 被引量:13
11
作者 任永功 于戈 《计算机学报》 EI CSCD 北大核心 2005年第11期1861-1865,共5页
提出了一种基于主次属性划分的聚类方法和一种新的数据可视化方法.首先,利用数据的主属性和次属性的特征值对数据集进行聚类;然后,采用彩色刺激光谱投影到RGB颜色空间的原理,通过色度学中麦克斯韦的三角平面坐标色度图对各聚类结果进行... 提出了一种基于主次属性划分的聚类方法和一种新的数据可视化方法.首先,利用数据的主属性和次属性的特征值对数据集进行聚类;然后,采用彩色刺激光谱投影到RGB颜色空间的原理,通过色度学中麦克斯韦的三角平面坐标色度图对各聚类结果进行可视化显示.实验证明了文中方法算法简单、容易实现,可视化结果有利于用户全面地理解数据,为数据的预测、决策起到重要作用. 展开更多
关键词 数据可视化 数据挖掘 聚类 色度图
下载PDF
一种基于局部信息的社区发现方法 被引量:4
12
作者 任永功 孙宇奇 吕朕 《计算机工程》 CAS CSCD 北大核心 2011年第7期12-14,23,共4页
针对复杂网络中难以发现小社区的问题,在CNM算法的基础上,提出一种利用局部信息进行社区挖掘的方法。定义节点的强度及节点对社区的贡献,改进模块度使该方法能适用于带权网络。利用社区局部信息得到小社区集合,将小社区集合作为CNM算法... 针对复杂网络中难以发现小社区的问题,在CNM算法的基础上,提出一种利用局部信息进行社区挖掘的方法。定义节点的强度及节点对社区的贡献,改进模块度使该方法能适用于带权网络。利用社区局部信息得到小社区集合,将小社区集合作为CNM算法的输入,计算小社区间的模块度增量,凝聚模块度增量小的小社区,并得到最终结果。实验结果表明,该方法具有较高的社区模块度和算法执行效率。 展开更多
关键词 复杂网络 社区发现 聚类 加权模块度 图分割
下载PDF
基于JSP和MySQL的动态表结构的设计与实现 被引量:10
13
作者 任永功 王政军 《计算机工程》 EI CAS CSCD 北大核心 2006年第5期60-62,134,共4页
传统基于Windows平台的IIS、ASP、MS SQL Server构建管理系统的方式,不仅内存资源花费多,而且硬件通常要求也很高,导致总体成本的上升。文章提出了一种基于JSP和MySQL技术来构建人事管理系统的方案,设计并实现了一种动态可维护的表结构... 传统基于Windows平台的IIS、ASP、MS SQL Server构建管理系统的方式,不仅内存资源花费多,而且硬件通常要求也很高,导致总体成本的上升。文章提出了一种基于JSP和MySQL技术来构建人事管理系统的方案,设计并实现了一种动态可维护的表结构。实验证明,此方法提高了系统的实用性、方便性及通用性。 展开更多
关键词 管理系统 表结构 MYSQL
下载PDF
基于语义关联树的分类查询扩展算法 被引量:4
14
作者 任永功 范丹 武佳林 《计算机科学》 CSCD 北大核心 2009年第9期238-241,277,共5页
查询扩展技术中引入语义计算是一个重要的研究方向。针对现有解决方法普遍存在缺少主题知识、引入无关词以及筛选函数不恰当的问题,提出了一种结合主题选取与局部反馈方法的语义关联树模型,从语义的角度进行分类查询扩展。在传统方法基... 查询扩展技术中引入语义计算是一个重要的研究方向。针对现有解决方法普遍存在缺少主题知识、引入无关词以及筛选函数不恰当的问题,提出了一种结合主题选取与局部反馈方法的语义关联树模型,从语义的角度进行分类查询扩展。在传统方法基础上结合Web文本分类语料库进行了有主题的分类扩展,并改进了扩展词筛选函数,增加了阈值限定,有效控制了噪音。结合用户交互与局部反馈的方法不但减少了传统相关反馈中用户的工作量而且弥补了单纯局部反馈高度依赖于初次检索结果的缺陷。在SMART平台的实验结果表明,该方法相比一般的查询扩展算法查全率及查准率均有所提高。 展开更多
关键词 语义关联树 主题选取 查询扩展 WEB文本分类
下载PDF
基于特征权重与词间相关性的文本特征选择算法 被引量:3
15
作者 任永功 杨荣杰 尹明飞 《计算机应用与软件》 CSCD 北大核心 2012年第9期33-36,共4页
传统的ReliefF算法使用二值法不能体现离散特征差异大小,且不能去除冗余特征。针对这种情况提出了mRMR-ReliefF特征选择算法。该算法利用概率弥补特征差异度量上的不足,提出新的差异函数。此函数使提取出的特征更能体现文本的类内相关... 传统的ReliefF算法使用二值法不能体现离散特征差异大小,且不能去除冗余特征。针对这种情况提出了mRMR-ReliefF特征选择算法。该算法利用概率弥补特征差异度量上的不足,提出新的差异函数。此函数使提取出的特征更能体现文本的类内相关性和类间差异性。该算法还结合了词间相关性。词间相关性在考虑选择和类别相关性大的特征词的同时还考虑了特征冗余的消除。通过三种算法的对比实验,表明该算法为文本分类提供了更有效的特征子集。 展开更多
关键词 RELIEFF算法 mRMR-ReliefF算法 特征选择 差异函数 词间相关性 文本分类
下载PDF
基于热扩散影响力传播的社交网络个性化推荐算法 被引量:6
16
作者 任永功 杨柳 刘洋 《模式识别与人工智能》 EI CSCD 北大核心 2019年第8期746-757,共12页
有针对性地为用户提供推荐,提高互联网信息利用率是个性化推荐系统的主要目标.文中基于热扩散传播概率模型,结合用户在社交网络中隐含的跟随关系,提出基于热扩散影响力传播的社交网络个性化推荐算法.首先,算法将现实生活中人与人的朋友... 有针对性地为用户提供推荐,提高互联网信息利用率是个性化推荐系统的主要目标.文中基于热扩散传播概率模型,结合用户在社交网络中隐含的跟随关系,提出基于热扩散影响力传播的社交网络个性化推荐算法.首先,算法将现实生活中人与人的朋友关系转化为购物网络中用户与用户的跟随关系,构建异构信息网络图,计算用户之间的复合相似度.然后,利用基于热扩散概率模型模拟社会网络中影响力的传播过程,计算社交网络中用户的跟随概率分数并精确排序,筛选与目标用户相似的邻近用户.最后,根据目标邻近用户对各个产品的评分,将评分较高、具有潜在兴趣的产品推荐给目标用户,实现个性化的用户推荐.在公开数据集上与现有的个性化推荐算法进行对比,实验表明,文中算法具有较好的精确度和多样化的推荐效果. 展开更多
关键词 数据挖掘 社交网络 热扩散 协同过滤 个性化推荐
下载PDF
基于web日志的连续频繁路径挖掘算法 被引量:3
17
作者 任永功 付玉 张亮 《小型微型计算机系统》 CSCD 北大核心 2008年第12期2272-2276,共5页
频繁模式挖掘已成为web使用挖掘的研究热点,本文基于web日志提出一种新的频繁路径的挖掘算法.首先以线性回归方法求解兴趣度,其次将此兴趣度和页面名称作为最基本要素,建立的web浏览树,此浏览树可以完整地表现出web日志中连续、重复的... 频繁模式挖掘已成为web使用挖掘的研究热点,本文基于web日志提出一种新的频繁路径的挖掘算法.首先以线性回归方法求解兴趣度,其次将此兴趣度和页面名称作为最基本要素,建立的web浏览树,此浏览树可以完整地表现出web日志中连续、重复的浏览路径,最后在web浏览树上进行分析挖掘频繁浏览路径.该算法经实验证明能更全面地反映用户兴趣所在,挖掘的频繁浏览路径准确、合理. 展开更多
关键词 WEB日志 浏览兴趣度 多元线性回归 频繁浏览路径
下载PDF
网站评估指标体系的研究与建立 被引量:7
18
作者 任永功 李义勇 张庆 《教育信息化》 CSSCI 2004年第9期76-77,共2页
Internet的发展迫切需要有一套完整的网站评估标准体系。本文在对互联网上各级各类网站的调研分析的基础上,通过分析综合,以大学/企业网站为实例,建立了一套包含三项一级指标、9项二级指标和25项三级指标的评估指标体系。对于不同类型... Internet的发展迫切需要有一套完整的网站评估标准体系。本文在对互联网上各级各类网站的调研分析的基础上,通过分析综合,以大学/企业网站为实例,建立了一套包含三项一级指标、9项二级指标和25项三级指标的评估指标体系。对于不同类型的网站,该指标体系中的一级指标描述了网站建设的共性特征,稍加修改便可适用于对不同类型的网站进行系统化的质量评估。 展开更多
关键词 网站 评估标准体系 质量评估 评估方法 评估标准 大学 企业
下载PDF
利用类Delaunay三角剖分实现Voronio图 被引量:5
19
作者 任永功 廖士中 《计算机科学》 CSCD 北大核心 2002年第9期78-79,共2页
1引言 计算几何在计算机辅助设计、计算机图形学(特别是三维图形生成技术)及机器人等领域是非常重要的.特别在近年来,受到了学术界的极大关注.Voronoi图是计算几何的一个重要分支.在气象、生态、空中交通管制、城市规划等领域都得到广... 1引言 计算几何在计算机辅助设计、计算机图形学(特别是三维图形生成技术)及机器人等领域是非常重要的.特别在近年来,受到了学术界的极大关注.Voronoi图是计算几何的一个重要分支.在气象、生态、空中交通管制、城市规划等领域都得到广泛应用. 展开更多
关键词 计算几何 VORONOI图 增量算法 类Delaunay三角剖分
下载PDF
基于组合特征的动态垃圾博客过滤算法 被引量:2
20
作者 任永功 尹明飞 杨荣杰 《计算机科学》 CSCD 北大核心 2012年第5期177-179,212,共4页
近几年,垃圾博客过滤成为国际上新的热点研究领域。现有的过滤算法大多基于词频特征分类,特征冗余并缺乏关联性。为了解决此问题,提出一种基于组合特征的动态垃圾博客过滤算法(CFDSD),该算法采用作者属性和自相似特征来解决特征冗余和... 近几年,垃圾博客过滤成为国际上新的热点研究领域。现有的过滤算法大多基于词频特征分类,特征冗余并缺乏关联性。为了解决此问题,提出一种基于组合特征的动态垃圾博客过滤算法(CFDSD),该算法采用作者属性和自相似特征来解决特征冗余和关联性低的问题,并应用贝叶斯分类算法优化词频特征分类。实验表明,该算法能适应博客随时间变化而动态更新的特点,同时提高了过滤效率。 展开更多
关键词 垃圾博客过滤 词频特征 自相似特征 组合特征 贝叶斯分类
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部