期刊文献+
共找到65篇文章
< 1 2 4 >
每页显示 20 50 100
一种融合字词双通道的Domain-Flux僵尸网络检测方法 被引量:1
1
作者 李晓冬 宋元凤 李育强 《计算机科学》 CSCD 北大核心 2023年第12期337-342,共6页
Domain-Flux是僵尸网络中常用的一种命令与控制信道隐蔽技术,其能有效躲避网络安全设备的检测。针对现有检测方法中对Domain-Flux域名信息提取不全面,无法有效捕获词典类域名关键分类特征的问题,提出了一种融合字词双通道的Domain-Flux... Domain-Flux是僵尸网络中常用的一种命令与控制信道隐蔽技术,其能有效躲避网络安全设备的检测。针对现有检测方法中对Domain-Flux域名信息提取不全面,无法有效捕获词典类域名关键分类特征的问题,提出了一种融合字词双通道的Domain-Flux僵尸网络检测方法。在字符向量和词根向量两个通道上分别采用卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)提取局部特征和全局特征,丰富输入域名的特征信息,提升分类性能。其中,字符向量通道针对随机字符域名提取局部空间特征,而词根向量通道基于TF-IDF算法,引入类内因子将词根重要性加权到词向量中,然后提取域名单词组合序列前后的时序特征。实验结果表明,与单一采用TextCNN或BiLSTM的模型相比,融合字词双通道的模型检测准确率分别提高7.12%和5.86%,针对词典类Domain-Flux的检测也具有更高的精确率。 展开更多
关键词 domain-Flux 僵尸网络 TF-IDF 卷积神经网络 双向长短期记忆网络
下载PDF
基于改进TF-IDF与BERT的领域情感词典构建方法 被引量:1
2
作者 蒋昊达 赵春蕾 +1 位作者 陈瀚 王春东 《计算机科学》 CSCD 北大核心 2024年第S01期150-158,共9页
领域情感词典的构建是领域文本情感分析的基础。现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题。为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于... 领域情感词典的构建是领域文本情感分析的基础。现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题。为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于改进词频-逆文档频率(TF-IDF)与BERT的领域情感词典构建方法。该方法在筛选领域候选情感词阶段对TF-IDF算法进行改进,将隐含狄利克雷分布(LDA)算法与改进后的TF-IDF算法结合,进行领域性修正,提升了所筛选候选情感词的领域性;在候选情感词极性判断阶段,将情感倾向点互信息算法(SO-PMI)与BERT结合,利用领域情感词微调BERT分类模型,提高了判断领域候选情感词情感极性的准确程度。在不同领域的用户评论数据集上进行实验,结果表明,该方法可以提高所构建领域情感词典的质量,使用该方法构建的领域情感词典用于汽车领域和手机领域文本情感分析的F1值分别达到78.02%和88.35%。 展开更多
关键词 情感分析 领域情感词典 词频-逆文档频率 隐含狄利克雷分布 情感倾向点互信息算法 BERT模型
下载PDF
试点选择的偏好:基于中央部委发起试点的政策文本分析
3
作者 吴怡频 钟文钰 赵雅婷 《公共管理评论》 CSSCI 2024年第2期185-210,共26页
试点选择是政策试点的关键环节,影响试点创新与推广效果。然而,研究人员缺少近距离观察或直接访谈决策者的机会,这制约了试点选择研究的发展。本研究将试点政策文本视为决策者对试点选择条件的官方表述,并挖掘文本中试点选择的偏好。本... 试点选择是政策试点的关键环节,影响试点创新与推广效果。然而,研究人员缺少近距离观察或直接访谈决策者的机会,这制约了试点选择研究的发展。本研究将试点政策文本视为决策者对试点选择条件的官方表述,并挖掘文本中试点选择的偏好。本研究收集了“十三五”时期385项中央部委发起试点的政策文本和部分试点的首轮试点名单。研究获得三项发现。第一,中央部委发起试点向经济发达地区或区域中心城市聚集,但各政策领域的聚集程度不同。第二,词频和共现关系分析显示“择优选点”和“重视基础”的总原则。第三,各政策领域的偏好与重视条件不尽相同,经济发展类试点强调创新试验和重点战略,农业农村和社会保障类试点则关注代表性,环境保护类试点兼顾全局需要和重点问题。 展开更多
关键词 试点选择 政策文本 词频分析 政策领域
下载PDF
基于评论细粒度观点的跨域推荐模型 被引量:2
4
作者 王禹 吴云 《计算机工程与应用》 CSCD 北大核心 2023年第10期114-122,共9页
现有大多数跨域推荐(cross-domain recommendation,CDR)方法只是简单利用评分数据,对评论信息的挖掘不足。评论信息中往往包含用户的多个观点,如何充分利用评论信息中的细粒度观点挖掘其潜在价值以更好地解决跨域推荐冷启动和数据稀疏问... 现有大多数跨域推荐(cross-domain recommendation,CDR)方法只是简单利用评分数据,对评论信息的挖掘不足。评论信息中往往包含用户的多个观点,如何充分利用评论信息中的细粒度观点挖掘其潜在价值以更好地解决跨域推荐冷启动和数据稀疏问题,成为当下跨域推荐的研究重点与难点。因此,设计了一种基于评论细粒度观点的跨域推荐模型(cross-domain recommendation model based on fine-grained opinion from review,FGOR-CDRM)。该模型主要由评论细粒度观点提取、辅助评论增强、跨域相关性学习三个模块组成。将文本卷积神经网络(text convolutional neural network,TextCNN)与门控机制结合,通过设置两个全局细粒度观点矩阵指导查询,有效提取评论信息的细粒度观点;在文本卷积之上增加一层卷积,利用相似非重叠用户的评论构建辅助文档,在增加训练数据多样性的同时有效缓解了数据稀疏;学习跨域细粒度观点之间的相关性,利用静态细粒度观点构建相关矩阵并进行语义匹配,实现目标域冷启动用户对项目的评分预测。在Amazon三个不同数据集(Book,Movies and TV,CDs and Vinyl)构成的三个领域对下进行实验,实验结果表明,FGOR-CDRM模型在三数据对下的表现均优于其他基准模型,以“电影-图书”数据对为例,FGOR-CDRM模型的(mean absolute error,MAE)比基线模型中ANR模型提高6.09%,比CDLFM模型提高3.58%。 展开更多
关键词 细粒度观点 跨域推荐 辅助文档 相关性学习
下载PDF
Construct Protein-Protein Interaction Network by Mining Domain-Domain Interactions
5
作者 Zhixia Teng Maozu Guo +3 位作者 Xiaoyan Liu Jin Li Qiguo Dai Chunyu Wang 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2016年第4期27-36,共10页
Domain-domain interactions are important clues to inferring protein-protein interactions. Although about 8 000 domain-domain interactions are discovered so far,they are just the tip of the iceberg. Because domains are... Domain-domain interactions are important clues to inferring protein-protein interactions. Although about 8 000 domain-domain interactions are discovered so far,they are just the tip of the iceberg. Because domains are conservative and commonplace in proteins,domain-domain interactions are discovered based on pairs of domains which significantly co-exist in proteins. Meanwhile,it is realized that:( 1) domain-domain interactions may exist within the same proteins or across different proteins;( 2) only the domain-domain interactions across different proteins can mediate interactions between proteins;( 3) domains have biases to interact with other domains. And then,a novel method is put forward to construct protein-protein interaction network by using domain-domain interactions. The method is validated by experiments and compared with the state- of-art methods in the field. The experimental results suggest that the method is reasonable and effectiveness on constructing Protein-protein interactions network. 展开更多
关键词 protein-protein interaction domain-domain interaction statistical significance test
下载PDF
基于元数据与领域概念树的文本相似度计算 被引量:7
6
作者 张佩云 陈恩红 +2 位作者 谢荣见 宫秀文 黄波 《系统工程与电子技术》 EI CSCD 北大核心 2014年第3期591-597,共7页
随着网络与信息技术的快速发展,导致网络上产生了大量的电子文本,而文本间的相似度计算是文本处理的一种重要手段。对于大规模的文本集,通常采用向量空间模型(vector space model,VSM)进行文本表示,但是该方法面临着文本向量维度较高及... 随着网络与信息技术的快速发展,导致网络上产生了大量的电子文本,而文本间的相似度计算是文本处理的一种重要手段。对于大规模的文本集,通常采用向量空间模型(vector space model,VSM)进行文本表示,但是该方法面临着文本向量维度较高及文本语义相似度难以度量的问题。提出一种改进的文本相似度计算方法,从大量的特征空间中选择出具有代表性的元数据特征向量元素,以降低向量空间的维度;构建领域概念树并设计基于领域概念树的文本相似度算法,对领域概念中广泛存在的同义词进行处理,以提高文本之间语义相似度度量的性能。实验结果表明:通过降维和概念相似度计算可提高文本相似度计算的性能。 展开更多
关键词 文本元数据 领域概念树 元数据特征向量 文本相似度
下载PDF
基于本体的林业领域文档特征权重模型 被引量:3
7
作者 张乃静 鞠洪波 纪平 《计算机工程与应用》 CSCD 2013年第18期20-23,共4页
传统文档特征权重模型仅考虑关键词本身,文档内其他相关词汇并没有参与计算,信息检索时无法返回全面和准确的结果。为解决该问题提出了一种基于本体的林业领域文档特征权重模型。该模型计算TF-IDF特征权重;结合林业领域本体,分别获取关... 传统文档特征权重模型仅考虑关键词本身,文档内其他相关词汇并没有参与计算,信息检索时无法返回全面和准确的结果。为解决该问题提出了一种基于本体的林业领域文档特征权重模型。该模型计算TF-IDF特征权重;结合林业领域本体,分别获取关键词和林业领域内其他词汇的语义距离、语义重合度和概念的层次差,并计算语义相关度;结合TF-IDF和语义相似度的结果计算特征权重。实验证明该模型可以提高文本检索的查准率和查全率,使检索结果更加满足用户的需求。 展开更多
关键词 本体 林业领域 文档特征 权重模型 语义相似度
下载PDF
我国教育经济学研究的知识图谱——基于2000-2008年文献共被引分析 被引量:6
8
作者 黄维 陈勇 《高教发展与评估》 CSSCI 2010年第6期87-95,共9页
知识图谱是一种有效的知识管理工具,能以可视化的图形展示学科结构,为科学工作者的未来研究提供指引。对2000-2008年与教育经济学领域相关的6个学术期刊发表的2006篇论文的26753条引文进行多维尺度分析,用知识图谱的可视化手段形象地展... 知识图谱是一种有效的知识管理工具,能以可视化的图形展示学科结构,为科学工作者的未来研究提供指引。对2000-2008年与教育经济学领域相关的6个学术期刊发表的2006篇论文的26753条引文进行多维尺度分析,用知识图谱的可视化手段形象地展示出当前我国教育经济学的热点研究领域及结构特征,为我国教育经济学者追踪研究热点动态,把握学科结构奠定科学客观的理论基础。 展开更多
关键词 教育经济学 学科结构 知识图谱 文献被引率
下载PDF
领域概念术语提取中特征项自动抽取方法 被引量:3
9
作者 孙珠婷 顾倩颐 《计算机工程与设计》 CSCD 北大核心 2012年第8期3189-3193,共5页
针对领域概念术语提取过程中特征项来源于人工获取领域文本集以及特征项抽取的准确性不高的问题,提出一种特征项自动抽取方法。首先利用第三方接口从文献资源库中获取大量领域文本集,并对其进行段落分析,在文本预处理阶段提出一种改进... 针对领域概念术语提取过程中特征项来源于人工获取领域文本集以及特征项抽取的准确性不高的问题,提出一种特征项自动抽取方法。首先利用第三方接口从文献资源库中获取大量领域文本集,并对其进行段落分析,在文本预处理阶段提出一种改进的无词典分词方法进行二次分词,结合TFIDF,开方检验,信息增益及词汇位置权重方法进行特征项抽取。实验结果表明,该方法能实现特征项自动化抽取。 展开更多
关键词 领域概念术语 特征项自动抽取 领域文本集 无词典分词 位置权重
下载PDF
基于双域信息融合的鲁棒二值文本图像水印 被引量:20
10
作者 朱新山 陈砚鸣 +1 位作者 董宏辉 丁杰 《计算机学报》 EI CSCD 北大核心 2014年第6期1352-1364,共13页
该文提出了一种适用于二值文本图像的双域水印方案.该方案生成水印模板作为离散余弦变换域信号,然后将其与要嵌入的信息进行调制.在水印嵌入之前,调制后的信号被变换到空间域中,并调整局部嵌入强度使得水印信号适合人类视觉系统的特征.... 该文提出了一种适用于二值文本图像的双域水印方案.该方案生成水印模板作为离散余弦变换域信号,然后将其与要嵌入的信息进行调制.在水印嵌入之前,调制后的信号被变换到空间域中,并调整局部嵌入强度使得水印信号适合人类视觉系统的特征.水印提取采用相关检测器,可在变换域内或空间域内操作,而且,从理论上分析了感知整形过程与翻转像素点个数对水印提取的影响.为了抵抗水印同步信息损失,将提出的双域水印方案与一个图像归一化方案相结合.此归一化方案采用了文本倾斜检测与字符分割技术,适合于文本图像的特点.实验表明,提出的方案对常见的图像处理操作、几何攻击和打印-扫描过程具有良好的鲁棒性. 展开更多
关键词 数字水印 二值文本图像 双域 鲁棒性 打印扫描
下载PDF
基于多层体系结构的公文流转领域框架 被引量:3
11
作者 徐宏喆 张昊翔 +1 位作者 王俊刚 刘朝龙 《计算机工程》 EI CAS CSCD 北大核心 2006年第10期40-42,93,共4页
领域框架为特定领域软件的开发提供了基础平台。该文以公文流转领域为研究对象,对其进行详细的领域分析,描述了领域需求,确定领域边界和建立领域模型;设计并实现了一种基于多层体系结构的公文流转领域框架。
关键词 领域框架 体系结构 公文流转
下载PDF
基于蒙古文数字图书馆建设蒙古文文献共享域之探讨 被引量:7
12
作者 索娅 阿拉坦仓 《大学图书馆学报》 CSSCI 北大核心 2015年第4期90-92,127,共4页
民族文献共享域建设是网络环境下亟待解决的问题。基于蒙古文文献数字化已有的成果,建立蒙古文文献共享域,在理论和实践上都是一次探索和挑战。该文在充分发挥蒙古文文献共享域建设有利条件的同时,针对蒙古文共享域建设的必要性、成果... 民族文献共享域建设是网络环境下亟待解决的问题。基于蒙古文文献数字化已有的成果,建立蒙古文文献共享域,在理论和实践上都是一次探索和挑战。该文在充分发挥蒙古文文献共享域建设有利条件的同时,针对蒙古文共享域建设的必要性、成果及其不足提出相应的对策。 展开更多
关键词 民族文献 蒙古文文献 数字化 共享域 对策
下载PDF
中德文献传递合作——中德跨域信息服务的成功实践 被引量:1
13
作者 贾苹 刘素清 +1 位作者 陈顺忠 夏磊 《图书馆建设》 CSSCI 北大核心 2010年第11期70-73,共4页
中德文献传递合作是"中德数字信息提供"合作项目中"跨域信息服务"专题的一个子项目,是由中国科学院国家科学图书馆协同北京大学图书馆、上海图书馆共同与德国Subito文献传递服务中心合作开展的跨域文献传递服务。... 中德文献传递合作是"中德数字信息提供"合作项目中"跨域信息服务"专题的一个子项目,是由中国科学院国家科学图书馆协同北京大学图书馆、上海图书馆共同与德国Subito文献传递服务中心合作开展的跨域文献传递服务。中德双方在同一个平台下开展资源共享服务,并建立了服务合作机制,从而实现了中文文献在国外文献传递系统中的直接检索和传递服务,解决了非本地和非本国文献的异地获取和使用问题,实现了跨域资源共享及跨域信息服务。 展开更多
关键词 中德文献传递合作 跨域信息服务 文献传递
下载PDF
《周礼》中版图文书制度与人口、土地资源管理探析 被引量:3
14
作者 孙瑞 《人口学刊》 CSSCI 北大核心 2003年第3期48-53,共6页
在我国周代的版图文书中,包含了大量的人口、土地资源管理方面的信息。通过《周礼》中版图文书制度研究这一视角,展示了奴隶制社会周代人口、土地资源管理状况的一个侧面,为完善先秦文书制度的研究、为补充先秦人口、土地资料管理的研... 在我国周代的版图文书中,包含了大量的人口、土地资源管理方面的信息。通过《周礼》中版图文书制度研究这一视角,展示了奴隶制社会周代人口、土地资源管理状况的一个侧面,为完善先秦文书制度的研究、为补充先秦人口、土地资料管理的研究提供一点信息。 展开更多
关键词 先秦史 周代 版图文书 文书制度
下载PDF
高校重点学科建设与馆藏文献资源建设 被引量:11
15
作者 李彦萍 《农业图书情报学刊》 2003年第1期57-59,共3页
馆藏文献资源建设是高校重点学科建设的重要保障。笔者分析了重点学科建设状况 ,以及重点学科文献资源收藏原则、采集目标 ,以便有计划、多途径的采集收藏重点学科文献。
关键词 高校 重点学科 文献资源建设 馆藏建设 文献采集
下载PDF
面向高校重点学科 加强文献资源建设 被引量:1
16
作者 周月萍 班珍 +2 位作者 马利芹 郭天宝 于淑娟 《农业图书情报学刊》 2003年第2期61-62,65,共3页
笔者就高校图书馆文献资源建设的现状进行了分析 ,并对搞好文献资源建设工作提出建议。
关键词 高校图书馆 重点学科 文献资源建设 经费筹集 文献搜集 馆员素质
下载PDF
国内图书馆2.0研究进展 被引量:6
17
作者 刘静 《科技管理研究》 CSSCI 北大核心 2013年第11期169-174,179,共7页
为了跟踪我国图书馆2.0研究进展,以2006—2010年CSSCI为数据源,借助CiteSpaceⅡ对文献作者、机构分布及其合作网络进行分析,并采用关键词共现和文献共被引分析方法,对研究主题进行可视化分析。研究发现,五年来图书馆2.0研究还未形成核... 为了跟踪我国图书馆2.0研究进展,以2006—2010年CSSCI为数据源,借助CiteSpaceⅡ对文献作者、机构分布及其合作网络进行分析,并采用关键词共现和文献共被引分析方法,对研究主题进行可视化分析。研究发现,五年来图书馆2.0研究还未形成核心作者,作者之间的合作也仅限于本单位或师生之间;擅长理论研究的院系和具有实践研究条件的高校图书馆是该领域研究的主力军,但两者合作关系不够紧密;从主题上看,图书馆服务、图书馆信息资源管理、数字图书馆、图书馆2.0建设、图书馆2.0的应用调查、OPAC和知识管理等是近几年该领域研究的焦点问题。 展开更多
关键词 图书馆2 0 知识图谱 关键词共现 文献共被引
下载PDF
开放域问答技术研究进展 被引量:17
18
作者 张志昌 张宇 +1 位作者 刘挺 李生 《电子学报》 EI CAS CSCD 北大核心 2009年第5期1058-1069,共12页
问答技术是信息检索和自然语言理解中的研究热点.本文对开放域问答技术在近年来的研究进展进行了总结.针对不同类型的问题,比较了问答系统中问题分析、文档和句段检索、答案抽取各个部分不同实现方法的特点,讨论了这些技术中存在的不足... 问答技术是信息检索和自然语言理解中的研究热点.本文对开放域问答技术在近年来的研究进展进行了总结.针对不同类型的问题,比较了问答系统中问题分析、文档和句段检索、答案抽取各个部分不同实现方法的特点,讨论了这些技术中存在的不足.最后,对问答技术未来的研究趋势进行了分析与展望. 展开更多
关键词 开放域问答 问题分析 相关文档检索 句段检索 答案抽取
下载PDF
基于论域划分的无监督文本特征选择方法 被引量:2
19
作者 朱颢东 吴怀广 《科学技术与工程》 北大核心 2013年第7期1836-1839,共4页
由于缺乏类信息,使得无监督文本特征选择问题一直未较好地加以解决。为此,对该问题进行了研究并提出了一个基于论域划分的无监督文本特征选择。该方法主要是把论域划分的思想引入到无监督文本特征选择之中,其首先使用一种新型无监督文... 由于缺乏类信息,使得无监督文本特征选择问题一直未较好地加以解决。为此,对该问题进行了研究并提出了一个基于论域划分的无监督文本特征选择。该方法主要是把论域划分的思想引入到无监督文本特征选择之中,其首先使用一种新型无监督文档进行文本特征初选以过滤低频的噪声词,然后再使用所给的基于论域划分的属性约简进行文本特征优选。实验结果表明这个方法能够克服文本聚类时缺乏类的先验知识的不足,可以较好地解决无监督文本特征选择问题。 展开更多
关键词 文本聚类 特征选择 文档频 论域划分
下载PDF
一种面向元数据描述文档的概念检索方法 被引量:2
20
作者 沙莎 曾慧宏 罗三定 《计算机工程与应用》 CSCD 北大核心 2005年第25期168-171,共4页
元数据描述文档在检索过程中仍然存在着检索词和描述词不匹配的问题。文章在准确描述领域概念之间关系的概念网的支持下,给出检索词和描述词的概念相关度计算公式,提出了用概念扩展来提高检索质量的新方法。并在领域概念网和元数据描述... 元数据描述文档在检索过程中仍然存在着检索词和描述词不匹配的问题。文章在准确描述领域概念之间关系的概念网的支持下,给出检索词和描述词的概念相关度计算公式,提出了用概念扩展来提高检索质量的新方法。并在领域概念网和元数据描述的科技文档组成的实验系统上,进行了多种实验和分析,证明了检索方法的有效性。 展开更多
关键词 文档检索 元数据 概念相关 领域概念网 相关度
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部