期刊文献+
共找到111篇文章
< 1 2 6 >
每页显示 20 50 100
一种自适应的Web图像语义自动标注方法 被引量:15
1
作者 许红涛 周向东 +1 位作者 向宇 施伯乐 《软件学报》 EI CSCD 北大核心 2010年第9期2183-2195,共13页
提出了一种自适应的Web图像语义自动标注方法:首先利用Web标签资源自动获取训练数据;然后通过带约束的分段惩罚加权回归模型将关联文本权重分布自适应学习和先验知识约束有机地结合在一起,实现Web图像语义的自动标注.在4000幅从Web获得... 提出了一种自适应的Web图像语义自动标注方法:首先利用Web标签资源自动获取训练数据;然后通过带约束的分段惩罚加权回归模型将关联文本权重分布自适应学习和先验知识约束有机地结合在一起,实现Web图像语义的自动标注.在4000幅从Web获得的图像数据集上的实验结果验证了该文自动获取训练集方法以及Web图像语义标注方法的有效性. 展开更多
关键词 web图像标注 训练集自动获取 社会web标签 图像检索
下载PDF
基于社会标注的Web服务语义自动浮现方法 被引量:8
2
作者 宁达 何克清 +3 位作者 彭蓉 冯在文 刘建晓 李征 《计算机学报》 EI CSCD 北大核心 2011年第12期2414-2426,共13页
社会化标注已经成为当前Web2.0时代流行的资源识别和管理方法.针对当前Web服务语义描述能力不足的问题,提出一种基于多维度的Web服务语义社会标注方法.在社会标注模型的指导下,利用涉众的广泛参与性,从推荐标签集、候选标签集以及自由... 社会化标注已经成为当前Web2.0时代流行的资源识别和管理方法.针对当前Web服务语义描述能力不足的问题,提出一种基于多维度的Web服务语义社会标注方法.在社会标注模型的指导下,利用涉众的广泛参与性,从推荐标签集、候选标签集以及自由标签集3种集合中选取若干个标签对服务进行社会标注;同时从服务的功能语义、非功能语义、目标语义、交互语义和补充语义5个维度建立服务语义社会标注框架,给出具体标注类型,将其分为机器标注和群体标注,利用群体智能,对机器标注的服务语义进行修正和完善,提高Web服务语义描述的完整性(即服务标签的语义覆盖率).进而作者提出了一种服务语义自动浮现方法,结合服务语义维度优先级,并根据标签出现频率以及服务属性类型优先级对标签进行排序,使得Web服务能够呈现大众用户认可的语义信息,提高Web服务语义描述的准确性(即服务标签的有效使用率),为后期准确发现Web服务奠定基础.最后通过实验分析,验证上述方法在提高服务语义描述能力方面的实用性和有效性. 展开更多
关键词 社会标注 web服务 标签过滤 标签排序 标签推荐 语义浮现
下载PDF
基于Web 2.0的零件库管理系统 被引量:13
3
作者 黄沈权 顾新建 +1 位作者 祁国宁 张勇为 《计算机集成制造系统》 EI CSCD 北大核心 2009年第10期2057-2062,共6页
为促进基于Web的零件库中零部件分类和相互关系的有序化,将Web 2.0的方法和技术引入Web零件库中。分析了基于Web 2.0的零件库与基于Web 1.0的零件库的区别,总结了基于Web 2.0的零件库所涉及的关键技术。阐述了基于Web 2.0零件库的体系... 为促进基于Web的零件库中零部件分类和相互关系的有序化,将Web 2.0的方法和技术引入Web零件库中。分析了基于Web 2.0的零件库与基于Web 1.0的零件库的区别,总结了基于Web 2.0的零件库所涉及的关键技术。阐述了基于Web 2.0零件库的体系结构和应用技术,围绕该结构研究了Web 2.0技术在零件库中的应用技术,基于Web 2.0的自组织模式研究了零件库自组织技术和标签本体建设与维护的自组织技术。最后,开发了基于Web 2.0的零件库管理系统原型,为促进零件库中资源的有序化和零件库建设、维护、使用的大众化提供了新思路。 展开更多
关键词 零件库 web2.0 标签 本体
下载PDF
基于标签路径特征融合的在线Web新闻内容抽取 被引量:23
4
作者 吴共庆 胡骏 +4 位作者 李莉 徐喆昊 刘鹏程 胡学钢 吴信东 《软件学报》 EI CSCD 北大核心 2016年第3期714-735,共22页
精准地抽取新闻网页的内容,是提高Web新闻分析等应用系统工作质量的关键技术之一.由于缺少Web新闻出版的标准,存在大量不同的出版格式,并且Web本身是一种具有高度异构性的大数据载体,导致Web新闻内容抽取成为一个开放性问题.经大量实例... 精准地抽取新闻网页的内容,是提高Web新闻分析等应用系统工作质量的关键技术之一.由于缺少Web新闻出版的标准,存在大量不同的出版格式,并且Web本身是一种具有高度异构性的大数据载体,导致Web新闻内容抽取成为一个开放性问题.经大量实例分析发现,新闻网页内容与其上的标签路径存在潜在的关联性.因此,设计了标签路径特征系,以从不同视角区分网页内容和噪音.在特征相似性分析的基础上,提出了一种基于组合特征选择的特征融合策略,并设计了基于融合特征的Web新闻内容抽取方法 CEPF.CEPF是一种快速的通用、无需训练的在线Web新闻内容抽取算法,可抽取多种来源、多种风格、多种语言的Web新闻网页.在Clean Eval等测试数据集上的实验结果表明,CEPF方法优于CETR等抽取方法. 展开更多
关键词 内容抽取 web新闻 标签路径特征 组合特征选择 特征融合
下载PDF
基于标记图的Web数据模型 被引量:12
5
作者 陈滢 徐宏炳 王能斌 《计算机学报》 EI CSCD 北大核心 1999年第3期306-312,共7页
本文详细探讨了一种新的Web数据模型——标记图,给出了严格的形式化描述.标记图精确描述了HTML文档的标记关系,适合描述Web的半结构化数据,建立在标记图基础之上的查询语言可以用于Web查询、Web视图和资源发现等,... 本文详细探讨了一种新的Web数据模型——标记图,给出了严格的形式化描述.标记图精确描述了HTML文档的标记关系,适合描述Web的半结构化数据,建立在标记图基础之上的查询语言可以用于Web查询、Web视图和资源发现等,利用FORM标记可以查询动态文档内容.本文还简要介绍了标记图在Web查询优化、HTML文档结构信息抽取和视图技术中的应用,并探讨了标记图和其半结构化数据模型OEM关系. 展开更多
关键词 数据模型 半结构化数据 web 标记图 信息处理
下载PDF
Web全文检索中间件的设计与应用 被引量:2
6
作者 张维刚 徐永东 +1 位作者 雷小强 何辉 《计算机应用》 CSCD 北大核心 2011年第8期2261-2264,共4页
为了更好地为Web站内检索提供服务,对Web全文检索的关键技术进行了研究,设计并实现了一个用于Web全文检索的中间件。该中间件通过多线程网页爬虫程序来抓取网页;对抓取结果采用基于Bloom-Filter的大规模URL去重算法来进行高效消重;应用... 为了更好地为Web站内检索提供服务,对Web全文检索的关键技术进行了研究,设计并实现了一个用于Web全文检索的中间件。该中间件通过多线程网页爬虫程序来抓取网页;对抓取结果采用基于Bloom-Filter的大规模URL去重算法来进行高效消重;应用所提出的新的基于标签的正文提取方法来进行网页正文提取,实验结果表明该正文提取方法是有效可行的;此外,为了改善用户的搜索体验,该中间件还提供了一些个性化搜索辅助功能。最后,实现了一个完整的博客搜索系统Boso(博搜)来验证中间件的性能,结果说明该中间件是可以投入实际应用的。 展开更多
关键词 web全文检索 中间件 URL去重 网页标签 正文提取
下载PDF
基于MapReduce的Web标签SOINN聚类算法 被引量:3
7
作者 王洁 于颜硕 +1 位作者 周宽久 侯刚 《计算机科学》 CSCD 北大核心 2014年第12期197-201,共5页
Web标签有助于用户根据自己特定的兴趣完成信息资源的分类、组织和检索。然而,正是由于协同标记系统特有的公开性、自由化的特点,采用其对信息资源进行描述、组织、分类和检索,存在着信息描述不精确、标签组织混乱和标签语意模糊等问题... Web标签有助于用户根据自己特定的兴趣完成信息资源的分类、组织和检索。然而,正是由于协同标记系统特有的公开性、自由化的特点,采用其对信息资源进行描述、组织、分类和检索,存在着信息描述不精确、标签组织混乱和标签语意模糊等问题。在此背景下提出了3种基于特征向量表示法(FVR)的Web标签SOINN聚类算法:基于资源的特征向量表示法、基于其他共现标签的特征向量表示法和基于全集共现标签的特征向量表示法。同时应用MapReduce框架将SOINN算法进行并行化。实验表明,当类中心数量超过2000时,3种分布式聚类FVR算法的召回率和准确度优于原始算法,可获得很好的加速比。从而证明此分布式聚类算法具有很好的可扩展性,可以用于更为海量的Web日志聚类分析系统。 展开更多
关键词 web标签聚类 SOINN算法 MAPREDUCE
下载PDF
一种统一的Web新闻对象自动抽取方法 被引量:4
8
作者 刘伟 严华梁 《计算机工程》 CAS CSCD 2012年第11期167-169,共3页
提出一种统一的Web新闻对象自动抽取方法。通过抽取新闻页面中的分类、标题、发布时间、来源、作者、内容、相关评论链接和相关新闻链接作为分类属性,经页面解析、候选值抽取、真值识别3个步骤,实现新闻对象的自动抽取。实验结果表明,... 提出一种统一的Web新闻对象自动抽取方法。通过抽取新闻页面中的分类、标题、发布时间、来源、作者、内容、相关评论链接和相关新闻链接作为分类属性,经页面解析、候选值抽取、真值识别3个步骤,实现新闻对象的自动抽取。实验结果表明,该方法在同时抽取新闻对象的多个属性方面具有较高的准确性,且抽取结果不依赖于特定的页面模板。 展开更多
关键词 web数据抽取 视觉特征 序列标注 网页模板 新闻属性 新闻对象
下载PDF
Web站点层次结构抽取算法的分析和实现 被引量:3
9
作者 冯雁 王申康 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2005年第10期1507-1511,共5页
为了提高搜索引擎、网站管理及推荐系统的运行效率,提出了一种重构网站层次结构的方法,该方法以人工智能及图论为基础,通过对标记信息、网站的目录信息以及链接信息等的分析,定义和建立了网站的数据模型:结构标记图,并采用最短路径算法(... 为了提高搜索引擎、网站管理及推荐系统的运行效率,提出了一种重构网站层次结构的方法,该方法以人工智能及图论为基础,通过对标记信息、网站的目录信息以及链接信息等的分析,定义和建立了网站的数据模型:结构标记图,并采用最短路径算法(Dijkstral),完成Web站点的层次结构抽取.算法体系由5层构成:显示层、网站层、页面分析层、预处理层和连接层.实验结果证明该方法能正确地建立网站的层次结构,并具有较快的运行时间. 展开更多
关键词 web 结构挖掘 标记图 目录信息
下载PDF
支持Web2.0标签层次体系构建的关系识别及层次组合方法研究 被引量:2
10
作者 高克宁 张引 +1 位作者 张斌 张聿博 《电子学报》 EI CAS CSCD 北大核心 2014年第1期58-61,共4页
从标签系统中生成层次体系可以支持多种类型的应用,具备重要的意义.当前的研究主要集中于发现标签间的关系,但对如何利用这些关系形成高质量的层次体系却关注不足.针对这一现状,研究了支持Web 2.0标签层次体系构建的关系识别及层次组合... 从标签系统中生成层次体系可以支持多种类型的应用,具备重要的意义.当前的研究主要集中于发现标签间的关系,但对如何利用这些关系形成高质量的层次体系却关注不足.针对这一现状,研究了支持Web 2.0标签层次体系构建的关系识别及层次组合方法,通过分析并识别已发现的标签间关系所具有的不同类型提升了标签间关系的质量,并提出基于语义流动分析的层次组合方法实现了更高质量的层次体系构建.应用多种评估指标的实验结果表明应用关系识别及使用语义流分析方法可以获得相比评估方法更高质量的标签层次体系. 展开更多
关键词 web2 0 社会标注 标签层次体系 关系识别 层次组合
下载PDF
基于词性标注和依存句法的Web金融信息情感计算 被引量:17
11
作者 万常选 江腾蛟 +1 位作者 钟敏娟 边海容 《计算机研究与发展》 EI CSCD 北大核心 2013年第12期2554-2569,共16页
基于词袋模型的文本情感倾向性分析没有考虑句子的句法结构对句子语义的理解,基于依存句法分析的方法试图解决这一问题.目前基于依存句法分析的方法对影响文本情感的依存关系的选择多根据人为观察,带有随意性.根据影响句子情感倾向性的... 基于词袋模型的文本情感倾向性分析没有考虑句子的句法结构对句子语义的理解,基于依存句法分析的方法试图解决这一问题.目前基于依存句法分析的方法对影响文本情感的依存关系的选择多根据人为观察,带有随意性.根据影响句子情感倾向性的原极性、修饰极性和动态极性,1)找出了影响句子情感倾向性的4种词性:形容词、动词、副词和名词;2)从词性和汉语句子成分理解的角度,逐一分析了24种依存关系对句子情感计算的影响,找出了可能影响句子情感倾向性的8种依存关系;3)根据这8种依存关系中可能的词性组合设计了6种情感计算规则,并提出了基于二叉树的情感计算策略,设计了情感计算二叉树的构建算法和基于情感计算二叉树的情感计算算法;4)在Web金融信息上进行了实验测试,实验结果表明了该方法的有效性. 展开更多
关键词 情感计算 情感倾向性分析 web金融信息 词性标注 依存句法分析
下载PDF
基于扩展标记图的Web信息抽取器 被引量:2
12
作者 王亮 朱征宇 《计算机工程》 EI CAS CSCD 北大核心 2005年第8期159-161,191,共4页
介绍了一种新的Web信息抽取器,该抽取器基于扩展标记图模型,实现了数据和模式的分离,应用于Web检索系统中,能够有效地支持标记级实时信息检索、抽取和重组。还介绍了其在Web信息检索系统PowerSearcher中的实际应用。
关键词 web信息抽取器 扩展标记图 半结构数据 web检索
下载PDF
基于语义相似度与信息量的Web服务标签优化 被引量:1
13
作者 石磊 谢涛 +2 位作者 曹仰杰 卫琳 陶永才 《小型微型计算机系统》 CSCD 北大核心 2015年第6期1153-1157,共5页
Web服务标签是用户向Web服务添加的描述其功能或属性的关键词,用来提高服务相似度计算的准确率进而改善服务发现、服务组合和服务聚类等.目前不准确甚至错误的无效标签比例较高,影响了服务相似度计算的准确率.为此,提出一个Web服务标签... Web服务标签是用户向Web服务添加的描述其功能或属性的关键词,用来提高服务相似度计算的准确率进而改善服务发现、服务组合和服务聚类等.目前不准确甚至错误的无效标签比例较高,影响了服务相似度计算的准确率.为此,提出一个Web服务标签优化模型WS-TOM,分析了Web上已有WSDL文档,给出一种考虑到编程风格和命名规范的特征提取方法,用于Web服务相似度计算;然后综合标签与WSDL的语义相似度和标签的信息量来对标签进行排名,降低不准确标签的影响.实验结果及分析验证了WS-TOM模型能够提高Web服务相似度计算的准确率. 展开更多
关键词 web服务 相似度计算 标签 语义相似度 信息量
下载PDF
基于Struts构架的Web认证 被引量:3
14
作者 范爱平 金连甫 《计算机工程》 EI CAS CSCD 北大核心 2005年第19期146-147,153,共3页
提出了利用Struts构架,设计和实现可重用的Web服务器认证算法,指出了纯Cookies认证算法的不足,论述了SSL安全协议和其在Web上的应用。利用J2EE的servlet重定向机制,实现HTTP和HTTPS无缝的混合使用。使用JSP的用户定制标签和servlet功能... 提出了利用Struts构架,设计和实现可重用的Web服务器认证算法,指出了纯Cookies认证算法的不足,论述了SSL安全协议和其在Web上的应用。利用J2EE的servlet重定向机制,实现HTTP和HTTPS无缝的混合使用。使用JSP的用户定制标签和servlet功能,设计了安全、可重用、易扩展的算法。并在Struts和Tomcat Web服务器环境下实现了算法。 展开更多
关键词 web认证 STRUTS COOKIES JSP定制标签
下载PDF
Web数据库快速开发工具的研究 被引量:1
15
作者 蔡涛 鞠时光 《计算机工程与应用》 CSCD 北大核心 2002年第2期174-176,共3页
网络技术和Web技术的快速发展,导致大量的应用向Web集成。但由于HTML提供的功能有限,在很多应用领域就需要进行对应的扩展。文章对几种常用的Web应用扩展的方法进行了比较。然后着重介绍了使用VisualC++进行ColdFusion扩展的方法。
关键词 web数据库 COLDFUSION 扩展标签 快速开发工具 组件
下载PDF
基于标记树对象抽取技术的Hidden Web获取研究 被引量:9
16
作者 宋晖 张岭 +1 位作者 叶允明 马范援 《计算机工程与应用》 CSCD 北大核心 2002年第23期9-12,24,共5页
目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息。大量的HiddenWeb信息(估计容量是可索引Web的500倍)对这些搜索引擎是不可见的。这些信息隐藏在Web页面的搜索表单后面,保存在大型的动态数据库中。该... 目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息。大量的HiddenWeb信息(估计容量是可索引Web的500倍)对这些搜索引擎是不可见的。这些信息隐藏在Web页面的搜索表单后面,保存在大型的动态数据库中。该文提出了一套检索HiddenWeb信息的方法,给出了系统的框架结构,并详细讨论了实现的关键技术。系统采用新的基于标记树的对象抽取(Tag-Tree-basedObjectExtraction)方法自动地从Web页面中抽取HiddenWeb信息,然后在此基础上给出了结构化的HiddenWeb信息查询算法。文章最后对实验结果进行了讨论。 展开更多
关键词 标记树 对象抽取 Hiddenweb 互联网 搜索引擎 信息检索 结构化查询 数据库
下载PDF
一种新型的Web页面标注技术 被引量:1
17
作者 白戈力 孙沛 《计算机应用与软件》 CSCD 2010年第12期123-126,共4页
Web页面标注技术在互联网上应用广泛,提出了一种基于JavaScript的新型的标注生成、呈现及存储技术。运用JavaS-cript脚本语言结合JSP,开发出了可以内嵌于Web页面的组件,使得生成、呈现以及存储标注变得简单、快捷。
关键词 标注 JAVASCRIPT 网页编辑器
下载PDF
工控系统中嵌入式Web服务器的设计与实现 被引量:22
18
作者 王传启 邓文栋 金敏 《计算机工程与应用》 CSCD 北大核心 2002年第10期227-230,共4页
针对传统Web技术路线方案用于构造工控系统中Web服务器存在的困难,提出应用嵌入式技术开发工控系统中嵌入式Web服务器的基本思想。文章结合工控产品开发实例,介绍了嵌入式Web服务器的功能,给出了系统基于三层B/S结构的瘦Web服务器体系结... 针对传统Web技术路线方案用于构造工控系统中Web服务器存在的困难,提出应用嵌入式技术开发工控系统中嵌入式Web服务器的基本思想。文章结合工控产品开发实例,介绍了嵌入式Web服务器的功能,给出了系统基于三层B/S结构的瘦Web服务器体系结构,详细阐述了嵌入式Web服务器实现的一些关键技术。工控系统基于嵌入式Web服务器的远程监控维护方式将有效降低监控运行维护成本、提高监控运行维护效率,因而具有很大的应用前景和推广价值。 展开更多
关键词 嵌入式web服务器 工控系统 自定义标记 数据点复用 设计
下载PDF
基于标记树的Web页面区域划分和搜索方法 被引量:7
19
作者 胡飞 《计算机科学》 CSCD 北大核心 2005年第8期182-185,共4页
Web页面的布局可以分为:主要内容、单位标识、导航信息、交互信息和版权申明。我们在处理这些页面时往往只关心主要内容,而且可以从语义上快速定位到主要内容,但是软件系统要做到这一点就非常困难。本文提出一种基于标记树的Web页面区... Web页面的布局可以分为:主要内容、单位标识、导航信息、交互信息和版权申明。我们在处理这些页面时往往只关心主要内容,而且可以从语义上快速定位到主要内容,但是软件系统要做到这一点就非常困难。本文提出一种基于标记树的Web页面区域划分和搜索方法,让软件系统可以忽略别的区域,快速定位到主要内容。对于大量Web页面处理而言,这种方法可以起到减少时间,缩小空间的作用,Web页面越多,效果就越显著。 展开更多
关键词 web页面布局 页面结构 页面区域 标记树 标记树模式 web页面 搜索方法 区域划分 快速定位 软件系统
下载PDF
基于标记树的WEB页面净化技术研究 被引量:3
20
作者 李明 张为群 《西南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第5期128-131,共4页
根据Web页面标记建立标记树,通过分析,保留有用信息的标记子树,达到获取页面主要内容,净化页面的效果.
关键词 标记树 标记树模式 页面净化
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部