期刊文献+
共找到431篇文章
< 1 2 22 >
每页显示 20 50 100
Web content analysis of agricultural cooperatives located in Turkey
1
作者 Mert Uydact Halil lbrahim Alpaslan Basak Degerli 《Chinese Business Review》 2010年第6期38-42,共5页
关键词 农业合作社 土耳其 网页内容 合作组织 合作伙伴 营销活动 全球化 进程
下载PDF
“三全育人”背景下“Web前端开发”课程思政教学内容设计--以“HTML5应用开发基础”课程为例
2
作者 吴亚林 陈婷婷 +1 位作者 吕太之 孟晓莉 《计算机应用文摘》 2024年第3期1-3,共3页
在新时代背景下,高校以“立德树人”为根本任务、以“三全育人”(全员育人、全过程育人和全方位育人)为教育理念,肩负起价值引领的责任,培养德智体美劳全面发展的人才。在课程教学过程中,通过融入思政教育内容,可以培养学生正确的价值... 在新时代背景下,高校以“立德树人”为根本任务、以“三全育人”(全员育人、全过程育人和全方位育人)为教育理念,肩负起价值引领的责任,培养德智体美劳全面发展的人才。在课程教学过程中,通过融入思政教育内容,可以培养学生正确的价值观、道德观和社会责任感,提高学生的思想品德素养和综合能力。文章以“HTML5应用开发基础”课程为例,介绍了课程思政教学内容的设计方法。 展开更多
关键词 思政教学 web前端开发 教学内容设计 HTML5
下载PDF
Web 3.0环境下基于区块链的可信AIGC技术 被引量:3
3
作者 高志鹏 林怡静 +1 位作者 杜泓阳 韩珍珍 《河北省科学院学报》 CAS 2023年第2期1-9,共9页
Web 3.0是互联网发展的第三个阶段,具有网络结构去中心化、链上内容难以篡改以及用户掌控数据权限等特点。随着人工智能生成内容(AI-Generated Content,AIGC)技术的不断发展,AIGC服务提供商对算力、数据和模型的垄断导致资源日益集中化... Web 3.0是互联网发展的第三个阶段,具有网络结构去中心化、链上内容难以篡改以及用户掌控数据权限等特点。随着人工智能生成内容(AI-Generated Content,AIGC)技术的不断发展,AIGC服务提供商对算力、数据和模型的垄断导致资源日益集中化,这可能会引发单点故障、数据篡改、用户难以控制数据和资源等问题。为解决上述问题,本文面向Web 3.0环境采用区块链赋能AIGC内容生成,利用智能合约实现内容生成任务的发布,通过区块链和联邦扩散模型实现去中心化内容生成,并构建资源分配机制实现有效的资源利用。 展开更多
关键词 web 3.0 区块链 生成式AI
下载PDF
Analysis on the Content Features and Their Correlation of Web Pages for Spam Detection 被引量:1
4
作者 JI Hua ZHANG Huaxiang 《China Communications》 SCIE CSCD 2015年第3期84-94,共11页
In the global information era,people acquire more and more information from the Internet,but the quality of the search results is degraded strongly because of the presence of web spam.Web spam is one of the serious pr... In the global information era,people acquire more and more information from the Internet,but the quality of the search results is degraded strongly because of the presence of web spam.Web spam is one of the serious problems for search engines,and many methods have been proposed for spam detection.We exploit the content features of non-spam in contrast to those of spam.The content features for non-spam pages always possess lots of statistical regularities; but those for spam pages possess very few statistical regularities,because spam pages are made randomly in order to increase the page rank.In this paper,we summarize the regularities distributions of content features for non-spam pages,and propose the calculating probability formulae of the entropy and independent n-grams respectively.Furthermore,we put forward the calculation formulae of multi features correlation.Among them,the notable content features may be used as auxiliary information for spam detection. 展开更多
关键词 垃圾邮件 网页 检测 全球信息化 内容特征 统计规律 搜索结果 搜索引擎
下载PDF
A UNIFIED EXTENDING METHOD FOR CONTENT-IGNORANT WEB PAGE CLUSTERING
5
作者 Shi Lin Chen Chen 《Journal of Electronics(China)》 2010年第1期105-112,共8页
The content-ignorant clustering method takes advantages in time complexity and space complexity than the content based methods.In this paper,the authors introduce a unified expanding method for content-ignorant web pa... The content-ignorant clustering method takes advantages in time complexity and space complexity than the content based methods.In this paper,the authors introduce a unified expanding method for content-ignorant web page clustering by mining the "click-through" log,which tries to solve the problem that the "click-through" log is sparse.The relationship between two nodes which have been expanded is also defined and optimized.Analysis and experiment show that the performance of the new method has improved,by the comparison with the standard content-ignorant method.The new method can also work without iterative clustering. 展开更多
关键词 web data mining CLUSTERING content-ignorant clustering
下载PDF
Web挖掘研究综述 被引量:49
6
作者 涂承胜 鲁明羽 陆玉昌 《计算机工程与应用》 CSCD 北大核心 2003年第10期90-93,共4页
论文介绍了Web挖掘的概念,指出了Web挖掘中存在的问题,给出了Web挖掘研究的三种分类:Web内容挖掘、Web结构挖掘、Web使用挖掘,针对每一种分类介绍了各自的研究对象、表示方法、处理方法、应用领域及最近的研究情况,同时展望了Web挖掘的... 论文介绍了Web挖掘的概念,指出了Web挖掘中存在的问题,给出了Web挖掘研究的三种分类:Web内容挖掘、Web结构挖掘、Web使用挖掘,针对每一种分类介绍了各自的研究对象、表示方法、处理方法、应用领域及最近的研究情况,同时展望了Web挖掘的未来研究方向。 展开更多
关键词 web INTERNET 搜索引擎 信息检索 数据库 数据处理 数据挖掘
下载PDF
Web内容挖掘技术研究 被引量:23
7
作者 涂承胜 鲁明羽 陆玉昌 《计算机应用研究》 CSCD 北大核心 2003年第11期5-9,15,共6页
简要介绍了Web挖掘的概念、分类以及其功能,阐述了Web挖掘与传统数据挖掘以及Web信息检索之间的关系。给出了Web内容挖掘的不同分类方法、文本以及多媒体文本数据挖掘的定义、分类与应用。重点分析了Web文本挖掘的方法,包括文本的特征... 简要介绍了Web挖掘的概念、分类以及其功能,阐述了Web挖掘与传统数据挖掘以及Web信息检索之间的关系。给出了Web内容挖掘的不同分类方法、文本以及多媒体文本数据挖掘的定义、分类与应用。重点分析了Web文本挖掘的方法,包括文本的特征表示与抽取、文本的分类与聚类等,讨论了多媒体文本分类挖掘方法。 展开更多
关键词 web挖掘 web内容挖掘 文本的分类 文本聚类 多媒体文本挖掘
下载PDF
基于自然语言处理的Web内容过滤模型 被引量:6
8
作者 陈阳贵 袁卫忠 谢俊元 《计算机应用研究》 CSCD 北大核心 2001年第7期125-128,共4页
提出了一种基于自然语言处理技术的Web内容过滤模型,引入了中英文两种语言的计算机处理技术,重点讨论了新的具有语义特征的过滤算法,提高了过滤的覆盖率和精确性,并通过实验测试了其性能。
关键词 自然语言处理 web 内容过滤 计算机
下载PDF
基于文本密度模型的Web正文抽取 被引量:13
9
作者 朱泽德 李淼 +2 位作者 张健 陈雷 曾新华 《模式识别与人工智能》 EI CSCD 北大核心 2013年第7期667-672,共6页
为从大量无关信息中获取有用内容,正文抽取成为Web数据应用不可或缺的组成部分.文中提出一种基于文本密度模型的新闻网页正文抽取方法.主要通过融合网页结构和语言特征的统计模型,将网页文档按文本行转化成正、负密度序列,再根据邻近行... 为从大量无关信息中获取有用内容,正文抽取成为Web数据应用不可或缺的组成部分.文中提出一种基于文本密度模型的新闻网页正文抽取方法.主要通过融合网页结构和语言特征的统计模型,将网页文档按文本行转化成正、负密度序列,再根据邻近行的内容连续性,利用高斯平滑技术修正文本密度序列,最后采用改进的最大子序列分割序列抽取正文内容.该方法保持正文完整性并排除噪声干扰,且无需人工干预或反复训练.实验结果表明基于文本密度抽取正文对不同数据源具有广泛的适应性,且准确率和召回率优于现有统计模型. 展开更多
关键词 web挖掘 正文抽取 文本密度 高斯平滑 最大子序列
下载PDF
集成Web使用挖掘和内容挖掘的用户浏览兴趣迁移挖掘算法 被引量:5
10
作者 邢东山 沈钧毅 宋擒豹 《小型微型计算机系统》 CSCD 北大核心 2004年第7期1170-1173,共4页
提出了一种集成 Web使用挖掘和内容挖掘的用户浏览兴趣迁移模式的模型和算法 .介绍了 Web页面及其聚类 .通过替代用户事务中的页面为相应聚类的方法得到用户浏览兴趣序列 .从用户浏览兴趣序列中得到用户浏览兴趣迁移模式 .该模型对于网... 提出了一种集成 Web使用挖掘和内容挖掘的用户浏览兴趣迁移模式的模型和算法 .介绍了 Web页面及其聚类 .通过替代用户事务中的页面为相应聚类的方法得到用户浏览兴趣序列 .从用户浏览兴趣序列中得到用户浏览兴趣迁移模式 .该模型对于网络管理者理解用户的行为特征和安排 Web站点结构有较大的意义 . 展开更多
关键词 浏览兴趣 迁移模式 web内容挖掘 web使用挖掘 电子商务
下载PDF
结合使用挖掘和内容挖掘的web推荐服务 被引量:10
11
作者 戴东波 印鉴 《计算机工程与应用》 CSCD 北大核心 2005年第18期162-165,共4页
随着Internet的基础结构不断扩大和其所含信息的持续增长,Internet用户越来越感觉容易在WWW服务中“资源迷向”。提高用户访问效率的方法有页面预取技术,站点动态重构技术和web个性化推荐技术等。现有的大多数web个性化推荐技术主要是... 随着Internet的基础结构不断扩大和其所含信息的持续增长,Internet用户越来越感觉容易在WWW服务中“资源迷向”。提高用户访问效率的方法有页面预取技术,站点动态重构技术和web个性化推荐技术等。现有的大多数web个性化推荐技术主要是基于用户使用记录的数据挖掘方法,没有或很少考虑结合页面内容—这才是用户真正感兴趣的。该文提出一种结合用户使用挖掘和内容挖掘的web推荐服务,该推荐服务根据频繁最大前向访问路径,提出含有导航页和内容页的频繁访问路径图概念,根据滑动窗口内的最近用户访问页面内容和候选推荐集中页面内容相关性,来向用户提供个性化推荐服务。经推荐质量分析,这种方法具有较好的推荐优化能力。 展开更多
关键词 web个性推荐 web使用挖掘 web内容挖掘
下载PDF
基于网页上下文的Deep Web数据库分类 被引量:31
12
作者 马军 宋玲 +1 位作者 韩晓晖 闫泼 《软件学报》 EI CSCD 北大核心 2008年第2期267-274,共8页
讨论了提高Deep Web数据库分类准确性的若干新技术,其中包括利用HTML网页的内容文本作为理解数据库内容的上下文和把数据库表的属性标记词归一的过程.其中对网页中的内容文本的发现算法是基于对网页文本块的多种统计特征.而对数据库属... 讨论了提高Deep Web数据库分类准确性的若干新技术,其中包括利用HTML网页的内容文本作为理解数据库内容的上下文和把数据库表的属性标记词归一的过程.其中对网页中的内容文本的发现算法是基于对网页文本块的多种统计特征.而对数据库属性标记词的归一过程是把同义标记词用代表词进行替代的过程.给出了采用分层模糊集合对给定学习实例所发现的领域和语言知识进行表示和基于这些知识对标记词归一化算法.基于上述预处理,给出了计算Deep Web数据库的K-NN(k nearest neighbors)分类算法,其中对数据库之间语义距离计算综合了数据库表之间和含有数据库表的网页的内容文本之间的语义距离.分类实验给出算法对未预处理的网页和经过预处理后的网页在数据库分类精度、查全率和综合F1等测度上的分类结果比较. 展开更多
关键词 DEEP web 隐式web 数据库分类 内容文本抽取 语义分类
下载PDF
Web挖掘的体系研究 被引量:7
13
作者 李亚飞 刘业政 《合肥工业大学学报(自然科学版)》 CAS CSCD 2004年第3期305-309,共5页
互联网的出现极大地丰富了人们的信息,但也困扰人们从中获取有用的知识。Web挖掘的应用为解决此问题指明了方向。该文从Web内容挖掘、Web结构挖掘和使用记录挖掘3个方面论述了Web挖掘的内容及相关技术的研究现状和发展方向。Web内容挖... 互联网的出现极大地丰富了人们的信息,但也困扰人们从中获取有用的知识。Web挖掘的应用为解决此问题指明了方向。该文从Web内容挖掘、Web结构挖掘和使用记录挖掘3个方面论述了Web挖掘的内容及相关技术的研究现状和发展方向。Web内容挖掘包括信息提取和信息检索,Web信息提取的主要过程包括向量表示、特征提取、特征缩减和文本挖掘;对于信息检索,文章从搜索引擎的原理、分类以及最新的发展技术方面对其进行了论述;而对于结构挖掘和使用记录挖掘,文章主要论述了其算法和过程。 展开更多
关键词 web内容挖掘 web结构挖掘 web使用记录挖掘
下载PDF
一种基于XML的Web地震信息提取的实现 被引量:3
14
作者 盖磊 王海军 刘俊民 《计算机应用与软件》 CSCD 北大核心 2007年第8期103-105,共3页
开发一种通用化的处理程序,它可以自动从指定的Web页面中提取地震事件公报,采用XSLT将数据转换为指定格式的XML文档,存入地震信息数据库,实现了Web数据的清理与集成。
关键词 web内容挖掘 地震事件公报 XML XSLT
下载PDF
基于服务质量的Web内容变换方法研究 被引量:3
15
作者 黄敏 张小真 葛静 《西南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第2期249-253,共5页
结合网络和Web服务器提出了一种基于服务质量的Web内容变换方法: 针对网络资源与Web资源负载不均衡问题建立一个基于服务质量的Web内容调整组件, 通过监测用户网络状况, 利用Web调整网络传输内容, 实现端到端的服务质量保证. 并在网络... 结合网络和Web服务器提出了一种基于服务质量的Web内容变换方法: 针对网络资源与Web资源负载不均衡问题建立一个基于服务质量的Web内容调整组件, 通过监测用户网络状况, 利用Web调整网络传输内容, 实现端到端的服务质量保证. 并在网络教学中进行该方法的实际应用, 验证了其可行性和实用性. 展开更多
关键词 web服务 服务质量 web内容变换
下载PDF
基于信息过滤后的Web内容挖掘 被引量:6
16
作者 谭汉松 李红 《计算机工程与应用》 CSCD 北大核心 2003年第30期186-187,共2页
Internet的迅速发展,使得worldwideweb已经成为一个巨大的、蕴含着具有潜在价值知识的分布式信息空间,为Web挖掘研究提供了丰富的资源的同时也提出了新的挑战。该文首先论述了Web内容挖掘技术的挖掘原理和所面对的困难,然后介绍了信息... Internet的迅速发展,使得worldwideweb已经成为一个巨大的、蕴含着具有潜在价值知识的分布式信息空间,为Web挖掘研究提供了丰富的资源的同时也提出了新的挑战。该文首先论述了Web内容挖掘技术的挖掘原理和所面对的困难,然后介绍了信息过滤技术的规则以及过程。最后提出了基于信息过滤的Web内容挖掘的系统方案,较好地解决了当前Web内容挖掘中准确度不高、冗余性大的缺陷。 展开更多
关键词 信息过滤 web内容挖掘
下载PDF
Web内容挖掘在数字图书馆中的应用 被引量:9
17
作者 黎琳 赵英 《图书馆学研究》 2006年第2期19-21,24,共4页
Web信息是数字图书馆数字资源的重要来源,文章详细阐述了对Web内容中的文本信息的挖掘,包括文本自动、文本分类和文本聚类。在挖掘过程中基于用户需求和用户特征,针对文本分类,重点分析了分类过程和在数字图书馆中的应用;针对文本聚类,... Web信息是数字图书馆数字资源的重要来源,文章详细阐述了对Web内容中的文本信息的挖掘,包括文本自动、文本分类和文本聚类。在挖掘过程中基于用户需求和用户特征,针对文本分类,重点分析了分类过程和在数字图书馆中的应用;针对文本聚类,介绍两种基本聚类原理以及与文本分类的不同之处,重点论述其在数字图书馆中如何应用。最后提出内容挖掘与用户挖掘的结合更有助于服务用户。 展开更多
关键词 web 内容挖掘 数字图书馆
下载PDF
基于N-gram的Web用户浏览模式分类算法研究 被引量:2
18
作者 朱志国 邓贵仕 孔立平 《情报学报》 CSSCI 北大核心 2009年第3期389-394,共6页
Web站点用户浏览模式自动分类可以更好地组织站点上的内容信息来满足不同用户的访问需求。Web使用挖掘技术已经在这项研究中得到了广泛的应用,但是集成Web内容挖掘的成果还不多见。本文首先给出了结合Web内容和使用挖掘技术的用户浏览... Web站点用户浏览模式自动分类可以更好地组织站点上的内容信息来满足不同用户的访问需求。Web使用挖掘技术已经在这项研究中得到了广泛的应用,但是集成Web内容挖掘的成果还不多见。本文首先给出了结合Web内容和使用挖掘技术的用户浏览模式分类的原型系统框架。系统中主要的过程是:对数据集中原始的Web服务器日志进行清理,使用Web使用挖掘技术从用户浏览会话中挖掘出有代表性的用户浏览模式,根据模式中每一个相关的页面内容抽取出一个N-gram集合,构建基于N-gram的用户浏览模式简档。最后本文对用户浏览会话作了分类实验分析,实验结果表明这个方法在N-gram=6,df=10%的情况下取得了较高的分类精确度。 展开更多
关键词 N-gram方法 web内容抽取 用户浏览模式 分类算法
下载PDF
面向电子商务的Web挖掘技术及其应用研究 被引量:3
19
作者 董德民 何钦铭 《计算机工程与设计》 CSCD 北大核心 2006年第1期95-98,共4页
电子商务过程中企业和组织面临一系列网络信息的获取问题,对解决这些问题的Web内容挖掘、Web结构挖掘、Web使用挖掘技术进行了综述,并介绍了Web挖掘技术在智能搜索引擎、企业危机管理、客户关系管理及个性化服务系统中的应用。
关键词 电子商务 web内容挖掘 web结构挖掘 web使用挖掘
下载PDF
一种基于Web用户访问模式的矩阵聚类算法研究 被引量:2
20
作者 包剑 郭丽春 黄金波 《西华大学学报(自然科学版)》 CAS 2010年第4期85-87,共3页
针对用户访问Web资源时难以获取感兴趣信息的状况,通过分析用户需求,采用优化的矩阵聚类算法,对用户群和页面进行聚类,以理解用户的行为,发现用户的访问模式,从而改善Web服务质量。实验结果表明该方法是可行的,能够更准确的反映网站的... 针对用户访问Web资源时难以获取感兴趣信息的状况,通过分析用户需求,采用优化的矩阵聚类算法,对用户群和页面进行聚类,以理解用户的行为,发现用户的访问模式,从而改善Web服务质量。实验结果表明该方法是可行的,能够更准确的反映网站的访问情况;根据发现用户访问的Web页面的浏览模式,进一步分析和研究Web日志记录中的规律,从而改进Web站点的性能和组织结构,以便Web站点能实现个性化服务。 展开更多
关键词 web挖掘 用户访问模式 web内容挖掘 矩阵聚类
下载PDF
上一页 1 2 22 下一页 到第
使用帮助 返回顶部