期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
论思维及模拟智能 被引量:14
1
作者 尹红风 戴汝为 《计算机研究与发展》 EI CSCD 北大核心 1990年第4期1-15,共15页
本文以思维科学体系为基础和出发点,首先对人脑中信息存储的方式作了分析与设想。把人脑中的信息存储分为三类,感觉表象、形象源和语言,并在模拟智能中找出各自对应的信息存储,对这些信息的不同处理方式则对应于不同的思维方式,从而建... 本文以思维科学体系为基础和出发点,首先对人脑中信息存储的方式作了分析与设想。把人脑中的信息存储分为三类,感觉表象、形象源和语言,并在模拟智能中找出各自对应的信息存储,对这些信息的不同处理方式则对应于不同的思维方式,从而建立一种宏观思维模型。这使我们可以从整体,从宏观的角度来把握、分析思维的现象和本质。用思维科学的观点与思维模型对数学的一些基础问题进行探讨,从而可以进一步认识到单纯的逻辑思维及逻辑方法的局限性所在。还用这种思想对模拟智能的发展及在发展中所遇到的问题作了分析,对今后模拟智能的发展方向作了一些展望。 展开更多
关键词 思维 模拟智能 人工智能
下载PDF
一种联想记忆模型及附加节点方法 被引量:6
2
作者 尹红风 戴汝为 《计算机学报》 EI CSCD 北大核心 1990年第5期331-339,共9页
本文提出一种新的联想记忆模型,这种模型可根据Perceptron算法进行学习。它是一种非对称的、互连的人工神经元网络。从理论上证明了在一定条件下这种网络能记忆样本的最少个数,能够使得所要记忆的样本都能成为神经元网络动力学系统的稳... 本文提出一种新的联想记忆模型,这种模型可根据Perceptron算法进行学习。它是一种非对称的、互连的人工神经元网络。从理论上证明了在一定条件下这种网络能记忆样本的最少个数,能够使得所要记忆的样本都能成为神经元网络动力学系统的稳定吸引子。从心理学角度看,它与人记忆采些信息的方法很相近。为了能够使网络运行时可逃离非样本吸引子,回到样本吸引子,我们又提出了一种加深联想记忆的学习及相应的运行算法。为了使任意多个样本能够存储在一个网络里,我们提出一种附加节点方法,附加节点对应于模式的一种概念,这种方法也解决了模式分类中的线性不可分问题。最后给出了计算机模拟结果。 展开更多
关键词 联想记忆模型 附加节点法 神经网络
下载PDF
思维与智慧科学及工程 被引量:1
3
作者 尹红风 戴汝为 《上海理工大学学报》 CAS 北大核心 2011年第1期18-23,共6页
讨论了钱学森的思维科学、开放复杂巨系统和大成智慧的理论,互联网和云计算的发展,可用这些研究和理论建立类似人的世界知识库,用于语义搜索引擎.
关键词 思维科学 开放复杂巨系统 大成智慧 语义搜索引擎
下载PDF
面向中文网络百科的属性和属性值抽取 被引量:12
4
作者 贾真 杨宇飞 +2 位作者 何大可 刘胜久 尹红风 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期41-47,共7页
针对面向中文网络百科条目文章的属性和属性值抽取,提出一种无监督方法。此方法将属性值看做命名实体,利用频繁模式挖掘和关联分析,从文本中抽取类别属性;采用自扩展方法为属性建立触发词表;基于属性触发词和属性值实体标注挖掘属性值... 针对面向中文网络百科条目文章的属性和属性值抽取,提出一种无监督方法。此方法将属性值看做命名实体,利用频繁模式挖掘和关联分析,从文本中抽取类别属性;采用自扩展方法为属性建立触发词表;基于属性触发词和属性值实体标注挖掘属性值抽取模式,利用层次聚类算法获取高质量的模式。在互动百科中采集的数据集上进行实验,结果表明所提方法行之有效。 展开更多
关键词 知识获取 属性抽取 非结构化文本 模式挖掘
下载PDF
一种基于词频统计的组织机构名识别方法 被引量:14
5
作者 胡万亭 杨燕 +2 位作者 尹红风 贾真 刘利 《计算机应用研究》 CSCD 北大核心 2013年第7期2014-2016,共3页
命名实体识别是自然语言处理必不可少的重要部分,其中组织机构名识别占了很大的比例。提出了基于词频统计的组织机构名识别方法。训练数据主要通过百度百科词条整理得到。训练时,利用百度百科词条名在词条文本中的频数统计进行机构构成... 命名实体识别是自然语言处理必不可少的重要部分,其中组织机构名识别占了很大的比例。提出了基于词频统计的组织机构名识别方法。训练数据主要通过百度百科词条整理得到。训练时,利用百度百科词条名在词条文本中的频数统计进行机构构成词的词频统计。在此基础上,构建了数学模型,实现了组织机构名识别算法。该识别算法集成到了中文分词中,取得了较好的识别结果,可以满足一定的实际应用需求。 展开更多
关键词 统计 词频 机构名构成词 组织机构名识别
下载PDF
基于弱监督的属性关系抽取方法 被引量:10
6
作者 杨宇飞 戴齐 +1 位作者 贾真 尹红风 《计算机应用》 CSCD 北大核心 2014年第1期64-68,共5页
针对从中文百科中抽取属性关系时所面临的训练语料匮乏问题,提出一种利用极少人工参与的弱监督自动抽取方法。首先,利用中文百科条目信息模板中的半结构化属性关系回标条目文本自动获取训练语料;然后,根据朴素贝叶斯分类原理优化训练语... 针对从中文百科中抽取属性关系时所面临的训练语料匮乏问题,提出一种利用极少人工参与的弱监督自动抽取方法。首先,利用中文百科条目信息模板中的半结构化属性关系回标条目文本自动获取训练语料;然后,根据朴素贝叶斯分类原理优化训练语料;最后,基于条件随机场(CRF)建立属性关系抽取模型。在互动百科中采集的数据集上进行实验,综合评价F值达到了80.9%。结果表明该方法能够获得质量较高的训练语料,并取得良好的抽取性能。 展开更多
关键词 关系抽取 弱监督 中文百科 朴素贝叶斯分类 条件随机场
下载PDF
一种改进的基于树路径匹配的网页结构相似度算法 被引量:7
7
作者 廖浩伟 杨燕 +1 位作者 贾真 尹红风 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2012年第6期1199-1203,共5页
提出一种改进的基于树路径匹配的网页结构相似度算法,该算法定义了树路径的序列相似度和位置相似度,找出网页的树路径集合,通过网页间的最佳树路径匹配计算结构相似度.实验结果表明,用改进后的算法计算网页结构相似度比传统树路径匹配... 提出一种改进的基于树路径匹配的网页结构相似度算法,该算法定义了树路径的序列相似度和位置相似度,找出网页的树路径集合,通过网页间的最佳树路径匹配计算结构相似度.实验结果表明,用改进后的算法计算网页结构相似度比传统树路径匹配方法更符合实际,更合理有效. 展开更多
关键词 网页结构相似度 序列相似度 位置相似度
下载PDF
基于多特征融合的网页正文信息抽取 被引量:4
8
作者 刘利 戴齐 +2 位作者 尹红风 贾真 胡万亭 《计算机应用与软件》 CSCD 北大核心 2014年第7期47-49,77,共4页
当今主流网页分为单正文体网页和多正文体网页。这些网页的正文信息都具有多个正文特征。想要准确定位正文信息所在位置,可以从其所具有的多个特征和网页设计者的设计习惯着手。鉴于此,融合这些特征提出一种基于多特征融合的网页正文信... 当今主流网页分为单正文体网页和多正文体网页。这些网页的正文信息都具有多个正文特征。想要准确定位正文信息所在位置,可以从其所具有的多个特征和网页设计者的设计习惯着手。鉴于此,融合这些特征提出一种基于多特征融合的网页正文信息抽取方法。实验结果表明,该方法对单正文体网页和多正文体网页的正文抽取具有较高的准确率和通用性,很好地适应了风格多样的网页。 展开更多
关键词 单正文体 多正文体 多特征 信息抽取
下载PDF
元搜索引擎排序方法建模与算法研究 被引量:4
9
作者 刘胜久 李天瑞 +1 位作者 贾真 尹红风 《计算机科学》 CSCD 北大核心 2012年第S3期197-199,共3页
元搜索引擎的核心技术是排序算法。在研究元搜索引擎排序算法的基础上,通过合理简化等一系列措施建立数学模型,抽象出元搜索引擎排序算法的基本框架。随后结合各成员搜索引擎的市场份额及各成员搜索引擎的搜索结果,给出了一种新的元搜... 元搜索引擎的核心技术是排序算法。在研究元搜索引擎排序算法的基础上,通过合理简化等一系列措施建立数学模型,抽象出元搜索引擎排序算法的基本框架。随后结合各成员搜索引擎的市场份额及各成员搜索引擎的搜索结果,给出了一种新的元搜素引擎排序算法。该算法简单且易于实现。 展开更多
关键词 搜索引擎 元搜索引擎 排序
下载PDF
中文网络百科开放分类层次结构树及其聚类算法研究 被引量:2
10
作者 贾真 尹红风 李天瑞 《计算机应用研究》 CSCD 北大核心 2013年第6期1660-1663,1674,共5页
为利用开放分类进行百科条目的分类和检索,提出了基于词共现和语义分析的开放分类聚类算法以及开放分类层次结构树构建方法;为了进一步提高层次结构树的聚合度,提出了基于相似度和相关度计算的层次结构树聚类算法。以互动百科开放分类... 为利用开放分类进行百科条目的分类和检索,提出了基于词共现和语义分析的开放分类聚类算法以及开放分类层次结构树构建方法;为了进一步提高层次结构树的聚合度,提出了基于相似度和相关度计算的层次结构树聚类算法。以互动百科开放分类为实验数据集,实验结果表明,所构建的开放分类层次结构树的准确率较高,利用开放分类层次结构树有效提高了百科条目检索的效率。 展开更多
关键词 开放分类 聚类 共现 语义分析 层次结构树
下载PDF
基于规则的汉语兼类词标注方法 被引量:2
11
作者 李华栋 贾真 +1 位作者 尹红风 杨燕 《计算机应用》 CSCD 北大核心 2014年第8期2197-2201,共5页
针对目前汉语兼类词标注的准确率不高的问题,提出了规则与统计模型相结合的兼类词标注方法。首先,利用隐马尔可夫、最大熵和条件随机场3种统计模型进行兼类词标注;然后,将改进的互信息算法应用到词性(POS)标注规则的获取上,通过计算目... 针对目前汉语兼类词标注的准确率不高的问题,提出了规则与统计模型相结合的兼类词标注方法。首先,利用隐马尔可夫、最大熵和条件随机场3种统计模型进行兼类词标注;然后,将改进的互信息算法应用到词性(POS)标注规则的获取上,通过计算目标词前后词单元与目标词的相关性获得词性标注规则;最后,将获取的规则与基于统计模型的词性标注算法结合起来进行兼类词标注。实验结果表明加入规则算法之后,平均词性标注准确率提升了5%左右。 展开更多
关键词 词性标注 互信息 汉语兼类词 规则 中文信息处理
下载PDF
基于规则的百科人物属性抽取 被引量:3
12
作者 李红亮 杨燕 +1 位作者 尹红风 贾真 《集成技术》 2013年第3期1-4,共4页
信息抽取是数据挖掘的一个重要领域,文本信息抽取是指从一段自由文本中抽取出指定的信息并将其结构化数据存入知识库供用户查询或下一步处理所用。人物属性信息抽取是智能人物类搜索引擎构建的重要基础,同时结构化信息也是计算机所能理... 信息抽取是数据挖掘的一个重要领域,文本信息抽取是指从一段自由文本中抽取出指定的信息并将其结构化数据存入知识库供用户查询或下一步处理所用。人物属性信息抽取是智能人物类搜索引擎构建的重要基础,同时结构化信息也是计算机所能理解的一种数据格式。作者提出了一种自动获取百科人物属性的方法,该方法利用各属性值的词性信息来定位到百科自由文本中,通过统计的方法发现规则,再根据规则匹配从百科文本中获取人物属性信息。实验表明该方法从百科文本中抽取人物属性信息是有效的。抽取的结果可以用来构建人物属性知识库。 展开更多
关键词 人物属性抽取 规则获取 自由文本
下载PDF
信息检索中一种句子相似度的计算方法
13
作者 刘云芳 杨燕 +2 位作者 贾真 尹红风 杨宇飞 《应用科技》 CAS 2014年第4期41-46,共6页
为提高信息检索中检索结果的查准率,提出了基于句法分析以及带权路径长度的句子相似度计算方法。该方法首先对用户问句进行了分词、词性标注以及句法分析处理,并根据处理后的结果对该句进行了关键词提取、加权和同义词近义词扩展处理。... 为提高信息检索中检索结果的查准率,提出了基于句法分析以及带权路径长度的句子相似度计算方法。该方法首先对用户问句进行了分词、词性标注以及句法分析处理,并根据处理后的结果对该句进行了关键词提取、加权和同义词近义词扩展处理。然后提出了基于带权路径长度计算的方法,并用该方法计算用户问句与检索信息标题句之间的相似度,即问句的带权路径长度与标题句的带权路径长度的相对比值,以此对检索结果进行二次排序,提高检索结果查准率。实验表明,该句子相似度方法能有效地提高信息检索中检索结果的查准率。 展开更多
关键词 信息检索 相似度 词性标注 句法分析 带权路径长度 二次排序 查准率
下载PDF
基于语义扩展的短问题分类 被引量:16
14
作者 冶忠林 杨燕 +1 位作者 贾真 尹红风 《计算机应用》 CSCD 北大核心 2015年第3期792-796,共5页
问题分类是问答系统任务之一。特别是语音交互方式中,用户的提问较短,具有口语化特征,利用传统文本分类方法对问题进行分类的效果不佳。为此提出一种基于语义扩展的短问题分类方法,该方法使用搜索引擎对问题进行知识扩展;然后,使用主题... 问题分类是问答系统任务之一。特别是语音交互方式中,用户的提问较短,具有口语化特征,利用传统文本分类方法对问题进行分类的效果不佳。为此提出一种基于语义扩展的短问题分类方法,该方法使用搜索引擎对问题进行知识扩展;然后,使用主题模型进行特征词选择;最后,利用词语相似度计算获取问题的类别。实验结果表明,所提方法在1 365条真实问题集上平均F-measure值达到0.713,其值高于支持向量机(SVM)、K近邻(KNN)算法和最大熵方法。因此,该方法在问答系统中可以帮助系统提升问题分类的准确率。 展开更多
关键词 主题模型 问题分类 搜索引擎 问答系统
下载PDF
基于无监督学习的部分-整体关系获取 被引量:9
15
作者 贾真 何大可 +1 位作者 尹红风 李天瑞 《西南交通大学学报》 EI CSCD 北大核心 2014年第4期590-596,共7页
针对面向中文自由文本的部分-整体关系抽取问题,提出一种基于无监督学习的方法.首先提出子模式提取算法,从领域文本集中获取概念对和概念对所在上下文模式,利用概念对和概念对上下文模式建立分布式语义模型;然后采用协同聚类算法将具有... 针对面向中文自由文本的部分-整体关系抽取问题,提出一种基于无监督学习的方法.首先提出子模式提取算法,从领域文本集中获取概念对和概念对所在上下文模式,利用概念对和概念对上下文模式建立分布式语义模型;然后采用协同聚类算法将具有相同语义关系的概念对聚合成簇,通过训练L1正则化逻辑回归模型提取簇的特征并得到代表每个簇语义关系的概念对上下文模式;最后根据模式识别表达部分-整体关系的簇,从而获取部分-整体关系概念对.实验结果表明,该方法取得较好的性能,F度量达到68.97%,优于传统聚类方法(55.77%)和模式匹配方法(61.95%). 展开更多
关键词 本体 无监督学习 部分-整体关系 分布式语义模型 协同聚类
下载PDF
多领域自然语言问句理解研究 被引量:6
16
作者 冶忠林 贾真 尹红风 《计算机科学》 CSCD 北大核心 2017年第6期216-221,254,共7页
问句理解是问答系统的主要任务之一。现有的问句理解方法大多是针对简单句的,且侧重于某种句式结构的理解。提出一种多领域问句理解研究方法,其涉及领域包括人物类、电影类、音乐类、图书类、游戏类、应用类。首先基于CRF算法对问句进... 问句理解是问答系统的主要任务之一。现有的问句理解方法大多是针对简单句的,且侧重于某种句式结构的理解。提出一种多领域问句理解研究方法,其涉及领域包括人物类、电影类、音乐类、图书类、游戏类、应用类。首先基于CRF算法对问句进行分类和主体识别,然后使用谓词词典和句法分析识别出问句的谓词,最后提出一种谓词消歧方法来解决相同问句具有不同表达方式的问题。实验结果表明,在封闭测试中,所提方法的问句分类和主体识别的平均F-measure值分别为93.88%和92.44%,谓词识别和问句理解的平均准确率分别为91.03%和81.78%。因此,所做的工作基本能满足问句理解的需求。 展开更多
关键词 问答系统 问句理解 谓词消歧 问句分类 主体识别
下载PDF
基于Tri-training与噪声过滤的弱监督关系抽取 被引量:2
17
作者 贾真 冶忠林 +1 位作者 尹红风 何大可 《中文信息学报》 CSCD 北大核心 2016年第4期142-149,158,共9页
弱监督关系抽取利用已有关系实体对从文本集中自动获取训练数据,有效解决了训练数据不足的问题。针对弱监督训练数据存在噪声、特征不足和不平衡,导致关系抽取性能不高的问题,文中提出NF-Tri-training(Tritraining with Noise Filtering... 弱监督关系抽取利用已有关系实体对从文本集中自动获取训练数据,有效解决了训练数据不足的问题。针对弱监督训练数据存在噪声、特征不足和不平衡,导致关系抽取性能不高的问题,文中提出NF-Tri-training(Tritraining with Noise Filtering)弱监督关系抽取算法。它利用欠采样解决样本不平衡问题,基于Tri-training从未标注数据中迭代学习新的样本,提高分类器的泛化能力,采用数据编辑技术识别并移除初始训练数据和每次迭代产生的错标样本。在互动百科采集数据集上实验结果表明NF-Tri-training算法能够有效提升关系分类器的性能。 展开更多
关键词 关系抽取 弱监督学习 TRI-TRAINING 数据编辑
下载PDF
神经元网络专家系统
18
作者 尹红风 田禾 《自动化博览》 1989年第2期18-19,共2页
关键词 专家系统 神经元网络 人工智能
下载PDF
神经元网络专家系统
19
作者 尹红风 田禾 《自动化博览》 1989年第1期15-16,共2页
关键词 神经元网络 专家系统 人工智能
下载PDF
基于SimRank的百度百科词条语义相似度计算 被引量:9
20
作者 尹坤 尹红风 +1 位作者 杨燕 贾真 《山东大学学报(工学版)》 CAS 北大核心 2014年第3期29-35,共7页
提出一种利用百度百科半结构化数据自动获取词语相似度的方法,该方法将百科词条与其相关词条看做有向图的两个节点,且两节点相互之间存在着链接关系,然后利用SimRank算法计算百科词条语义相似度。实验表明,该方法优于传统的词语语义相... 提出一种利用百度百科半结构化数据自动获取词语相似度的方法,该方法将百科词条与其相关词条看做有向图的两个节点,且两节点相互之间存在着链接关系,然后利用SimRank算法计算百科词条语义相似度。实验表明,该方法优于传统的词语语义相似度测量,能准确地反映词语之间的语义关系。 展开更多
关键词 语义相似度 百科词条 有向图 SIMRANK
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部