-
题名十五年来我国网络信息检索研究述评
被引量:13
- 1
-
-
作者
王知津
蒋伟伟
-
机构
北京三星通信技术研究所
南开大学国际商学院图书馆学系
-
出处
《情报科学》
CSSCI
北大核心
2004年第4期385-389,399,共6页
-
文摘
本文总结了十五年来我国学者在网络信息检索研究的检索理论、检索技术、检索工具以及检索系统等各个方面所取得的理论成果以及实践经验。
-
关键词
中国
网络信息检索
检索语言
标准化
检索模式
超文本浏览
搜索引擎
检索策略
检索工具
智能检索技术
全文检索技术
多媒体检索
超文本检索
-
Keywords
Internet Information retrieval Review
-
分类号
G354.4
[文化科学—情报学]
G250.73
[文化科学—图书馆学]
-
-
题名一种改进的支持向量机NN-SVM
被引量:71
- 2
-
-
作者
李红莲
王春花
袁保宗
-
机构
北方交通大学信息科学研究所
北京三星通信技术研究所
-
出处
《计算机学报》
EI
CSCD
北大核心
2003年第8期1015-1020,共6页
-
基金
国家自然科学重点基金 (697893 0 1)
国家"九七三"重点基础研究发展规划项目 (G19980 3 0 5 0 11)资助
-
文摘
支持向量机 (SVM )是一种较新的机器学习方法 ,它利用靠近边界的少数向量构造一个最优分类超平面 .在训练分类器时 ,SVM的着眼点在于两类的交界部分 ,那些混杂在另一类中的点往往无助于提高分类器的性能 ,反而会大大增加训练器的计算负担 ,同时它们的存在还可能造成过学习 ,使泛化能力减弱 .为了改善支持向量机的泛化能力 ,该文在其基础上提出了一种改进的SVM———NN SVM :它先对训练集进行修剪 ,根据每个样本与其最近邻类标的异同决定其取舍 ,然后再用SVM训练得到分类器 .实验表明 ,NN SVM相比SVM在分类正确率。
-
关键词
支持向量机
机器学习
训练分类器
NN-SVM
-
Keywords
support vector machines
nearest neighbor
pruning
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名针对大规模训练集的支持向量机的学习策略
被引量:53
- 3
-
-
作者
李红莲
王春花
袁保宗
朱占辉
-
机构
北京交通大学信息科学研究所
北京三星通信技术研究所
河北建设集团有限公司
-
出处
《计算机学报》
EI
CSCD
北大核心
2004年第5期715-719,共5页
-
基金
国家自然科学重点基金 (697893 0 1)
国家"九七三"重点基础研究发展规划项目基金 (G19980 3 0 5 0 11)资助
-
文摘
当训练集的规模很大特别是支持向量很多时 ,支持向量机的学习过程需要占用大量的内存 ,寻优速度非常缓慢 ,这给实际应用带来了很大的麻烦 .该文提出了一种针对大规模样本集的学习策略 :首先用一个小规模的样本集训练得到一个初始的分类器 ,然后用这个分类器对大规模训练集进行修剪 ,修剪后得到一个规模很小的约减集 ,再用这个约减集进行训练得到最终的分类器 .实验表明 ,采用这种学习策略不仅大幅降低了学习的代价 ,而且这样获得的分类器的分类精度完全可以与直接通过大规模样本集训练得到的分类器的分类精度相媲美 ,甚至更优 ,同时分类速度也得到大幅提高 .
-
关键词
支持向量机
学习策略
大规模训练集
分类器
-
Keywords
support vector machines
pruning
large training set
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名利用背景知识提高web语音浏览中的识别精度的方法
被引量:8
- 4
-
-
作者
李红莲
袁保宗
王春花
-
机构
北方交通大学信息科学研究所
北京三星通信技术研究所
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2002年第12期1836-1839,共4页
-
基金
国家自然科学重点基金(No.69789301)
国家973计划(No.G19980305011)
-
文摘
语音识别的精度不够高一直是阻碍语音技术得以广泛应用的瓶颈,在具体的应用中充分利用背景知识是解决此问题的一种有效方法.在web语音浏览中,用户的语音输入为某个有限集的元素之一,本文利用这个特点,首先定义了一种文本字符串之间的相似度,利用相似度对识别引擎的识别结果进行后处理,进而给出更准确的识别结果.实验结果表明,采用这种方法,语音识别的正确率能够达到95%以上,为真正实现语音上网提供了有力支持.
-
关键词
背景知识
web语音浏览
识别精度
相似度
语音识别
语音理解
-
Keywords
Continuous speech recognition
Image understanding
Speech
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
TN912.
[电子电信—通信与信息系统]
-