期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
利用上下文提高文本聚类的效果 被引量:9
1
作者 丘志宏 宫雷光 《中文信息学报》 CSCD 北大核心 2007年第6期109-115,共7页
传统文本聚类的向量空间模型中,认为词的权重只和词频有关,而与词语出现的上下文无关。本文介绍了如何借助按词语之间关系组织的本体论词典对文章进行上下文分析,得到文章中词语之间意义上的相互关系,进而用相关词语的词频以及关系的权... 传统文本聚类的向量空间模型中,认为词的权重只和词频有关,而与词语出现的上下文无关。本文介绍了如何借助按词语之间关系组织的本体论词典对文章进行上下文分析,得到文章中词语之间意义上的相互关系,进而用相关词语的词频以及关系的权重量化地给出一个词语受到上下文的支持程度,所以在衡量词语权重时不仅考虑其词频,而且考虑上下文的支持情况。文章还介绍了如何用自动构建的方法得到本文所需的词典,使得在本体论词典资源还不太丰富的汉语中也能应用上面的方法。实验数据表明,本文的方法能有效的消除噪音,提高文本聚类的效果。 展开更多
关键词 计算机应用 中文信息处理 文本聚类 上下文 词语权重 本体论词典
下载PDF
服务合成的性能预测(英文)
2
作者 谈华芳 Ratakonda KrishnaC. +1 位作者 朱俊 苏辉 《计算机系统应用》 2009年第6期57-63,共7页
One benefit of SOA is from service composition which combines existing services to form a new valued-added service in the form of business process.This also creates the need to ensure that the performance of those com... One benefit of SOA is from service composition which combines existing services to form a new valued-added service in the form of business process.This also creates the need to ensure that the performance of those composite services meets the business requirements.This paper proposes a method for evaluating the performance of composite services.We automatically transform a composite service modeled by BPEL,into a performance model based on Layered Queuing Networks(LQN)and then leverage existing LQN solvers to predict their performance.The inputs to our transformation algorithm are an XML file which contains a service composition model complying with the BPEL4WS specification,a related performance profile and a service topology.The output of the model is the corresponding LQN model which can be directly analyzed using existing LQN solvers. 展开更多
关键词 服务合成 性能预测 LQN XML 软件
下载PDF
IBM GALE中文识别系统
3
作者 张世磊 施勤 +4 位作者 秦勇 刘文 CHU StephenM KUO Hong-Kwang MANGU Lidia 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第S1期1249-1253,共5页
为解决中文音频自动转成文字问题,IBM开发了GALE中文识别系统。该系统采用区分性声学模型训练方法和新颖的基于主题的语言模型自适应技术;为获得最优的识别性能,系统采用多遍解码的识别策略。该文还给出该系统在3个测试集上的识别结果:... 为解决中文音频自动转成文字问题,IBM开发了GALE中文识别系统。该系统采用区分性声学模型训练方法和新颖的基于主题的语言模型自适应技术;为获得最优的识别性能,系统采用多遍解码的识别策略。该文还给出该系统在3个测试集上的识别结果:包括广播新闻和广播访谈节目,结果显示,IBM GALE中文识别系统取得了很好的识别性能;此外,该文还分析了特殊声学现象对识别结果的影响,结果显示,对识别率影响最大的3种声学现象为说话人语速过快、语音交叠和口音问题,这指示了系统下一步的改进方向。 展开更多
关键词 语音识别 区分型模型训练 语言模型自适应 多遍解码
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部