针对真实环境下的语种识别,信道类型和通话内容等非语种方面因素的不同都会造成测试和训练条件的不匹配,从而影响系统的识别性能.本文以音素识别器后接向量空间模型(Phone recognizer followed by vectorspace model,PRVSM)为语种识别系...针对真实环境下的语种识别,信道类型和通话内容等非语种方面因素的不同都会造成测试和训练条件的不匹配,从而影响系统的识别性能.本文以音素识别器后接向量空间模型(Phone recognizer followed by vectorspace model,PRVSM)为语种识别系统,引入联合自适应算法来解决系统中测试和训练条件的失配问题.研究了三种自适应方法用于系统的不同阶段:1)基于受约束的最大似然线性回归(Constr ained maximum likelihood linear regression,CMLLR)的声学模型自适应;2)基于全局N元文法的音位特征向量自适应;3)VSM模型中的支持向量机(Support vector machines,SVM)自适应.在综合采用多种自适应技术后,PRVSM系统的性能有了较大的提高,在NIST LRE 2009测试库上对于30s、10s和3s的测试段,基于不同音素识别器的PRVSM系统的等错误率(Equal errorrate,EER)分别相对降低了18%~23%、12%~20%以及5%~9%.展开更多
本研究以“seem to V”和“appear to V”这两个近义链接动词构式为例,借助COCA、COHA语料库及R软件,通过基于类符的语义向量空间模型、聚类分析和对应分析三种可视化手段,对二者在美式英语中的语义变化情况进行定量研究。结果表明:这...本研究以“seem to V”和“appear to V”这两个近义链接动词构式为例,借助COCA、COHA语料库及R软件,通过基于类符的语义向量空间模型、聚类分析和对应分析三种可视化手段,对二者在美式英语中的语义变化情况进行定量研究。结果表明:这两个构式中搭配词的语义倾向在1900年后均呈现出明显的变化,从而使节点词具有明确的语义分工——seem to多与“认知–施事类”动词连用,表示语言使用者对客观发生事件的主观情感态度,而appear to则主要表现为写实的用法,用于描述可直接感知的物质世界中发生的事件或是客观实体的性质和状态,并逐渐倾向于与静态动词连用。展开更多
文摘针对真实环境下的语种识别,信道类型和通话内容等非语种方面因素的不同都会造成测试和训练条件的不匹配,从而影响系统的识别性能.本文以音素识别器后接向量空间模型(Phone recognizer followed by vectorspace model,PRVSM)为语种识别系统,引入联合自适应算法来解决系统中测试和训练条件的失配问题.研究了三种自适应方法用于系统的不同阶段:1)基于受约束的最大似然线性回归(Constr ained maximum likelihood linear regression,CMLLR)的声学模型自适应;2)基于全局N元文法的音位特征向量自适应;3)VSM模型中的支持向量机(Support vector machines,SVM)自适应.在综合采用多种自适应技术后,PRVSM系统的性能有了较大的提高,在NIST LRE 2009测试库上对于30s、10s和3s的测试段,基于不同音素识别器的PRVSM系统的等错误率(Equal errorrate,EER)分别相对降低了18%~23%、12%~20%以及5%~9%.
文摘HITS算法是影响相当广泛的链接分析算法。但是,深入的研究表明,它很容易产生主题漂移。而HITS算法产生主题漂移的很大一部分原因在于页面被投影到错误的潜在语义基上。提出一种基于权值调整的超链主题提取算法(weightedadjustments based hyperlinks topic distillation),先在获得根集的过程中,用改进的权值进行相似度计算,得到相对更为准确的个性化根集,再利用HITS算法计算Web页面的权威值和中心值。实验结果表明,基于权值调整的超链主题提取算法可以很好地改善HITS算法所导致的主题漂移问题,更适合于Web查询的需要。
文摘本研究以“seem to V”和“appear to V”这两个近义链接动词构式为例,借助COCA、COHA语料库及R软件,通过基于类符的语义向量空间模型、聚类分析和对应分析三种可视化手段,对二者在美式英语中的语义变化情况进行定量研究。结果表明:这两个构式中搭配词的语义倾向在1900年后均呈现出明显的变化,从而使节点词具有明确的语义分工——seem to多与“认知–施事类”动词连用,表示语言使用者对客观发生事件的主观情感态度,而appear to则主要表现为写实的用法,用于描述可直接感知的物质世界中发生的事件或是客观实体的性质和状态,并逐渐倾向于与静态动词连用。