期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于情感向量空间模型的歌词情感分析 被引量:21
1
作者 夏云庆 杨莹 +1 位作者 张鹏洲 刘宇飞 《中文信息学报》 CSCD 北大核心 2010年第1期99-103,共5页
音频信号在歌曲情感分析中难以奏效,所以该文提出以歌词作为歌曲情感分析的依据,采取基于情感单元的情感向量空间模型(s-VSM)进行歌词情感分析。该模型较好地解决了基于词汇的向量空间模型(w-VSM)在文本表示效率、歧义、情感功能和数据... 音频信号在歌曲情感分析中难以奏效,所以该文提出以歌词作为歌曲情感分析的依据,采取基于情感单元的情感向量空间模型(s-VSM)进行歌词情感分析。该模型较好地解决了基于词汇的向量空间模型(w-VSM)在文本表示效率、歧义、情感功能和数据稀疏性等方面的不足。同时,该文将情感词词频与Thayer二维情感压力模型相结合,提出了"轻松"、"压抑"之外的"复杂"、"含蓄"两类新的情感压力类别。实验证明:(1)s-VSM模型在歌词情感分类中优于传统方法;(2)四类情感压力模型对歌词情感分析很有帮助。 展开更多
关键词 计算机应用 中文信息处理 文本情感分析 情感向量空间模型 情绪压力
下载PDF
中文网络聊天语言的奇异性与动态性研究 被引量:8
2
作者 夏云庆 黄锦辉 张普 《中文信息学报》 CSCD 北大核心 2007年第3期83-91,共9页
随着互联网走入社会生活,网络聊天逐渐成为一种新的沟通渠道,网络聊天语言便应运而生。这类语言的日益丰富,给语言信息处理带来了新的挑战。研究发现,困难主要来自网络聊天语言的奇异性和动态性。本文借助真实网络聊天语言文本,对网络... 随着互联网走入社会生活,网络聊天逐渐成为一种新的沟通渠道,网络聊天语言便应运而生。这类语言的日益丰富,给语言信息处理带来了新的挑战。研究发现,困难主要来自网络聊天语言的奇异性和动态性。本文借助真实网络聊天语言文本,对网络聊天语言的奇异性和动态性进行详细分析和归纳,并设计了面向解决奇异性和动态性问题的网络聊天语言文本识别与转换方法。我们先以网络聊天语言语料库为基础建立网络聊天语言模型和语言转换模型,通过信源?信道模型实现网络聊天语言向标准语言的转换。但该方法过于依赖网络聊天语言语料库,虽然能较好解决奇异性问题,但不能处理动态性问题。因此,我们进而以标准汉语语料库为基础建立文字语音映射模型,对信源?信道模型进行改进,最终有效解决了网络聊天语言的动态性问题。 展开更多
关键词 计算机应用 中文信息处理 网络聊天语言 奇异性 动态性 语言信息处理
下载PDF
VisualC++4.0的面向对象性能分析及应用
3
作者 夏云庆 张秉权 《电脑开发与应用》 1998年第4期14-17,共4页
在众多的面向对象编程语言中,MicrosoftVisualC++4.0以其卓越的面向对象性能和丰富的面向对象编程工具,以不可阻挡的趋势走在软件开发领域的前列。本文在实践的基础上,对VisualC++4.0的面向对象性... 在众多的面向对象编程语言中,MicrosoftVisualC++4.0以其卓越的面向对象性能和丰富的面向对象编程工具,以不可阻挡的趋势走在软件开发领域的前列。本文在实践的基础上,对VisualC++4.0的面向对象性能作了浅显的分析,并将这一性能的应用加以介绍。 展开更多
关键词 面向对象 可视化编程 软件开发 C++语言
下载PDF
用MCIWnd实现视频的灵活播放
4
作者 夏云庆 张秉权 《电脑开发与应用》 1997年第4期34-36,共3页
视频剪辑播放可以通过MCI接口很容易的实现,但界面呆板,灵活性差,为使视频剪辑播放灵活,使用MCIWnd接口,效果很好。文中介绍了其功能、控制、实例与实现。
关键词 视频剪辑 视频播放 MCIWnd 多媒体
下载PDF
中文信息检索系统的模糊匹配算法研究和实现 被引量:17
5
作者 王静帆 邬晓钧 +1 位作者 夏云庆 郑方 《中文信息学报》 CSCD 北大核心 2007年第6期59-64,共6页
在现代中文信息检索系统中,用户输入的字符串和实际数据库中的条目往往存在局部偏差,而基于关键词匹配的检索技术不能很好地解决这一问题。本文参考并改进了Tarhio和Ukkonen提出的过滤算法[1],针对汉字拼音输入法中常出现的同音字/近音... 在现代中文信息检索系统中,用户输入的字符串和实际数据库中的条目往往存在局部偏差,而基于关键词匹配的检索技术不能很好地解决这一问题。本文参考并改进了Tarhio和Ukkonen提出的过滤算法[1],针对汉字拼音输入法中常出现的同音字/近音字混用现象,将算法进一步扩展到广义的Edit Distance上。实验表明,本文提出的算法能有效提高中文信息检索系统的召回率,在实际应用中可达到"子线性"的效率。 展开更多
关键词 计算机应用 中文信息处理 模糊匹配 过滤算法 动态规划
下载PDF
微博文本处理研究综述 被引量:55
6
作者 张剑峰 夏云庆 姚建民 《中文信息学报》 CSCD 北大核心 2012年第4期21-27,42,共8页
微博是一个基于关系的信息分享、传播以及获取平台。用户可以通过WEB、WAP以及各种客户端组件,以140字左右的文字更新信息,并实现即时分享。由于微博发展迅猛,微博文本已经形成了大规模积累,针对微博文本的研究已经成为了一个十分重要... 微博是一个基于关系的信息分享、传播以及获取平台。用户可以通过WEB、WAP以及各种客户端组件,以140字左右的文字更新信息,并实现即时分享。由于微博发展迅猛,微博文本已经形成了大规模积累,针对微博文本的研究已经成为了一个十分重要的课题。该文对微博文本进行了定义,阐述了微博文本研究的重要性,并从微博文本的不同应用领域出发,对微博文本的研究现状进行了综述,介绍了目前已经存在的微博文本数据集和应用系统。 展开更多
关键词 微博文本 语言分析 文本处理
下载PDF
基于语义相似度并运用语言学知识进行双语语句词对齐 被引量:6
7
作者 晋薇 黄河燕 夏云庆 《计算机科学》 CSCD 北大核心 2002年第11期44-47,共4页
This paper claries the definition of alignment from the viewpoint of linguistic similarity. Many alignment algorithms have been proposed with very high precision. But the languages belong to occidental family. We prop... This paper claries the definition of alignment from the viewpoint of linguistic similarity. Many alignment algorithms have been proposed with very high precision. But the languages belong to occidental family. We propose a new method for alignment between languages that do not belong to the same language family. On the contrary to most of the previously proposed methods that rely heavily on statistics, our method attempts to use linguistic knowledge to overcome the problems of statistical model. Experimental results confirm that the algorithm can align over 85 % of word pairs while maintaining a comparably high precision rate, even when a small corpus is used in training. 展开更多
关键词 机器翻译 双语语句词对齐 语言学知识 语义相似度 计算机
下载PDF
IHSMT中的实例优化策略 被引量:1
8
作者 王建德 陈肇雄 +1 位作者 黄河燕 夏云庆 《计算机研究与发展》 EI CSCD 北大核心 2002年第3期313-317,共5页
在基于实例的机器翻译方法中 ,通常采用双语句子实例的形式 ,但由于自然语言表达的无限多样性 ,使得这种存储粒度过大的句子级翻译实例的利用率较低 ;而在基于规则的机器翻译方法中 ,规则和词典具有一定的抽象性 ,其重复利用率高 ,但其... 在基于实例的机器翻译方法中 ,通常采用双语句子实例的形式 ,但由于自然语言表达的无限多样性 ,使得这种存储粒度过大的句子级翻译实例的利用率较低 ;而在基于规则的机器翻译方法中 ,规则和词典具有一定的抽象性 ,其重复利用率高 ,但其中存在大量的歧义 .提出了一种 IHSMT中的实例自动优化算法 ,该算法引入了实例粒度的概念 ,根据规则和实例使用率 ,将粒度大的实例分解为较小的单元 ,并建立相应的词典 ,以提高实例的使用频率和检索效率 ;同时在翻译过程中 ,根据用户修改的统计和上下文信息 ,对粒度小并具有歧义的实例进行合并 ,以提高翻译质量和推理效率 ,从而使实例粒度更加合理 ,存储结构更优化 。 展开更多
关键词 实例分解 实例合并 机器翻译 IHSMT 实例优化策略 计算机
下载PDF
交互式机译系统IHSMTS的多策略翻译引擎 被引量:1
9
作者 晋薇 夏云庆 王建德 《计算机工程》 CAS CSCD 北大核心 2002年第7期58-60,177,共4页
采用了多策略的翻译方式,融合了,和机助人译等思想,提高了自动构造译文的质量,并实现了良好的经验记IHSMTSRBMTEBMT忆和知识自动获取。同时,采用智能的人机交互技术,构建了一个机助翻译平台。文章介绍了的翻译处理原理和系统关键技术的... 采用了多策略的翻译方式,融合了,和机助人译等思想,提高了自动构造译文的质量,并实现了良好的经验记IHSMTSRBMTEBMT忆和知识自动获取。同时,采用智能的人机交互技术,构建了一个机助翻译平台。文章介绍了的翻译处理原理和系统关键技术的实IHSMTS现方法。 展开更多
关键词 交互式译系统 IHSMTS 多策略翻译引擎 机器翻译 人工智能
下载PDF
多策略机器翻译系统IHSMTS中模式库的设计 被引量:1
10
作者 晋薇 夏云庆 王建德 《微型电脑应用》 2002年第3期5-9,共5页
本文介绍了语料库研究的一些特点 ,并以交互式多策略的思想为背景 ,对 IHSMTS系统 CBMT翻译引擎中模式库的设计与实现问题进行了探讨 ,提出了面向对象的分类模式库的设计思想 ,并对模式的表示、模式库的组织进行了阐述 ,方便了模式库检... 本文介绍了语料库研究的一些特点 ,并以交互式多策略的思想为背景 ,对 IHSMTS系统 CBMT翻译引擎中模式库的设计与实现问题进行了探讨 ,提出了面向对象的分类模式库的设计思想 ,并对模式的表示、模式库的组织进行了阐述 ,方便了模式库检索 ,添加等操作的实现。同时介绍了近似模式匹配算法 ,从句法功能相似的角度抽取出所比较事例的功能词和句法特征 ,作为检索模式库和相似度计算的依据。 展开更多
关键词 多策略机器翻译系统 IHSMTS 模式库 人工智能 设计
下载PDF
基于跨语言广义向量空间模型的跨语言文档聚类方法 被引量:6
11
作者 唐国瑜 夏云庆 +1 位作者 张民 郑方 《中文信息学报》 CSCD 北大核心 2012年第2期116-120,共5页
跨语言文档聚类主要是将跨语言文档按照内容或者话题组织为不同的类簇。该文通过采用跨语言词相似度计算将单语广义向量空间模型(Generalized Vector Space Model,GVSM)拓展到跨语言文档表示中,即跨语言广义空间向量模型(Cross-Lingual ... 跨语言文档聚类主要是将跨语言文档按照内容或者话题组织为不同的类簇。该文通过采用跨语言词相似度计算将单语广义向量空间模型(Generalized Vector Space Model,GVSM)拓展到跨语言文档表示中,即跨语言广义空间向量模型(Cross-Lingual Generalized Vector Space Model,CLGVSM),并且比较了不同相似度在文档聚类下的性能。同时提出了适用于GVSM的特征选择算法。实验证明,采用SOCPMI词汇相似度度量算法构造GVSM时,跨语言文档聚类的性能优于LSA。 展开更多
关键词 跨语言文档聚类 跨语言广义向量空间模型 文档聚类 跨语言信息检索
下载PDF
基于词义类簇的文本聚类 被引量:2
12
作者 唐国瑜 夏云庆 +1 位作者 张民 郑方 《中文信息学报》 CSCD 北大核心 2013年第3期113-119,共7页
文档表示是文本聚类的重要组成部分,该文旨在通过改进文档表示改进文本聚类。同义词和多义词现象是文档表示所面临的重要挑战。为此该文提出了词义类簇模型(Sense Cluster Model,SCM),在词义类簇空间上表示文档。SCM首先构造词义类簇空... 文档表示是文本聚类的重要组成部分,该文旨在通过改进文档表示改进文本聚类。同义词和多义词现象是文档表示所面临的重要挑战。为此该文提出了词义类簇模型(Sense Cluster Model,SCM),在词义类簇空间上表示文档。SCM首先构造词义类簇空间,然后将文档表示在词义类簇空间上,获得每篇文档在每个词义类簇的概率。在词义类簇空间构造这一步骤中,首先利用词义归纳技术从文本中自动发现词义,接着采用词义聚类技术识别相同或者相似的词义从而获得词义类簇。词义类簇空间构造后,该文首先进行词义消歧,然后利用词义消歧的结果将文档表示在词义空间上。实验表明,SCM在标准测试集上的性能优于基线系统以及经典话题模型LDA。 展开更多
关键词 文档聚类 文档表示 话题模型
下载PDF
基于条件随机场的古汉语自动断句与标点方法 被引量:34
13
作者 张开旭 夏云庆 宇航 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第10期1733-1736,共4页
标点符号在现代汉语中扮演着重要的角色,但古代汉语中却不含有任何标点。这使得现代中国人阅读古代文献有严重的困难。该文提出一个基于条件随机场(CRF)的古汉语自动断句标点方法,并引入互信息和t测-试差两个统计量作为模型的特征。分... 标点符号在现代汉语中扮演着重要的角色,但古代汉语中却不含有任何标点。这使得现代中国人阅读古代文献有严重的困难。该文提出一个基于条件随机场(CRF)的古汉语自动断句标点方法,并引入互信息和t测-试差两个统计量作为模型的特征。分别在《论语》与《史记》两个语料库上进行了充分实验,该方法在《论语》断句处理F 1分数上超出现有方法0.124,在《论语》标点和《史记》断句、标点处理上也取得了满意效果。实验证明:基于条件随机场的方法能较好解决古文自动标点处理问题;层叠条件随机场策略亦优于单层条件随机场策略。 展开更多
关键词 计算机信息处理 古汉语标点 条件随机场(CRF)
原文传递
邮电高职班
14
作者 夏云庆 《教育发展研究》 CSSCI 1994年第S1期54-54,共1页
邮电高职班上海市邮电职工大学夏云庆上海市邮电职工大学早在80年代中期就决意从国外引入先进的程控电话交换设备来改变上海通信落后的面貌。经国家教委专家审核认定批准,学校开设了通信专业(程控电话交换维护专门化)两年制全脱产... 邮电高职班上海市邮电职工大学夏云庆上海市邮电职工大学早在80年代中期就决意从国外引入先进的程控电话交换设备来改变上海通信落后的面貌。经国家教委专家审核认定批准,学校开设了通信专业(程控电话交换维护专门化)两年制全脱产大专试点班。学校深知,处在高科技发... 展开更多
关键词 成人高等教育 程控电话交换机 成人高等学校 高职班 邮电职工 普通高校 微机控制 师资队伍 成人高校 技术上的差距
原文传递
基于拼音索引的中文模糊匹配算法 被引量:14
15
作者 曹犟 邬晓钧 +1 位作者 夏云庆 郑方 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第S1期1328-1332,共5页
主流商业搜索引擎主要基于关键词精确匹配技术。为提高在用户的输入错误时的检索效率,提出了有索引的汉语模糊匹配算法。该算法采用汉字、拼音和拼音改良的编辑距离这3种汉字相似程度的不同度量方式,对用户查询进行扩展,将模糊匹配转化... 主流商业搜索引擎主要基于关键词精确匹配技术。为提高在用户的输入错误时的检索效率,提出了有索引的汉语模糊匹配算法。该算法采用汉字、拼音和拼音改良的编辑距离这3种汉字相似程度的不同度量方式,对用户查询进行扩展,将模糊匹配转化为多个精确匹配,对精确匹配的结果按与查询串的相似程度进行排序。在实验中,将该方法应用于网页文本语料库中。在使用基于拼音改良的编辑距离度量方式时,在时间和空间复杂度增长不大的情况下,该方法取得了60.42%的准确率与50.41%召回率。 展开更多
关键词 文件信息处理 拼音索引 模糊匹配 查询扩展
原文传递
基于泛化和繁殖的自举式意见目标抽取方法
16
作者 郝博一 夏云庆 +2 位作者 邬晓钧 郑方 刘轶 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第S1期1333-1338,共6页
意见目标抽取是自然语言处理领域中意见挖掘研究的重要环节。该文提出了一种基于泛化、繁殖和自举的意见目标抽取方法,在泛化过程中提炼原子意见目标和意见目标模式,在繁殖过程中对复合意见目标进行扩展,并采取自举机制实现了意见目标... 意见目标抽取是自然语言处理领域中意见挖掘研究的重要环节。该文提出了一种基于泛化、繁殖和自举的意见目标抽取方法,在泛化过程中提炼原子意见目标和意见目标模式,在繁殖过程中对复合意见目标进行扩展,并采取自举机制实现了意见目标的递增学习。实验结果显示,经过第一轮自举过程后,该方法的F-1 score指标超出基线方法0.078;自举过程完成后,F-1 score指标提高了0.112。这说明,泛化处理对意见目标充分繁殖意义重大,自举过程则有助于充分发挥泛化能力和繁殖能力。 展开更多
关键词 自然语言处理 意见挖掘 意见目标抽取 文本挖掘
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部