-
题名WSAM:互联网UGC文本主观观点挖掘系统
被引量:3
- 1
-
-
作者
费仲超
朱鲲鹏
魏芳
-
机构
上海贝尔股份有限公司
复旦大学计算机科学技术学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2012年第5期90-94,共5页
-
基金
上海市博士后项目资助(10R21421900)
-
文摘
互联网上的用户生成内容UGC(User Generated Content)中蕴含的用户主观观点信息对分析用户行为、用户需求等工作有着重要的价值。设计一套基于自然语言理解的互联网UGC文本主观观点分析系统WSAM,该系统能挖掘出用户主观观点所蕴含的关注对象和主观成分。分析了互联网UGC现象和生成原因,总结出UGC中用户主观观点中的四种主要类型。挖掘用户主观观点过程中,将用户主观观点的挖掘转化为句子中主观观点关注对象的识别和主观成分的判断。算法结合基于词语类、结构类等相关特征,采用最大熵分类器挖掘用户主观观点。实验验证,WSAM系统所采用的算法性能较好,且还能够灵活扩充出情感分析(Opin-ion Mining)等相关应用,同样也能达到较好的结果。
-
关键词
用户生成内容
UGC
自然语言处理
情感分析
-
Keywords
User generated content UGC Nature language processing Opinion mining
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名口语对话中的代词指代消解
被引量:2
- 2
-
-
作者
费仲超
周雅倩
黄萱菁
吴立德
-
机构
复旦大学计算机科学技术学院
上海贝尔股份有限公司产品线战略及技术领先部
-
出处
《软件学报》
EI
CSCD
北大核心
2011年第2期233-244,共12页
-
基金
国家自然科学基金(60503070
60673038)
上海市科委科研计划(08511500302)
-
文摘
提出一套分为两步的代词指代消解算法,算法不需要人工清洗语料及预定义规则.算法第1步采用一些新特征和机器学习算法对名词性指代代词和非名词性指代(non-anaphoric)代词分类,第2步分别对两类代词进行消解.针对名词性代词指代消解,提出了适用于口语对话的特征抽取及表示方法,如代词和候选先行词的距离、语法、语义等的抽取和表示方法,然后通过综合这些特征来选择先行词.针对非名词性指代,将右边界规则(right frontier rule)改进为可以在口语对话中自动抽取的形式,并根据该规则选择先行项.在Byron于2004年发布的语料上测试,消解正确率达到77.0%,召回率达到66.0%.与Byron的工作相比,该方法在保证系统能够自动完成的同时还提高了消解性能.
-
关键词
代词指代消解
口语对话理解
代词分类
-
Keywords
pronoun resolution
spoken dialog understanding
pronoun classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名口语对话中非名词指代的消解
- 3
-
-
作者
费仲超
魏芳
朱鲲鹏
-
机构
上海贝尔股份有限公司
复旦大学计算机科学技术学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2012年第2期113-117,128,共6页
-
基金
上海市博士后项目(10R21421900)
-
文摘
代词指代消解是全面理解口语对话不可缺少的一部分。根据口语不同于书面语的特点以及非名词指代先行项的特点,在前人工作的基础上提出了一套适合于在口语对话生语料上消解非名词指代的算法。算法基于非名词指代的右边界规则理论,给出了判断候选先行项属于"线性紧邻"还是"层次紧邻"的判别方法,同时给出了候选先行项的过滤规则。算法在公开发布的口语对话语料Tran is-93上进行了测试,实验结果表明,算法提高了消解的正确率和召回率,能消解更多不同的代词,且适用于口语对话生语料。
-
关键词
口语对话理解
指代消解
非名词指代
-
Keywords
Spoken dialogue comprehension Co-reference resolution Co-reference of non-nominal word classes
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名移动互联网视频传输优化的架构研究
被引量:2
- 4
-
-
作者
张世乐
魏芳
费仲超
-
机构
上海贝尔股份有限公司产品线战略及技术领先部首席技术官部门
复旦大学计算机科学与技术学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2012年第4期106-108,162,共4页
-
基金
上海市博士后项目(10R21421900)
-
文摘
随着3G移动互联网的快速发展,在手机等移动终端上看视频成为一种日常应用。但互联网上的大部分视频对于移动用户而言,其码率相对较大,而且移动用户的可用带宽受环境影响变化大,不稳定,影响了用户观看视频的体验。提出一种针对移动互联网的视频传输优化解决方案的系统架构,该架构从缓存和压缩两个方面入手,通过缓存缓解运营商的骨干网流量压力,通过视频压缩降低视频码率以满足用户的实际接入带宽。该架构既为运营商节约了带宽、降低了运营成本,同时也保证用户观看视频的连续性,提高用户体验。
-
关键词
移动互联网
视频传输优化
缓存
视频压缩
-
Keywords
Mobile Internet Optimisation of video transmission Cache Video compression
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于代理的互联网用户行为分析研究
被引量:1
- 5
-
-
作者
张世乐
魏芳
费仲超
-
机构
上海贝尔股份有限公司产品线战略及技术领先部首席技术官部门
复旦大学计算机科学与技术学院
-
出处
《计算机应用与软件》
CSCD
2011年第8期138-140,176,共4页
-
基金
上海市博士后项目(10R21421900)
-
文摘
在互联网智能化的过程中,互联网用户行为的分析是一个必要的工作。通过架设网络代理,记录用户在互联网上发出的HTTP请求,建立用户行为日志库,并根据Web访问的特性对用户行为日志进行过滤、聚类,缩减数据规模,最后利用开放式分类目录ODP(Open Directory Project)对用户行为进行分类统计,将没有语义信息的用户Web访问记录转化为体现用户偏好的统计直方图。该分析结果可用于互联网信息的个性化推荐,如新闻、商品、广告等,具有较高的商业价值。
-
关键词
用户行为
过滤
聚类
开放式分类目录
-
Keywords
User behavior Filtering Clustering ODP
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-