-
题名基于语言现象的文本蕴涵识别
被引量:4
- 1
-
-
作者
任函
冯文贺
刘茂福
万菁
-
机构
广东外语外贸大学语言工程与计算实验室
武汉大学湖北语言与智能信息处理研究基地
武汉科技大学计算机学院
广东外语外贸大学词典研究中心
-
出处
《中文信息学报》
CSCD
北大核心
2017年第1期184-191,共8页
-
基金
国家自然科学基金(61402341)
国家社会科学基金(11&ZD189)
+3 种基金
华中师范大学中央高校基本科研业务费教育科学专项资助(ccnu16JYKX014)
教育部人文社科项目(13YJC740022)
河南高校哲社基础研究重大项目(2015-JCZD-022)
广东外语外贸大学语言工程与计算实验室2016年招标课题(LEC2016ZBKT002)
-
文摘
该文提出一种基于语言现象的文本蕴涵识别方法,该方法建立了一个语言现象识别和整体推理判断的联合分类模型,目的是对两个高度相关的任务进行统一学习,避免管道模型的错误传播问题并提升系统精度。针对语言现象识别,设计了22个专用特征和20个通用特征;为提高随机森林的泛化能力,提出一种基于特征选择的随机森林生成算法。实验结果表明,基于随机森林的联合分类模型能够有效识别语言现象和总体蕴涵关系。
-
关键词
文本蕴涵识别
语言现象
随机森林
-
Keywords
recognizing textual entailment
language phenomena
random forest
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于形成性评估的英国高校计算机教学模式分析
被引量:3
- 2
-
-
作者
路美秀
李霞
张新猛
郝鹃
-
机构
广东外语外贸大学信息科学与技术学院
广东外语外贸大学语言工程与计算实验室
-
出处
《计算机教育》
2017年第5期158-162,共5页
-
基金
2016年度广东省本科高校高等教育教学改革项目"促进个性化学习的形成性评估智能评测方法及应用研究"(粤教高函236号:序号201
208)
+1 种基金
2015年度广东省高等教育教学改革项目(粤教高函173号:序号260)
广东外语外贸大学校级教学研究项目(GWJY2015033)
-
文摘
针对广东省普通高等学校实施学分制管理若干意见,以英国兰开夏大学计算机专业教学为例,根据理论课、实验课以及实践教学开展情况对基于形成性评估的教学模式进行研究和分析,指出基于形成性评估的教学模式更能提高学生的学习兴趣和学习动机,为学分制教学改革提供借鉴和参考。
-
关键词
形成性评估
计算机教育
数据库
教学模式
-
分类号
G642
[文化科学—高等教育学]
-
-
题名面向汉语文本推理的语言现象标注规范研究
被引量:2
- 3
-
-
作者
任函
-
机构
广东外语外贸大学语言工程与计算实验室
-
出处
《河南科技学院学报(社会科学版)》
2017年第7期75-78,共4页
-
基金
2014年国家自然科学基金青年项目"基于推理现象的中文文本推理资源建设和自动分析研究"(61402341)
-
文摘
面向汉语文本推理的语言现象标注规范的方案包含两个阶段:第一,语言推理基本单元对分析,即确定两个文本片断中存在推理关系的文本对;第二,语言现象类别确定,即为语言推理基本单元对指派合适的类别。为此制定了一个包含20个类别的语言现象类别体系,探讨了语言推理基本单元对及其语言现象的判定原则和方法,说明了标注的实施流程、标注结果以及标注评估方案。
-
关键词
文本推理
语言现象
语义单元
推理关系
-
Keywords
text reasoning
language phenomenon
semantic unit
reasoning relation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名自然语言处理课程的实践教学研究
被引量:1
- 4
-
-
作者
李霞
路美秀
-
机构
广东外语外贸大学语言工程与计算实验室
广东外语外贸大学信息学院
-
出处
《福建电脑》
2015年第11期68-69,155,共3页
-
基金
广东教育教学成果奖(高等教育)培育项目:语言信息处理跨学科人才培养模式的探索与实践
-
文摘
本文从自然语言处理课程的应用专题嵌入、课程大作业实践与分析两个方面对自然语言处理课程的实践教学进行了分析和探讨,实践表明课程中安排应用专题嵌入教学和课程大作业实践教学,能够有效提升学生自主学习能力、编程能力和综合解决问题的能力。
-
关键词
自然语言处理
实践教学
大作业数据分析
文本分析
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名服务21世纪海上丝绸之路的低资源语言处理
被引量:2
- 5
-
-
作者
刘伍颖
-
机构
广东外语外贸大学语言工程与计算实验室
-
出处
《广东外语外贸大学学报》
2018年第3期77-82,共6页
-
基金
国家语言文字工作委员会重点项目"面向21世纪海上丝绸之路的稀缺语言资源建设及应用研究"(ZDI135-26)
广东省高校特色创新项目"韩国语自动文摘关键技术研究"(2015KTSCX035)
-
文摘
21世纪海上丝绸之路沿线区域分布着数量众多的非通用语言。这些非通用语言的资源稀缺性严重影响了自然语言处理的性能。针对低资源语言处理这个科学问题,提出了一种总体研究架构:该架构从低资源语言的资源规范标准化、语言数据结构化和语言计算形式化三个方面给出了系统的解决方案。在越南语、印尼语、马来语上的实验结果表明新研究架构是有效的。
-
关键词
低资源语言
自然语言处理
非通用语言
21世纪海上丝绸之路
-
Keywords
low-resource language
natural language processing
non-general languages
the 21^st CenMaritime Silk Road
-
分类号
H085.5
[语言文字—语言学]
-
-
题名基于改进级联宽度学习的自适应认知诊断方法
- 6
-
-
作者
陈锦
林江豪
阳爱民
李心广
-
机构
华南理工大学外国语学院
广东外语外贸大学语言工程与计算实验室
广东工业大学自动化学院
-
出处
《郑州大学学报(理学版)》
CAS
北大核心
2024年第4期88-94,共7页
-
基金
全国教育科学规划教育部青年课题(EIA180491)。
-
文摘
针对现有的认知诊断模型信息利用不充分以及依赖局部作答信息而导致诊断精度低的问题,提出了基于改进级联宽度学习的自适应认知诊断方法。首先,提取题目的语义、参数等特征,采用无偏差加权进行融合。其次,提出了改进的级联宽度学习系统(improved cascade of broad learning system,ICBLS),旨在学习全序列作答信息,利用残差结构解决长序列学习遗忘的问题,采用网格搜索法确定最优参数组合,进而构建认知诊断模型。最后,经过非线性分类器实现知识状态的分类。以BP神经网络、Bi-LSTM、Bi-GRU为基线模型,在实际的接受性任务中进行了实验验证。结果表明,基于ICBLS的模型获得的最高模式准确率为95.74%,平均属性准确率为98.31%。并且,通过消融实验证明了题目的语义信息有利于模型更准确地发现被试的语言理解能力。
-
关键词
级联宽度学习
认知诊断
自适应测试
语义特征
-
Keywords
cascade of broad learning
cognitive diagnosis
adaptive testing
semantic feature
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于把关人行为的微博虚假信息及早检测方法
被引量:18
- 7
-
-
作者
谢柏林
蒋盛益
周咏梅
谢逸
李霞
-
机构
广东外语外贸大学思科信息学院
广东外语外贸大学语言工程与计算实验室
中山大学信息科学与技术学院
-
出处
《计算机学报》
EI
CSCD
北大核心
2016年第4期730-744,共15页
-
基金
国家自然科学基金(61202271
61572145
+3 种基金
61402119)
广东省高等学校优秀青年教师培养计划项目(GWTPSY201403)
国家社会科学基金项目(13CGL130)
教育部人文社会科学研究青年项目(14YJC87002113YJCZH258)资助
-
文摘
目前微博已成为人们获取信息和发布信息的一个重要平台,然而微博也正成为虚假信息滋生和泛滥的温床.现有的方法主要基于分类算法来识别虚假信息,这些方法不能及早发现微博上流行的虚假信息.为了减少虚假信息对公众的影响,使微博在人们的生产和生活中发挥更积极的作用,文中提出一种基于把关人行为的微博虚假信息及早检测方法.该方法利用模型状态持续时间概率为Gamma分布的隐半马尔可夫模型来刻画信息转发者和评论者对流行的真实信息的把关行为,基于此来及早识别微博上流行的虚假信息.该方法分为模型训练和虚假信息检测两个阶段,在虚假信息检测阶段,计算每条信息在传播过程中产生的观测序列相对于模型的平均对数似然概率,实时更新每条信息的可信度,从而及早发现虚假信息,降低虚假信息的危害.使用采集的新浪微博数据集和Twitter数据集对文中的方法进行了测试,实验结果表明了该方法的有效性.
-
关键词
微博
虚假信息
把关人
隐半马尔可夫模型
社会媒体
社交网络
数据挖掘
-
Keywords
microblog
misinformation
gatekeeper
hidden semi-Markov model
social media
social networks
data mining
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于LDA主题模型的评论文本情感分类方法
被引量:8
- 8
-
-
作者
王伟
周咏梅
阳爱民
周剑峰
林江豪
-
机构
广东外语外贸大学思科信息学院
广东外语外贸大学语言工程与计算实验室
广东外语外贸大学图书馆
广东外语外贸大学财务处
-
出处
《数据采集与处理》
CSCD
北大核心
2017年第3期629-635,共7页
-
基金
国家社会科学基金(12BYY045)资助项目
教育部"新世纪"优秀人才支持计划(NCET-12-0939)资助项目
+4 种基金
广东省教育厅科技创新(2013KJCX0067)资助项目
广州市社会科学规划(15Q16)资助项目
广东外语外贸大学研究生科研创新(14GWCXXM-36)资助项目
广东外语外贸大学校级(14Q3)资助项目
广东省普通高校青年创新人才类(299-X5122106)资助项目
-
文摘
针对互联网出现的评论文本情感分析,引入潜在狄利克雷分布(Latent Dirichlet allocation,LDA)模型,提出一种分类方法。该分类方法结合情感词典,依据指定的情感单元搭配模式,提取情感信息,包括情感词和上、下文。使用主题模型发掘情感信息中的关键特征,并融入到情感向量空间中。最后利用机器学习分类算法,实现中文评论文本的情感分类。实验结果表明,提出的方法有效降低了特征向量的维度,并且在文本情感分类上有很好的效果。
-
关键词
评论文本
情感单元
潜在主题
情感分析
机器学习
-
Keywords
comment text
sentiment unit
latent topic
sentiment analysis
machine learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名结合词向量和聚类算法的新闻评论话题演进分析
被引量:15
- 9
-
-
作者
林江豪
周咏梅
阳爱民
王伟
-
机构
广东外语外贸大学语言工程与计算实验室
广东外语外贸大学思科信息学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2016年第11期2368-2374,共7页
-
基金
国家社科基金项目(12BYY045)
广东省哲学社会科学"十二五"规划项目(GD15YTS01)
-
文摘
话题演进分析主要是挖掘话题内容随着时间流的演进情况。话题的内容可用关键词来表示。利用word2vec对75万篇新闻和微博文本进行训练,得到词向量模型。将文本流处理后输入模型,获得时间序列下所有词汇的词向量,利用K-means对词向量进行聚类,从而实现话题关键词的抽取。实验对比了基于PLSA和LDA主题模型下的话题抽取效果,发现本文的话题分析效果优于主题模型的方法。同时,采集足够大量、内容足够丰富的语料,可训练得到泛化能力比较强的模型,有利于实时话题演进分析研究工作。
-
关键词
话题演进
word2vec
PLSA
LDA
-
Keywords
topic evolution
word2vec
PLSA
LDA
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于种子词的微博表情符情感倾向判定方法
被引量:5
- 10
-
-
作者
王伟
周咏梅
阳爱民
林江豪
陈昱宏
曾文俊
-
机构
广东外语外贸大学思科信息学院
广东外语外贸大学语言工程与计算实验室
广东外语外贸大学财务处
-
出处
《数据采集与处理》
CSCD
北大核心
2017年第1期198-204,共7页
-
基金
国家社会科学基金(12BYY045)资助项目
教育部新世纪优秀人才支持计划(NCET-12-0939)资助项目
+4 种基金
广东省教育厅科技创新项目(2013KJCX0067)资助项目
广州市社会科学规划项目(15Q16)资助项目
广东外语外贸大学研究生科研创新项目(14GWCXXM-36)资助项目
广东外语外贸大学校级项目(14Q3)资助项目
广东省普通高校青年创新人才类项目(299-X5122106)资助项目
-
文摘
情感倾向明显的表情符,容易通过人工进行标注。但是对于情感倾向不明显的表情符,多人手工的标注结果往往难以达成一致。因此,提出一种利用种子词自动判定表情符情感倾向的方法。该方法利用少量种子表情符自动标注情感倾向比较明显的表情符,生成表情符标注集;对于情感倾向不明显的表情符,利用种子情感词和已得到的表情符标注集构建模型,实现其情感倾向的自动判定。实验结果表明,本文方法在微博表情符情感倾向的自动判定上有很好的效果。
-
关键词
情感分类
机器学习
微博表情符
种子词
自动标注
-
Keywords
sentiment classification
machine learning
microblog smileys
seed words
automatic labeling
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向微博的社会情绪词典构建及情绪分析方法研究
被引量:18
- 11
-
-
作者
蒋盛益
黄卫坚
蔡茂丽
王连喜
-
机构
广东外语外贸大学语言工程与计算实验室
广东外语外贸大学信息学院
广东外语外贸大学图书馆
-
出处
《中文信息学报》
CSCD
北大核心
2015年第6期166-171,202,共7页
-
基金
国家自然科学基金(61572145)
广东省科技计划项目(2014A040401083)
+1 种基金
教育部人文社会科学研究青年项目(14YJC870021)
广东省哲学社会科学"十二五"规划项目(GD14YXW02)
-
文摘
该文旨在探索一种面向微博的社会情绪词典构建方法,并将其应用于社会公共事件的情绪分析中。首先通过手工方法建立小规模的基准情绪词典,然后利用深度学习工具Word2vec对社会热点事件的微博语料通过增量式学习方法来扩展基准词典,并结合HowNet词典匹配和人工筛选生成最终的情绪词典。接下来,分别利用基于情绪词典和基于SVM的情绪方法对实验标注语料进行情绪分析,结果对比分析表明基于词典的情绪分析方法优于基于SVM的情绪分析方法,前者的平均准确率和召回率比后者分别高13.9%和1.5%。最后运用所构建的情绪词典对热点公共事件进行情绪分析,实验结果表明该方法是有效的。
-
关键词
微博
社会情绪
词典
情绪分析
-
Keywords
microblogging
social emotions
lexicon
emotional analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于概率潜在语义分析的群体情绪演进分析
被引量:4
- 12
-
-
作者
林江豪
周咏梅
阳爱民
陈昱宏
陈晓帆
-
机构
广东外语外贸大学思科信息学院
广东外语外贸大学语言工程与计算实验室
-
出处
《计算机应用》
CSCD
北大核心
2015年第10期2747-2751,2756,共6页
-
基金
国家社会科学基金资助项目(12BYY045)
教育部新世纪优秀人才支持计划项目(NCET-12-0939)
+4 种基金
教育部人文社会科学研究项目(14YJA740011)
广东省教育厅科技创新项目(2013KJCX0067)
2015年广州市哲学社会科学"十二五"规划课题资助项目(15Q16)
广东外语外贸大学校级项目(14Q3)
广东外语外贸大学研究生科研创新项目(14GWCXXM-36)
-
文摘
针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句法关系和情感本体库,抽取与话题内容相匹配群体情绪单元,计算情绪单元的强度,形成情绪特征向量;最后,对各子话题下的情绪强度进行求和,细粒度分析子话题和事件的整体群体情绪,深入挖掘群体情绪演进规律,并将群体情绪量化和可视化。在话题情绪单元抽取过程中,引入了句法规则和情感本体库,更细粒度地抽取情绪单元,并提高了话题内容与情绪单元匹配的准确性。实验结果表明,该模型能够实现话题内容及其群体情绪按时序特征的演进分析,验证了所提方法的有效性。
-
关键词
群体情绪
概率潜在语义分析模型
话题挖掘
情绪演进
情绪分析
-
Keywords
public emotion
Probabilistic Latent Semantic Analysis (PLSA) model
topic mining
emotion evolution
emotion analysis
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于表情符号的情感词典的构建研究
被引量:12
- 13
-
-
作者
林江豪
顾也力
周咏梅
阳爱民
陈锦
-
机构
广东外语外贸大学
广东外语外贸大学语言工程与计算实验室
广东外语外贸大学信息科学与技术学院
-
出处
《计算机技术与发展》
2019年第6期181-185,共5页
-
基金
教育部人文社会科学项目(14YJA740011)
广东省哲学社会科学“十二五”规划项目(GD15YTS01)
+2 种基金
广东省科技计划项目(2017A04 0406025)
广州市哲学社会科学“十三五”规划2018年度课题(2018GZQN27)
广东外语外贸大学教改项目(GWJY2017046)
-
文摘
情感词典是文本情感分析的基础资源。利用表情符号明显的情感表达作用,提出一种基于种子表情符和SO-PMI算法结合的情感词典构建方法。选择44个情感明显、内容丰富的表情符号词作为种子情感集合。构建过程融合了TF-IDF值在词汇重要程度的度量作用,有效选择候选情感词集。基于SO-PMI算法,在大量语料中计算候选情感词汇与种子表情符号之间的情感共现信息,进而确定词汇的情感权值和极性。在500万条微博语料中,计算并构建情感词典SentiNet,共有情感词汇13814个,其中正向词汇6885个,负向词汇6929个。将SentiNet应用于微博文本情感分析任务中,实验结果表明,SentiNet能实现情感词的情感表示,并可应用于大规模的微博语料情感分析任务。该方法融合了情感词的重要度衡量优势和种子表情符号集的情感表达优势,证明了获得的情感权值有效。
-
关键词
情感词典
情感词
情感权值
种子表情符号
SO-PMI
TF-IDF
-
Keywords
sentiment lexicon
sentiment word
sentimental weight
seed emoticons
SO-PMI
TF-IDF
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名汉英篇章结构平行语料库的对齐标注评估
被引量:4
- 14
-
-
作者
冯文贺
李艳翠
任函
周国栋
-
机构
广东外语外贸大学语言工程与计算实验室
河南科技学院中文系
河南科技学院信息工程学院
苏州大学计算机学院
-
出处
《中文信息学报》
CSCD
北大核心
2017年第3期86-93,共8页
-
基金
教育部人文社科项目(13YJC740022
15YJC740021)
+6 种基金
河南高校哲社基础研究重大项目(2015-JCZD-022)
中国博士后基金(2013M540594)
国家自然科学基金(61402341
61502149
61273320)
广东外语外贸大学语言工程与计算实验室2016年招标课题(LEC2016ZBKT001
LEC2016ZBKT002)
-
文摘
汉英篇章结构平行语料库是为汉英翻译文本标注对齐篇章结构信息的语料库,对齐标注是其核心工作,基本原则是"结构对齐、关系对齐"。该文基于所开发的对齐标注平台,进行人工对齐标注实验,提出切分对齐、结构对齐、关系对齐、连接词对齐、关系角色与中心对齐等对齐标注任务的评估方法,并给出评估分析。实验表明,对齐标注是构建汉英篇章结构平行语料库的合理、有效工作方式。
-
关键词
篇章结构
平行语料库
对齐标注
结构对齐
对齐评估
-
Keywords
discourse structure
parallel corpus
alignment annotation
structural alignment ~ alignment evaluation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于特征簇的微博短文本情感分类方法
被引量:2
- 15
-
-
作者
周咏梅
王伟
阳爱民
林江豪
方泽锋
-
机构
广东外语外贸大学思科信息学院
广东外语外贸大学语言工程与计算实验室
广东外语外贸大学财务处
-
出处
《小型微型计算机系统》
CSCD
北大核心
2016年第12期2713-2716,共4页
-
基金
国家社会科学基金项目(12BYY045)资助
广东外语外贸大学研究生科研创新项目(14GWCXXM-36)资助
广东外语外贸大学创新创业训练计划项目(201511846021)资助
-
文摘
针对由微博短文本特征规模大、自身特征较少等特点导致的数据稀疏性,提出一种基于特征簇的微博情感分类方法.提出的分类方法以大规模语料库为基础,利用word2vec模型学习词语之间潜在的语义关联,将单个词语表示成多维向量的形式;结合情感词典,提取出微博文本的情感特征集,在基于词向量计算词语相似度方法的基础上,将情感特征合并为特征簇,以此构造低维的文本向量;最后利用机器学习算法,构建情感分类器,实现微博短文本的情感分类.实验结果表明,本文提出的方法对情感特征的降维是可行和有效的,并且取得很好的情感分类效果.
-
关键词
微博情感
数据稀疏
词向量
特征簇
机器学习
-
Keywords
microblog sentiment
data sparseness
term vector
feature cluster
machine learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名决策偏好不确定条件下群体决策收敛一致性研究
被引量:4
- 16
-
-
作者
杨雷
赵九茹
-
机构
华南理工大学工商管理学院
广东外语外贸大学语言工程与计算实验室
-
出处
《运筹与管理》
CSSCI
CSCD
北大核心
2017年第1期96-102,共7页
-
基金
教育部人文社会科学研究规划基金(14YJA630078)
广东省教育厅青年创新人才类项目(2015KQNCX038)
-
文摘
决策个体之间交互影响是达成群体一致意见的重要因素。本文引入决策个体决策偏好的不确定性以及个体间不对称的影响权重,以此为基础建立群体决策动态观点演化模型,并进行matlab仿真。文中取决策个体的偏好不确定性为常数,作为决策个体对自身观点确定性的大致考量,并把群体中所有决策者的决策偏好不确定性分为相同和不相同两种情况来讨论。仿真实例证明:决策个体观点的不确定性是最终影响群体决策一致性的重要因素,当决策个体偏好不确定性较大时,决策群体更容易得到一致意见;当偏好不确定性较小时,决策群体难以达成一致意见,最终形成几个观点簇;在初始观点分布均匀的情况下,群体观点最终会演化出怎样的观点形态,是由群体中观点不确定性较小的群体所持有的观点决定的。研究内容有助于理解群体决策中一致观点的演化规律,能够为群体决策的引导策略提供参考和借鉴。
-
关键词
偏好不确定
动态群体决策
观点演化
偏好收敛
观点一致性
-
Keywords
uncertainty preference
dynamic group decision making
viewpoint evolution
preference conver- gence
viewpoint consistency
-
分类号
C934
[经济管理—管理学]
-
-
题名《世说新语》的篇章连接词
被引量:2
- 17
-
-
作者
冯文贺
郭海芳
李玉静
任函
-
机构
广东外语外贸大学语言工程与计算实验室
河南科技学院中文系
云南民族大学民族文化学院
-
出处
《中文信息学报》
CSCD
北大核心
2017年第1期212-220,共9页
-
基金
教育部人文社科项目(13YJC740022
15YJC740021
+4 种基金
16YJC740053)
河南高校哲社基础研究重大项目(2015-JCZD-022)
国家自然科学基金(61273320)
中国博士后基金(2013M540594)
广东外语外贸大学语言工程与计算机实验室拓标课题(LEC2016ZBKT001)
-
文摘
该文标注《世说新语》的篇章结构,据此研究其连接词的显隐、语义及用法。研究发现:1)隐式关系(3 346,81.4%)多于显式关系(786,18.6%),17类关系仅有三类(假设,选择,让步)显多隐少;2)各类关系的同义连接词种数与使用有差异,其中种数最多36(顺承),最少则无(总分,背景);3)连接词(90种)单义为多(55),多义为少(35),义项最多为八种("乃"),分布也有差异。对比发现,《世说新语》与同时期《文心雕龙》的连接词使用有一定差异。
-
关键词
《世说新语》
篇章结构
连接词
语义分析
-
Keywords
Shishuoxinyu
structure
conjunctions
semantic analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名旅游路线个性化推荐算法比较分析
被引量:7
- 18
-
-
作者
李霞
尹川东
袁云
-
机构
广东外语外贸大学语言工程与计算实验室
广东外语外贸大学信息学院
-
出处
《计算机技术与发展》
2016年第9期73-77,共5页
-
基金
广东省普通高校科技创新项目(2013KJCX0071)
-
文摘
随着自助游群体的增加,越来越多的人希望能够在满足用户特定需求(如限定旅游天数、旅游费用、住宿标准等)的前提下,获取自动生成的可供参考的包括旅游景点、价格和住宿一体化的旅游推荐路线,并能够可视化呈现给用户。蚁群算法和遗传算法是0-1背包问题中的两种经典算法,通过建立应用于个性化旅游路线推荐问题中的数学模型,将蚁群算法和遗传算法应用于旅游路线个性化推荐中。依据文中所提出的最优路线推荐分值评价方法,对所选取的推荐算法进行了分析和测试。实验结果表明,优化后的蚁群算法和遗传算法均优于传统蚁群算法和遗传算法,并且从综合性能看,基于贪心解的混合遗传算法可有效应用于旅游路线个性化推荐中。
-
关键词
旅游路线自动规划
旅游挖掘
遗传算法
贪心算法
最大最小蚁群算法
-
Keywords
traveling route planning
traveling mining
genetic algorithm
greedy algorithm
maximum and minimum ant colony algorithm
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于改进的LDA模型的中文主观题自动评分研究
被引量:9
- 19
-
-
作者
罗海蛟
柯晓华
-
机构
广东外语外贸大学思科信息学院
广东外语外贸大学语言工程与计算实验室
-
出处
《计算机科学》
CSCD
北大核心
2017年第B11期102-105,128,共5页
-
基金
广东省自然科学基金资助项目(2015A030313575)资助
-
文摘
主观题自动评分(Automated Scoring Subjective Responses,ASSR)在语言学习与语言测试领域的诊断信息及信度方面具有重要的应用前景。将主题模型中的隐含狄利克雷分配(Latent Dirichlet Allocation,LDA)引入到中文主观题自动评分中,提出了一种结合专家知识的改进的LDA模型,并采用了一种综合文档-隐含主题概率向量及隐含主题-核心词项概率向量的文本特征表示方式。实验对比了改进的LDA与潜在语义分析(Latent Semantic Analysis,LSA)的自动评分效果,结果表明改进的LDA模型在中文主观题自动评分中切实有效。
-
关键词
主观题自动评分
潜在语义分析(LSA)
隐含狄利克雷分配(LDA)
绝对一致性
相邻一致性
-
Keywords
Automated subjective question scoring
Latent semantic analysis (LSA)
Latent Dirichlet allocation (LDA)
Absolute accuracy rate
Adjacent accuracy rate
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名面向垃圾短信过滤的亚文档集成学习
被引量:1
- 20
-
-
作者
刘伍颖
王琳
-
机构
广东外语外贸大学语言工程与计算实验室
-
出处
《郑州大学学报(理学版)》
CAS
北大核心
2017年第3期59-64,共6页
-
基金
国家语言文字工作委员会重点项目(ZDI 135-26)
广东省高校特色创新项目(2015KTSCX035)
-
文摘
针对垃圾短信过滤问题,提出了一种亚文档集成学习方法.该方法采用亚文档集成学习框架将短文本在线二值分类问题转化成若干个子分类问题,并通过线性组合多个子问题的分类结果得出最终的分类预测.利用基于串频索引的文本分类算法实现了一种有效的弱分类器.实验数据表明亚文档集成学习框架能够提高现有文本分类算法的效能,而在亚文档集成学习框架下,基于串频索引的弱分类器过滤效果最佳.
-
关键词
垃圾短信过滤
亚文档集成学习
串频索引
TREC评测
-
Keywords
SMS spam filtering
subdocument ensemble learning
string-frequency index
TREC evaluation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-