-
题名花园幽径模式行进错位的量化研究:计算语言学视角
被引量:1
- 1
-
-
作者
杜家利
于屏方
-
机构
广东外语外贸大学词典中心
南京大学外国语学院
广东外语外贸大学中国语言文化学院
-
出处
《中文信息学报》
CSCD
北大核心
2015年第5期31-38,62,共9页
-
基金
国家社科后期资助项目(12FYY019)
中国博士后第57批一等资助项目(2015M570424)
-
文摘
该文讨论了花园幽径模式行进错位过程中的困惑商指数。非对称性信息断层的存在导致解码呈现否定之否定的螺旋上升态势。行进错位的潜在效应幅度可通过困惑商指数得到测定。基于大数据语料库统计方法和在线剖析器分析方法,我们测算出优选结构困惑商指数介于(-∞,1];非优选结构困惑商指数介于[1,2];两结构临界值分别为0.72和1.28;歧义域为[0.72,1.28]。结论认为,多结构频数差异是导致困惑商指数变化的根本;行进错位的幅度和非对称性信息补偿的强度均与困惑商指数相关;基于统计的困惑商指数可对局部歧义的复杂句结构提供前瞻性解码信息。
-
关键词
计算语言学
花园幽径模式
行进错位
局部歧义
困惑商
-
Keywords
computational linguistics
garden path model
processing breakdown
local ambiguity
confusion quotient
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名英语花园幽径句的线性剖析:基于斯坦福解析器的分析
- 2
-
-
作者
杜家利
于屏方
-
机构
广东外语外贸大学语言工程与计算实验室
南京大学外国语学院
广东外语外贸大学中国语言文化学院
-
出处
《鲁东大学学报(哲学社会科学版)》
2017年第5期39-46,共8页
-
基金
国家留学基金项目(201507150009)&(201607150007)
中国博士后特别资助项目(2016T90440)和一等资助项目(2015M570424)
广东省社科项目(GD15HWW02)
-
文摘
本文讨论了美国斯坦福解析器在英语花园幽径句线性剖析中的不足。斯坦福解析器在句法上采用词汇化的概率上下文无关语法,在语义上使用词汇化的依存分析,其概率策略的使用极大地提高了系统剖析的效率和能力。但是,这种概率分析器在处理具有局部歧义效应的英语花园幽径句时却出现了系统性错位。本文从词类标注、句法剖析和依存关系分析入手,对低概率的英语花园幽径句的系统剖析错位进行了较全面的分析。结论是:斯坦福解析器对低概率英语花园幽径句的线性剖析不敏感,容易受句式的线性发展关系和认知模式的影响,其解码效率尚有提高的余地。
-
关键词
计算语言学
花园幽径模式
行进错位
局部歧义
斯坦福解析器
-
Keywords
computational linguistics
garden path model
processing breakdown
local ambiguity
Stanford Parser
-
分类号
H087
[语言文字—语言学]
-