-
题名基于典型句型的词语搭配定量分析及提取算法
被引量:6
- 1
-
-
作者
王璐
张仰森
-
机构
北京信息科技大学
-
出处
《计算机科学》
CSCD
北大核心
2012年第B06期232-234,270,共4页
-
基金
国家自然科学基金(60873013
61070119)
+1 种基金
北京大学计算语言学教育部重点实验室开放课题基金(KLCL-1005)
北京市属市管高等学校人才强教计划项目(PHR201007131)资助
-
文摘
在分析现有的词语搭配自动提取算法的不足后,提出了一种新的词语搭配提取算法,尝试从非结构化语言知识到结构化语言知识的转化。基于词语搭配的语言学知识,构建了基于典型句型的词语搭配模型,其以动词、名词及形容词为中心词分类搭配,以实词为主干提取搭配,利用共现频率及互信息等统计学模型在大规模语料库中进行筛选,固化这些搭配知识,构建搭配知识库。
-
关键词
词语搭配
典型句型
互信息
搭配数据库
-
Keywords
collocation; typical patterns; mi; collocation database
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名中国学生英语动词语法和词汇型式使用特点初探
被引量:62
- 2
-
-
作者
濮建忠
闵行
东川路
800号
-
机构
上海交通大学
-
出处
《现代外语》
CSSCI
北大核心
2000年第1期24-44,共21页
-
文摘
中国学生的英语有其自身的特点 ,了解和掌握他们的语言特点对英语教学和研究至关重要。本文通过对3个较为常用的英语动词的使用情况的调查 ,试图说明在动词的使用中还有一些重要的、关键性的信息 ,即动词的语法型式和词汇型式 ,没有为英语教师和学习者所普遍掌握。这也是大学生在英语动词用法上之所以表现偏常的重要原因。该研究方法适用于对其他英语常用动词的研究 ,同时对研究其他词类 ,包括名词、形容词、副词等 ,也将提供研究思路和方法。
-
关键词
动词
意义
型式
搭配
典型性
-
Keywords
verb
meaning
pattern
collocation
typicality
-
分类号
H319.1
[语言文字—英语]
-
-
题名极大规模词语搭配库的建造和构成分析
被引量:2
- 3
-
-
作者
徐润华
陈小荷
-
机构
南京师范大学文学院
-
出处
《南京师范大学文学院学报》
CSSCI
2011年第3期56-61,共6页
-
基金
江苏省哲学社会科学基金一般项目(项目号:10YYB007)
国家社会科学青年基金项目(项目号:10CYY021)和(项目号:11CYY030)的资助
-
文摘
大规模词语搭配库的建造在自然语言处理领域的诸多方面都有着迫切的需求。本文利用哈工大、伯克利、斯坦福三所大学分别研制开发的三个句法分析器,对9年《人民日报》语料进行了句法分析,通过对三个分析结果的合并比对得到候选搭配;在此基础上通过参数及类型优选进一步提升搭配精度,最终得到规模约为136万的搭配型数据及相关统计信息并以此构建了词语搭配库。词语搭配库中包含了6种常见类型的搭配数据,并且保证了较好的正确率,可以为其它相关工作提供可靠的数据支持。
-
关键词
词语搭配库
句法分析
搭配类型
最优参数
-
Keywords
database of words collocation
syntax analysis
collocation patterns
optimal parameters
-
分类号
H03
[语言文字—语言学]
-