-
题名基于语义依存关系的汉语语料库的构建
被引量:17
- 1
-
-
作者
尤昉
李涓子
王作英
-
机构
清华大学电子工程系
清华大学计算机科学与技术系
-
出处
《中文信息学报》
CSCD
北大核心
2003年第1期46-53,共8页
-
文摘
语料库是自然语言处理中用于知识获取的重要资源。本文以句子理解为出发点 ,讨论了在设计和建设一个基于语义依存关系的汉语大规模语料库过程中的几个基础问题 ,包括 :标注体系的选择、标注关系集的确定 ,标注工具的设计 ,以及标注过程中的质量控制。该语料库设计规模 10 0万词次 ,利用 70个语义、句法依存关系 ,在已具有语义类标记的语料上进一步标注句子的语义结构。其突出特点在于将《知网》语义关系体系的研究成果和具体语言应用相结合 ,对实际语言环境中词与词之间的依存关系进行了有效的描述 ,它的建成将为句子理解或基于内容的信息检索等应用提供更强大的知识库支持。
-
关键词
计算机应用
中文信息处理
语料库
语义依存关系
汉语
-
Keywords
computer application
Chinese information processing
corpus
semantic dependency relations
HowNet
Event Role & Features
-
分类号
H08
[语言文字—语言学]
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于《知网》的中文信息结构抽取研究
被引量:4
- 2
-
-
作者
尤昉
李涓子
王作英
-
机构
清华大学电子工程系
清华大学计算机科学与技术系
-
出处
《计算机工程与应用》
CSCD
北大核心
2002年第18期56-58,共3页
-
基金
国家863高技术研究发展计划项目(编号:863-306-ZD03-02-1)
985重大项目"人机自然语言交互技术"(编号:985校-22-攻关-06)资助
-
文摘
文章提出了一种在真实文本中抽取中文信息结构的方法—利用大规模基于语义依存关系的语料库对《知网》的中文信息结构模式进行训练,用这些带概率的模式作为规则建立部分依存分析器,从而从真实文本中最大限度地抽取符合知网中文信息结构定义的短语。该研究除了对将要建立的基于语义依存关系的语言模型是个有益的补充外,对于文本理解、对话系统甚至语音合成中的重音预测、韵律建模等等方面都有十分广阔的应用前景。
-
关键词
《知网》
中文信息结构
部分依存分析器
中文信息处理
信息抽取
-
Keywords
HowNet,Chinese Message Structure(CMS ),partial dependency parser,rule
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名薄荷脑-β-环状糊精包结物包结方法的研究
被引量:5
- 3
-
-
作者
尤昉
徐立群
陈利青
-
机构
上海中药一厂
-
出处
《中成药》
CAS
CSCD
北大核心
1995年第8期1-2,共2页
-
文摘
探讨了薄荷脑-β-CD包结物的包结方法,并用气相色谱法分别对包结物中包结与未包结薄荷脑进行测定,初步得到包结物收率为92%左右。
-
关键词
薄荷脑
β-环类糊精
包络物
包络法
-
Keywords
menthol,β-cyclodextrin inclusion compound
-
分类号
TQ461
[化学工程—制药化工]
-