摘要
“中医药文献语料库系统”是汉语语料库建设中的一个分支,是在北京大学计算机语言所开发的“汉语文本切分与词性标注工具”的基础上,利用中医药专业切分词典再次加工而成,是为面向中医药文本内容理解的需要而设计研制的。其中中医药文献语料库是该系统中的基础数据,本语料库根据内容属性分为20个子目,每个子目下又各有细分类,共计四级分类。目前已经部分完成自动分词和词性自动标注的处理工作。
出处
《中国中医药信息杂志》
CAS
CSCD
2007年第9期101-102,共2页
Chinese Journal of Information on Traditional Chinese Medicine
基金
国家重点基础研究发展计划(973)项目(2004CB318102)