期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于自然标注信息和隐含主题模型的无监督文本特征抽取 被引量:4
1
作者 饶高琦 于东 荀恩东 《中文信息学报》 CSCD 北大核心 2015年第6期141-149,共9页
术语和惯用短语可以体现文本特征。无监督的抽取特征词语对诸多自然语言处理工作起到支持作用。该文提出了"聚类-验证"过程,使用主题模型对文本中的字符进行聚类,并采用自然标注信息对提取出的字符串进行验证和过滤,从而实现... 术语和惯用短语可以体现文本特征。无监督的抽取特征词语对诸多自然语言处理工作起到支持作用。该文提出了"聚类-验证"过程,使用主题模型对文本中的字符进行聚类,并采用自然标注信息对提取出的字符串进行验证和过滤,从而实现了从未分词领域语料中无监督获得词语表的方法。通过优化和过滤,我们可以进一步获得了富含有术语信息和特征短语的高置信度特征词表。在对计算机科学等六类不同领域语料的实验中,该方法抽取的特征词表具有较好的文体区分度和领域区分度。 展开更多
关键词 自然标注信息 自然语块 隐含主题模型 领域特征 文体特征
下载PDF
基于中文信息MMT模型的句法自动分析
2
作者 杨福义 《人工智能与机器人研究》 2018年第4期152-163,共12页
本文叙述采用中文信息MMT模型对句子进行句法自动分析的工程实践。研制了可在互联网在线运行的句法分析专家系统。对使用的理论、方法和工具作了详细介绍。介绍了粒计算与符号学理论在句法分析中的应用。研究了句法分析专家系统的组成... 本文叙述采用中文信息MMT模型对句子进行句法自动分析的工程实践。研制了可在互联网在线运行的句法分析专家系统。对使用的理论、方法和工具作了详细介绍。介绍了粒计算与符号学理论在句法分析中的应用。研究了句法分析专家系统的组成结构、实施方式和系统设计。最后列举了句子分析实例。在研究方法的决策中采用的是基于理性主义的规则方法。运用代数语言学的理论构建句法分析器专家系统,在研究中使用了中文信息MMT模型,研究结果表明,基于中文MMT模型是进一步解决处理当前句法分析问题的可借鉴的手段,减少了歧义和分析层次。其研究成果的意义在于可以检验语法规则,可以通过语料库的深加工而建立句子的语法模型结构,为深层次的自然语言理解,扩充语法知识库,为句法语义的深入研究提供实用的工具和模型。 展开更多
关键词 中文信息MMT模型 法符号 结构 句法分析 自然语块
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部