期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
跨行成句及其句型──格律诗语法研究
1
作者 侯友兰 《绍兴文理学院学报(哲学社会科学版)》 1997年第4期53-58,共6页
本文主要讨论并分析近体诗的行与句并非具有对等关系。指出从句法的角度看,一行持并非都是一个句子。在一些情况下,常常是两行诗句构成一个句子,甚至还有三行、四行诗句构成一个句子。同时还指出这些跨行成句的诗句所属的句子类型。... 本文主要讨论并分析近体诗的行与句并非具有对等关系。指出从句法的角度看,一行持并非都是一个句子。在一些情况下,常常是两行诗句构成一个句子,甚至还有三行、四行诗句构成一个句子。同时还指出这些跨行成句的诗句所属的句子类型。旨在有助于近作诗的学习者或爱好者在弄清句法结构、句子类型的基础上进一步理解诗意。 展开更多
关键词 主谓短语 格律诗 名词性短语 合成句 主语 时间状语 远宾语 谓词性宾语 谓语 李商隐
下载PDF
面向微博短文本分类的文本向量化方法比较研究 被引量:14
2
作者 李心蕾 王昊 +1 位作者 刘小敏 邓三鸿 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第8期41-50,共10页
【目的】利用Word2Vec和Sent2Vec算法生成新浪微博的文本的向量化表示形式,以期在文本分类时获得较低的计算成本和较高的分类效果。【方法】使用文本中词的0-1矩阵进行分类,将分类效果作为基准线;采用Word2Vec算法生成词向量并用不同方... 【目的】利用Word2Vec和Sent2Vec算法生成新浪微博的文本的向量化表示形式,以期在文本分类时获得较低的计算成本和较高的分类效果。【方法】使用文本中词的0-1矩阵进行分类,将分类效果作为基准线;采用Word2Vec算法生成词向量并用不同方式合成句子的向量表示,进行文本分类,并与基准线进行对比;利用Sent2Vec算法直接生成句子向量进行分类,综合评价3种方法的优缺点。【结果】研究显示使用Word2Vec算法和Sent2Vec算法能够极大程度上压缩文本特征,对比于使用所有3万多个词作为特征,Word2Vec算法和Sent2Vec算法将特征数压缩在1 000以内。在分类准确率方面,Word2Vec算法的分类准确率比基准线低约3%,准确率为75.14%。Sent2Vec算法的分类效果远不如其他两种方法,准确率只有63.08%。【局限】由于语料有限,Word2Vec算法在计算词向量时可能缺少足够的语义信息,导致词向量的准确性不高,而Sent2Vec算法在中文文本语境下生成句向量的分类结果较差。【结论】Word2Vec算法更适用大规模语料文本分类,在文本量较少时应使用词为特征分类。 展开更多
关键词 短文本分类 Word2Vec 口语化 文本词向量 合成句向量
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部