期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
跨行成句及其句型──格律诗语法研究
1
作者
侯友兰
《绍兴文理学院学报(哲学社会科学版)》
1997年第4期53-58,共6页
本文主要讨论并分析近体诗的行与句并非具有对等关系。指出从句法的角度看,一行持并非都是一个句子。在一些情况下,常常是两行诗句构成一个句子,甚至还有三行、四行诗句构成一个句子。同时还指出这些跨行成句的诗句所属的句子类型。...
本文主要讨论并分析近体诗的行与句并非具有对等关系。指出从句法的角度看,一行持并非都是一个句子。在一些情况下,常常是两行诗句构成一个句子,甚至还有三行、四行诗句构成一个句子。同时还指出这些跨行成句的诗句所属的句子类型。旨在有助于近作诗的学习者或爱好者在弄清句法结构、句子类型的基础上进一步理解诗意。
展开更多
关键词
主谓短语
格律诗
名词性短语
合成句
主语
时间状语
远宾语
谓词性宾语
谓语
李商隐
下载PDF
职称材料
面向微博短文本分类的文本向量化方法比较研究
被引量:
14
2
作者
李心蕾
王昊
+1 位作者
刘小敏
邓三鸿
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2018年第8期41-50,共10页
【目的】利用Word2Vec和Sent2Vec算法生成新浪微博的文本的向量化表示形式,以期在文本分类时获得较低的计算成本和较高的分类效果。【方法】使用文本中词的0-1矩阵进行分类,将分类效果作为基准线;采用Word2Vec算法生成词向量并用不同方...
【目的】利用Word2Vec和Sent2Vec算法生成新浪微博的文本的向量化表示形式,以期在文本分类时获得较低的计算成本和较高的分类效果。【方法】使用文本中词的0-1矩阵进行分类,将分类效果作为基准线;采用Word2Vec算法生成词向量并用不同方式合成句子的向量表示,进行文本分类,并与基准线进行对比;利用Sent2Vec算法直接生成句子向量进行分类,综合评价3种方法的优缺点。【结果】研究显示使用Word2Vec算法和Sent2Vec算法能够极大程度上压缩文本特征,对比于使用所有3万多个词作为特征,Word2Vec算法和Sent2Vec算法将特征数压缩在1 000以内。在分类准确率方面,Word2Vec算法的分类准确率比基准线低约3%,准确率为75.14%。Sent2Vec算法的分类效果远不如其他两种方法,准确率只有63.08%。【局限】由于语料有限,Word2Vec算法在计算词向量时可能缺少足够的语义信息,导致词向量的准确性不高,而Sent2Vec算法在中文文本语境下生成句向量的分类结果较差。【结论】Word2Vec算法更适用大规模语料文本分类,在文本量较少时应使用词为特征分类。
展开更多
关键词
短文本分类
Word2Vec
口语化
文本词向量
合成句
向量
原文传递
题名
跨行成句及其句型──格律诗语法研究
1
作者
侯友兰
出处
《绍兴文理学院学报(哲学社会科学版)》
1997年第4期53-58,共6页
文摘
本文主要讨论并分析近体诗的行与句并非具有对等关系。指出从句法的角度看,一行持并非都是一个句子。在一些情况下,常常是两行诗句构成一个句子,甚至还有三行、四行诗句构成一个句子。同时还指出这些跨行成句的诗句所属的句子类型。旨在有助于近作诗的学习者或爱好者在弄清句法结构、句子类型的基础上进一步理解诗意。
关键词
主谓短语
格律诗
名词性短语
合成句
主语
时间状语
远宾语
谓词性宾语
谓语
李商隐
分类号
C55 [社会学]
下载PDF
职称材料
题名
面向微博短文本分类的文本向量化方法比较研究
被引量:
14
2
作者
李心蕾
王昊
刘小敏
邓三鸿
机构
南京大学信息管理学院
江苏省数据工程与知识服务重点实验室
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2018年第8期41-50,共10页
基金
国家自然科学基金项目"面向学术资源的TSD与TDC测度及分析研究"(项目编号:71503121)
"江苏青年社科英才"人才培养项目的研究成果之一
文摘
【目的】利用Word2Vec和Sent2Vec算法生成新浪微博的文本的向量化表示形式,以期在文本分类时获得较低的计算成本和较高的分类效果。【方法】使用文本中词的0-1矩阵进行分类,将分类效果作为基准线;采用Word2Vec算法生成词向量并用不同方式合成句子的向量表示,进行文本分类,并与基准线进行对比;利用Sent2Vec算法直接生成句子向量进行分类,综合评价3种方法的优缺点。【结果】研究显示使用Word2Vec算法和Sent2Vec算法能够极大程度上压缩文本特征,对比于使用所有3万多个词作为特征,Word2Vec算法和Sent2Vec算法将特征数压缩在1 000以内。在分类准确率方面,Word2Vec算法的分类准确率比基准线低约3%,准确率为75.14%。Sent2Vec算法的分类效果远不如其他两种方法,准确率只有63.08%。【局限】由于语料有限,Word2Vec算法在计算词向量时可能缺少足够的语义信息,导致词向量的准确性不高,而Sent2Vec算法在中文文本语境下生成句向量的分类结果较差。【结论】Word2Vec算法更适用大规模语料文本分类,在文本量较少时应使用词为特征分类。
关键词
短文本分类
Word2Vec
口语化
文本词向量
合成句
向量
Keywords
Short Text Classification
Word2Vec
Colloquial Text
Word Vector Composition
Sentence Vector
分类号
TP393 [自动化与计算机技术—计算机应用技术]
G350 [文化科学—情报学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
跨行成句及其句型──格律诗语法研究
侯友兰
《绍兴文理学院学报(哲学社会科学版)》
1997
0
下载PDF
职称材料
2
面向微博短文本分类的文本向量化方法比较研究
李心蕾
王昊
刘小敏
邓三鸿
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2018
14
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部