期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于KNN算法的佚名诗词作者概率研究 被引量:1
1
作者 胡春月 《技术与市场》 2020年第11期69-70,共2页
针对南北朝时期的佚名诗词采取向量空间模型(VSM)来表示,并根据主成分分析技术(PCA)进行文本特性矩阵的降维,采用KNN的方法进行诗词的作者推测研究。通过实验获得了多篇佚名诗词的可能作者,对于相关文学研究具有一定参考价值。
关键词 向量空间模型 KNN 作者判别
下载PDF
基于机器学习的古典诗词作者的判别研究 被引量:4
2
作者 易勇 郑艳 +1 位作者 何中市 李良炎 《心智与计算》 2007年第3期359-364,共6页
主要基于机器学习的NaveBaye等方法,对诗词文本采用向量空间模型来表示,首次提出了中国古代诗人李白和杜甫作品判别计算模型,并采用了信息增益作为特征选择的依据,结合爬山法完善了计算模型,该模型已经在精典语料《全唐诗》的机器学... 主要基于机器学习的NaveBaye等方法,对诗词文本采用向量空间模型来表示,首次提出了中国古代诗人李白和杜甫作品判别计算模型,并采用了信息增益作为特征选择的依据,结合爬山法完善了计算模型,该模型已经在精典语料《全唐诗》的机器学习基础上得到实现,获得较好的诗人作品判别效果,准确度可达到98.3%,该方法已成功地推广到古典诗词的风格流派的机器判别上[1],准确度达到88.5%。本文提出了古典诗词研究的技术方向。 展开更多
关键词 自然语言处理 机器学习 文本分类 作品作者判别
原文传递
基于计量文体学的谷崎润一郎小说文体变化研究
3
作者 王子睿 刘善钰 《日语教育与日本学》 2023年第1期69-79,共11页
本研究基于数字人文视角,将谷崎润一郎的26部文学作品作为考察对象,使用词汇丰富度、句长文体测量指标和多变量分析方法的聚类分析对其文学作品进行了探究。既往的文学研究者认为谷崎润一郎在关东大地震后移居关西地区后,其文学文体理... 本研究基于数字人文视角,将谷崎润一郎的26部文学作品作为考察对象,使用词汇丰富度、句长文体测量指标和多变量分析方法的聚类分析对其文学作品进行了探究。既往的文学研究者认为谷崎润一郎在关东大地震后移居关西地区后,其文学文体理念发生了较大的变化。为了验证以上假说,本研究尝试使用计量文体学与文本挖掘的手法从语言现象、文体特征、文献作证三个角度进行论证。结果证明在1930年谷崎润一郎移居关西后其文体特征的确发生了显著的变化。 展开更多
关键词 计量文体学 谷崎润一郎 文体研究 作者判别
原文传递
Chapman-Kolmogorov equations for global PPIs with Discriminant-EM
4
作者 Md. Sarwar Kamal Mohammad Ibrahim Khan 《International Journal of Biomathematics》 2014年第5期95-101,共7页
Ongoing improvements in Computational Biology research have generated massive amounts of Protein-Protein Interactions (PPIs) dataset. In this regard, the availability of PPI data for several organisms provoke the di... Ongoing improvements in Computational Biology research have generated massive amounts of Protein-Protein Interactions (PPIs) dataset. In this regard, the availability of PPI data for several organisms provoke the discovery of computational methods for measurements, analysis, modeling, comparisons, clustering and alignments of biological data networks. Nevertheless, fixed network comparison is computationally stubborn and as a result several methods have been used instead. We illustrate a prohabilistic approach among proteins nodes that are part of various networks by using Chapman-Kolmogorov (CK) formula. We have compared CK formula with semi-Markov random method, SMETANA. We significantly noticed that CK outperforms the SMETANA in all respects such as efficiency, speed, space and complexity. We have modified the SMETANA source codes available in MATLAB in the light of CK formula. Discriminant-Expectation Maximization (D-EM) accesses the parameters of a protein network datasets and determines a linear transformation to simplify the assumption of probabilistic format of data distributions and find good features dynamically. Our implementation finds that D-EM has a satisfactory performance in protein network alignment applications. 展开更多
关键词 SMETANA semi-Markov method Chapman-Kolmogorov formula D-EM.
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部