-
题名LDA模型在专利文本分类中的应用
被引量:43
- 1
-
-
作者
廖列法
勒孚刚
朱亚兰
-
机构
江西理工大学信息工程学院
-
出处
《现代情报》
CSSCI
北大核心
2017年第3期35-39,共5页
-
基金
国家自然科学基金项目"创新网络异质性与企业创新绩效关系研究"(项目编号:71462018)
江西省研究生创新专项基金资助项目"基于领域知识的LDA主题模型"(项目编号:YC2015-S304)
-
文摘
对传统专利文本自动分类方法中,使用向量空间模型文本表示方法存在的问题,提出一种基于LDA模型专利文本分类方法。该方法利用LDA主题模型对专利文本语料库建模,提取专利文本的文档-主题和主题-特征词矩阵,达到降维目的和提取文档间的语义联系,引入类的类-主题矩阵,为类进行主题语义拓展,使用主题相似度构造层次分类,小类采用KNN分类方法。实验结果:与基于向量空间文本表示模型的KNN专利文本分类方法对比,此方法能够获得更高的分类评估指数。
-
关键词
LDA
主题模型
专利文本分类
主题相似度
-
Keywords
LDA
topic model
patent text classification
topic similarity
-
分类号
G255.53
[文化科学—图书馆学]
G254.1
[文化科学—图书馆学]
-
-
题名基于LDA模型和分类号的专利技术演化研究
被引量:32
- 2
-
-
作者
廖列法
勒孚刚
-
机构
江西理工大学信息工程学院
-
出处
《现代情报》
CSSCI
北大核心
2017年第5期13-18,共6页
-
基金
国家自然科学基金项目"创新网络异质性与企业创新绩效关系研究"(项目编号:71462018)
江西省研究生创新专项基金资助项目"基于领域知识的LDA主题模型"(项目编号:YC2015-S304)
-
文摘
[目的 /意义]运用概率主题模型全面研究专利文献主题演化,分析专利技术发展过程及趋势。[方法/过程]LDA模型按时间窗口对专利文本建模,困惑度确定最优主题数,按专利文本结构特性提取主题向量,采用JS散度度量主题之间的关联,引入IPC分类号度量技术主题强度,最后实现主题强度、主题内容和技术主题强度3方面的演化研究。[结果 /结论]实验结果表明:该方法能够深入挖掘专利文献的主题,可以较好地分析专利技术随时间的演化规律,帮助相关从业人员了解专利技术的演化过程及趋势。
-
关键词
专利文献
LDA
JS散度
IPC分类号
技术主题强度
专利技术演化
-
Keywords
patent literature
LDA
JS divergence
IPC classification number
technical topic strength
patent technol- ogy evolution
-
分类号
G255.53
[文化科学—图书馆学]
-
-
题名隐式反馈场景中结合信任与相似度的排序推荐
被引量:2
- 3
-
-
作者
廖列法
朱亚兰
勒孚刚
-
机构
江西理工大学信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2018年第12期3614-3617,3631,共5页
-
基金
国家自然科学基金资助项目(71462018)
江西省研究生创新专项资金资助项目(YC2015-S304)
-
文摘
推荐系统作为解决信息过载问题的有效工具,能通过海量历史行为数据挖掘用户偏好,为其提供个性化推荐服务。针对如何利用隐式反馈数据实现个性化推荐进行研究,提出了一种结合信任与相似度的排序模型TSBPR。首先计算受信度与相似度的混合权重取代二值信任关系,并初始化新用户信任列表将新用户连接进信任网络;其次利用邻居的特征及信任矩阵修正目标用户的特征矩阵解决信任传递问题;最后通过在贝叶斯排序模型(Bayesian personalized ranking,BPR)中引入重新构建的信任模型及用户特征得到优化的模型参数并生成最终的项目排序列表。通过实验仿真,证明了TSBPR模型可以提高推荐性能和有效解决冷启动问题。
-
关键词
推荐系统
信任传播
冷启动
矩阵分解
-
Keywords
recommender system
trust propagation
cold-start
matrix factorization
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-