摘要
文章分析了目前图书资源语义挖掘的自然语言处理现状,比较其中较为主流的主题模型和自然语言处理技术,如LSI、pLSI、LDA及NLTK等的衍进状况,尝试应用模块设计选择。初步阐释和设计了小型的面向某科研机构农业图书资源分类挖掘的主题模型,并给出了相应的评价指标。
This article analyzes the current status of natural language processing in the semantic mining of book resources, compares the mainstream topic models and natural language processing technologies such as LSI, pLSI, LDA and NLTK, and tries to apply module design selection. A small topic model for the classification and mining of agricultural book resources in a certain scientific research institution is explained and designed, and the corresponding evaluation indexes are given.
作者
龚浩
崔运鹏
钱平
Gong Hao;Cui Yun-peng;Qian Ping
出处
《图书馆理论与实践》
CSSCI
2018年第3期46-51,共6页
Library Theory and Practice
基金
中国农业科学院科技创新工程(项目编号:CAAS-ASTIP-2016-AII)支持
关键词
自然语言处理
农业图书资源
图书分类
语义挖掘
主题模型
Natural Language Processing
Agricultural Book Resources
Book Classification
Semantic Mining
Topic Model