主题模型(Topic Model)---LDA(Latent Dirichlet Allocation)理论+实战_topic模型-CSDN博客

网站介绍:文章浏览阅读5.1k次,点赞11次,收藏50次。主题模型顾名思义,主题模型用来探寻文本背后所隐藏的主题,也可以理解为一种段落语义的挖掘。相比于TF-IDF只能从个体词汇层面给予我们文本内容的提示,主题模型能够从更宏观的角度帮助我们快速捕捉文本的核心语义。LDA建模思路LDA是一种比较流行的主题模型,由吴恩达等人在2003年首次提出。它可以将文档集中每篇文章的主题以概率分布的形式给出,比如,我们可以从结果找选出概率最大的5个主题作为该文档的主题描述。下面我们来快速理解一下LDA的基本建模思路。(因为LDA背后涉及大量的数学知识,如果大家想对数学细节做_topic模型