文章预览
为了让大家更好的理解本文内容,欢迎各位培训班会员参加明晚 8 点的直播课: 「文档主题建模」 。 该课程是系列课程「R 语言文本分析」的最新课时,之前的课时有: R 和 RStudio 的安装及初识文本分析 R 语言预备知识 字符串处理、正则表达式与整洁文本数据 词频统计、中文文本分词与词云图的绘制 词频、逆文档频率指数与 TF-IDF 分析 R语言情感分析与情感词云图绘制 词语间的相关性:n-grams 与相关性 中文文本 n-grams 与相关性 调用百度大脑接口进行文本情感倾向分析 整洁与非整洁文本数据的相互转换 在文本数据挖掘中,我们经常需要对很多文档进行分类。主题建模就是一种对此类文档进行无监督分类的方法,类似于对数值数据进行聚类,即使我们不知道这些文档们的主题分类,也能够进行分组。 潜在狄利克雷分配 (LDA:Latent Dirichlet allocation
………………………………