一个爱生活的地理土博,分享GIS、遥感、空间分析、R语言、景观生态等地理数据科学实操教程、经典文献、数据资源
今天看啥  ›  专栏  ›  走天涯徐小洋地理数据科学

R 语言文本分析|文档主题建模

走天涯徐小洋地理数据科学  · 公众号  ·  · 2024-07-08 18:29

文章预览

为了让大家更好的理解本文内容,欢迎各位培训班会员参加明晚 8 点的直播课: 「文档主题建模」 。 该课程是系列课程「R 语言文本分析」的最新课时,之前的课时有: R 和 RStudio 的安装及初识文本分析 R 语言预备知识 字符串处理、正则表达式与整洁文本数据 词频统计、中文文本分词与词云图的绘制 词频、逆文档频率指数与 TF-IDF 分析 R语言情感分析与情感词云图绘制 词语间的相关性:n-grams 与相关性 中文文本 n-grams 与相关性 调用百度大脑接口进行文本情感倾向分析 整洁与非整洁文本数据的相互转换 在文本数据挖掘中,我们经常需要对很多文档进行分类。主题建模就是一种对此类文档进行无监督分类的方法,类似于对数值数据进行聚类,即使我们不知道这些文档们的主题分类,也能够进行分组。 潜在狄利克雷分配 (LDA:Latent Dirichlet allocation ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览