核心内容摘要
ai赋能,让快马平台自动生成r语言用户聚类分析与画像项目代码
咱们在数据分析的时候经常要面对数据中存在缺失值的情况咱们通常会使用mice包进行多重插补但是mice包插补通常是建立在线性或者回归模型上的这个就要求你的数据正态分布或者近似正态分布如果你的数据偏态分布太厉害有可能会插补不成功。
最近有粉丝提问说数据插补不成功如上图所示主要是数据偏态分布太严重了我来演示一下先导入数据和R包library(survival)library(scitable)library(mice)setwd(E:/公众号文章2026年/多重插补插补不了怎么办)data-read.csv(data.csv,sep,,headerTRUE)咱们可以看到数据有很多缺失值的先整理数据主要是把分类变量转成因子这步没什么特别out-organizedata2(datadata,usernameusername,tokentoken,exploreT)data-out[[data]]咱们常规使用mice包差补一下看看impdata-mice::mice(data,m5,maxit5,seed