推广

R数据分析:双连续变量交互作用的简单斜率图作图及解释

iseeyu2年前 (2024-02-21)推广181

R数据分析:双连续变量交互作用的简单斜率图作图及解释

可以看到交互作用是有的,下面准备画简单斜率图:

简单斜率图

两个连续变量放在回归方程中很好理解,在做交互的简单斜率图的时候我们就得指定水平,比如AB两个连续变量有交互作用,我们如果以A为x轴做简单斜率图,我们需要表达的是A的效应随着B的不同水平的不同而不同。

然而B是一个连续变量,所以我们此时得给B指定作图的水平。

指定水平时一般有三种方法:hand picking, quantiles, standard deviation。

我们先来看hand picking:

library(effects)
Inter.HandPick <- effect('IQ.C*Work.Ethic.C', GPA.Model.2,
                                              xlevels=list(IQ.C = c(-15, 0, 15),
                                              Work.Ethic.C = c(-1.1, 0, 1.1)),
                                              se=TRUE, confidence.level=.95, typical=mean)

Inter.HandPick <- as.data.frame(Inter.HandPick)
head(Inter.HandPick)

可以看到在我们指定的不同水平都有拟合系数均值:

R数据分析:双连续变量交互作用的简单斜率图作图及解释

有了上面的数据我们就可以做简单斜率图了:

Inter.HandPick$IQ <- factor(Inter.HandPick$IQ.C,
                      levels=c(-15, 0, 15),
                      labels=c("1 SD Below Population Mean", "Population Mean", "1 SD Above Population Mean"))

Inter.HandPick$Work.Ethic <- factor(Inter.HandPick$Work.Ethic.C,
              levels=c(-1.1, 0, 1.1),
              labels=c("Poor Worker", "Average Worker", "Hard Worker"))

library(ggplot2)                
Plot.HandPick<-ggplot(data=Inter.HandPick, aes(x=Work.Ethic, y=fit, group=IQ))+
      geom_line(size=2, aes(color=IQ))+
      ylim(0,4)+
      ylab("GPA")+
      xlab("Work Ethic")+
      ggtitle("Hand Picked Plot")

Plot.HandPick 

运行以上代码即得到简单斜率图:

R数据分析:双连续变量交互作用的简单斜率图作图及解释

因为我们选择的B的水平是levels=c(-15, 0, 15),而我们模拟的B也就是IQ的分布是一个以15为均值15为标准差的正态分布,而后进行了中心化,所以我们画简单斜率图选择的这个水平levels=c(-15, 0, 15)就是均值和加减一个标准差的水平。这个是我们自己选的,所以叫做hand picking。

对于这个简单斜率图的解释如下:

对于IQ均值在总体均值一个标准差以上的这些人,他们的学习态度越好那么GPA也越好,在普通IQ的学生中也有这么一种关系,但是比较弱一点,但是对于那些IQ低于人群一个标准差的同学,他们的学习态度再好,GPA好像也不增加。


我们接着看另外一种划分水平的方法—quantiles

首先我们将我们的B的水平****化****出来:

IQ.Quantile <- quantile(GPA.Data$IQ.C, probs=c(0,.25,.50,.75,1))
IQ.Quantile <- round(IQ.Quantile, 2)

其余的步骤和基本就一样了,依然还是先跑我们的B的不同水平的系数均值:

library(effects)

Inter.Quantile <- effect('IQ.C*Work.Ethic.C', GPA.Model.2,
                                      xlevels=list(IQ.C = c(-35.44, -9.78, -0.04, 9.89, 41.90),
                                      Work.Ethic.C = c(-1.1, 0, 1.1)),
                                      se=TRUE, confidence.level=.95, typical=mean)

Inter.Quantile <- as.data.frame(Inter.Quantile)

Inter.Quantile$IQ<-factor(Inter.Quantile$IQ.C,
                      levels=c(-35.44, -9.78, -0.04, 9.89, 41.90),
                      labels=c("0%", "25%", "50%", "75%", "100%"))

Inter.Quantile$Work.Ethic<-factor(Inter.Quantile$Work.Ethic.C,
              levels=c(-1.1, 0, 1.1),
              labels=c("Poor Worker", "Average Worker", "Hard Worker"))

然后再画图:

library(ggplot2) 
Plot.Quantile<-ggplot(data=Inter.Quantile, aes(x=Work.Ethic, y=fit, group=IQ))+
      geom_line(size=2, aes(color=IQ))+
      ylab("GPA")+
      xlab("Work Ethic")+
      scale_color_manual(values=c("#42c5f4","#54f284","#f45dcc",  
                             "#ff9d35","#d7afff"))+ 
      theme_bw()+ 
      theme(text = element_text(family="Impact", size=14, color="black"))+ #可以在这换字体
      ggtitle("Quantile Plot")

Plot.Quantile

R数据分析:双连续变量交互作用的简单斜率图作图及解释

对于上面图的解释相信大家都会了,这儿不多罗嗦,直接继续看第三种划分水平的方法


第三种划分水平的方法叫做Standard Deviation

其实我们第一种方法就是按照标准差划分的,所以这个做出来的图和第一种方法基本没有区别,首先还是水平划分:

IQ.SD <- c(mean(GPA.Data$IQ.C)-sd(GPA.Data$IQ.C),
           mean(GPA.Data$IQ.C),
           mean(GPA.Data$IQ.C)+sd(GPA.Data$IQ.C))

IQ.SD <- round(IQ.SD, 2)

然后做交互,得出系数均值:

Inter.SD <- effect(c("IQ.C*Work.Ethic.C"), GPA.Model.2,
                     xlevels=list(IQ.C=c(-14.75, 0, 14.75),
                                  Work.Ethic.C=c(-1.1, 0, 1.1))) 

Inter.SD <- as.data.frame(Inter.SD)

Inter.SD$IQ<-factor(Inter.SD$IQ.C,
                      levels=c(-14.75, 0, 14.75),
                      labels=c("1 SD Below Mean", "Mean", "1 SD Above Mean"))

Inter.SD$Work.Ethic<-factor(Inter.SD$Work.Ethic.C,
              levels=c(-1.1, 0, 1.1),
              labels=c("Poor Worker", "Average Worker", "Hard Worker"))

然后再出图:


Plot.SD<-ggplot(data=Inter.SD, aes(x=Work.Ethic, y=fit, group=IQ))+
      geom_line(size=1, aes(color=IQ))+ 
      geom_point(aes(colour = IQ), size=2)+ 
      geom_ribbon(aes(ymin=fit-se, ymax=fit+se),fill="gray",alpha=.6)+ 
      ylim(0,4)+ 
      ylab("GPA")+ 
      xlab("Work Ethic")+ 
      ggtitle("Standard Deviation Plot")+ 
      theme_bw()+ #Removes the gray background 
      theme(panel.grid.major=element_blank(),
          panel.grid.minor=element_blank(),
          legend.key = element_blank())+ #Removes the lines 
     scale_fill_grey()
Plot.SD

R数据分析:双连续变量交互作用的简单斜率图作图及解释

此图的解释和第一种方法一模一样哈。

小结

今天给大家写了回归中双连续变量交互作用的简单斜率图的画法和解释,之后会给大家写有分类变量的交互,感谢大家耐心看完。发表这些东西的主要目的就是督促自己,希望大家关注评论指出不足,一起进步。内容我都会写的很细,用到的数据集也会在原文中给出链接,你只要按照文章中的代码自己也可以做出一样的结果,一个目的就是零基础也能懂,因为自己就是什么编程基础没有从零学Python和R的,加油。数据分析题咨询,代处理请私信。

(站外链接发不了,请关注后私信回复“数据链接”获取本头条号所有使用数据)

往期内容:

R数据分析:双因素方差分析与交互作用检验

python机器学习:机器学习模型评价-交叉验证与留一验证

扫描二维码推送至手机访问。

版权声明:本文由西安泽虎代运营发布,如需转载请注明出处。

转载请注明出处https://www.0291.com.cn/post/56898.html

相关文章

seo优化不仅是优化网站更是对用户需求的一种优化。

seo优化不仅是优化网站更是对用户需求的一种优化。

SEO(SEO)是指以搜索引擎为推广目的,以网站为基础的技术操作来提升自然排名的方法。它以良好的搜索引擎性能和良好的用户体验为标准,能够更好地将访问者转化为客户的企业网站。所有营销型网站首先要符合SEO,而SEO排名是网站推广的最重要手段之一,网站不是一件艺术品。它应该是清晰的,方便用户浏览。...

10种高效思考方式打造职场竞争力,构建系统性思维

图:图虫<▼点击标题查看文档▼>系统创新——让“创新”不再是件难事 - MBA智库文档什么是系统创新思维?系统创新思维( Systematic Inventive Thinking ),简称SIT,是一个起源于90年代中期以色列的思维理论,是针对创造力、创新和问...

软文一般适合投放到哪些平台?

软文一般适合投放到哪些平台?

软文一般适合投放到哪些平台?...

初创企业线上线下主流的推广方式有哪些?

初创企业线上线下主流的推广方式有哪些?

现在,在一切都要直面互联网的今天,如何做到让受众快速的知晓我们的产品与?多种方式应该如何选择?以下是千米网的推广总监梁庭飞针对初创的零售企业和企业给到一些建议。一、主流的推广方式二、适合在线零售企业的推广1、SEM:对于零售商家,一般高单价产品可考虑用此类方式,有一定的获客...

教你SEO优化入门的重点是什么。

教你SEO优化入门的重点是什么。

seo新手该怎么在的时候打好基础这很重要。对于大部分做seo优化推广工作的新手来说,由于缺少一定的经验和知识,容易进入SEO误区往往会导致事倍功半。这对网站甚至SEO推广工作都会造成一定不同程度的影响,严重的网站被K或者放弃SEO优化工作。所以小编今天分享的是seo优化的入门,大家可以了解一下。...

网站的站内优化与站外优化方法。

网站的站内优化与站外优化方法。

网站优化可分为非现场优化和现场优化。建议使用白帽SEO来维护网络生态的绿色发展。 一、 站内优化 1、站内优化的作用: 站内优化的优势在于,让你网站的内页与百度、谷歌、火狐等搜索引擎建立良好的“社交”关系,更好地被搜索引擎收录,对搜索引擎更加友好,提升排名。搜索引擎对你很友好,你网站的权重会逐...

现在,非常期待与您的又一次邂逅

我们努力让每一部企业宣传片和抖音短视频成为商业大片