当前在线人数13155
首页 - 分类讨论区 - 学术学科 - 统计版 - 同主题阅读文章

此篇文章共收到打赏
0

  • 10
  • 20
  • 50
  • 100
您目前伪币余额:0
未名交友
[更多]
[更多]
问个scatter plot的问题
[版面:统计][首篇作者:Rutland] , 2019年04月15日02:23:19 ,483次阅读,4次回复
来APP回复,赚取更多伪币 关注本站公众号:
[分页:1 ]
Rutland
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 1 ]

发信人: Rutland (樱桃), 信区: Statistics
标  题: 问个scatter plot的问题
发信站: BBS 未名空间站 (Mon Apr 15 02:23:19 2019, 美东)

有4组的数据,包含两个变量:人的年龄和毕业花费的年数(时间)。

Hypothesis: 人的年纪越大,毕业花费的年数越长。


这4组数据实际上是4个学年的学生的数据,unduplicated counts.

我需要把这4组数据按不同年份分析,还是把4年的学生年龄都放在一起,把毕业所用时
间放在一起作为dependent variable,做一个简单的scatter plot就可以?我看不出按4
个年份分析的特出意义。

谢谢。



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2001:558:6033:1]

 
Bighappy
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 2 ]

发信人: Bighappy (快乐大大大), 信区: Statistics
标  题: Re: 问个scatter plot的问题
发信站: BBS 未名空间站 (Mon Apr 29 14:19:49 2019, 美东)


【 在 Rutland (樱桃) 的大作中提到: 】
: 有4组的数据,包含两个变量:人的年龄和毕业花费的年数(时间)。
: Hypothesis: 人的年纪越大,毕业花费的年数越长。
: 这4组数据实际上是4个学年的学生的数据,unduplicated counts.
: 我需要把这4组数据按不同年份分析,还是把4年的学生年龄都放在一起,把毕业所用时
: 间放在一起作为dependent variable,做一个简单的scatter plot就可以?我看不出
按4
: 个年份分析的特出意义。
: 谢谢。


这里面人的年龄是指的入学年龄,毕业花费的年数(时间)是毕业年龄减去入学年龄,
这两个变量和学生所处的学年没有关系,所以全部合在一起做是合理的。
将Hypothesis稍微改一下: 人的入学年纪越大,毕业花费的年数越长。
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 50.]

 
Rutland
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 3 ]

发信人: Rutland (樱桃), 信区: Statistics
标  题: Re: 问个scatter plot的问题
发信站: BBS 未名空间站 (Wed May  1 00:28:51 2019, 美东)

太感谢了!:)

昨天一直看前一个帖子,没看到这个帖子的回复。

想再问一个问题:scatter plot 对nonlinear regression 也可以作吧?

把所有的年份和毕业时间放到一起的时候通过explore作了一个homogeniety normality
的测试。发现F value是significant,所以表示不能作linear regression analysis.

但是没有linear的relationship,也可以用scatter plot表现一下吧。做scatter plot
时发现有outlier. 可以remove outliers然后再一次scatter plot 或regression
analysis吗? 

谢谢!:) 20伪币。


【 在 Bighappy (快乐大大大) 的大作中提到: 】
: 按4
: 这里面人的年龄是指的入学年龄,毕业花费的年数(时间)是毕业年龄减去入学年龄,
: 这两个变量和学生所处的学年没有关系,所以全部合在一起做是合理的。
: 将Hypothesis稍微改一下: 人的入学年纪越大,毕业花费的年数越长。



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2001:558:6033:1]

 
Bighappy
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 4 ]

发信人: Bighappy (快乐大大大), 信区: Statistics
标  题: Re: 问个scatter plot的问题
发信站: BBS 未名空间站 (Wed May  1 10:35:23 2019, 美东)


【 在 Rutland (樱桃) 的大作中提到: 】
: 太感谢了!:)
: 昨天一直看前一个帖子,没看到这个帖子的回复。
: 想再问一个问题:scatter plot 对nonlinear regression 也可以作吧?
: 把所有的年份和毕业时间放到一起的时候通过explore作了一个homogeniety
normality
: 的测试。发现F value是significant,所以表示不能作linear regression analysis.
: 但是没有linear的relationship,也可以用scatter plot表现一下吧。做scatter
plot
: 时发现有outlier. 可以remove outliers然后再一次scatter plot 或regression
: analysis吗? 
: 谢谢!:) 20伪币。

Scatter plot可以针对任何数据,不管两组数据之间是linear还是nonlinear的关系。
发现outlier然后将其拿掉再做regression的做法非常不可取。如何处理outlier必须结
合数据的实际情况来处理,在没有见到你的数据之前,我无法妄下结论。
另外,我倒是很担心你是如何把所有的年份和毕业时间做的normality test,难道不成
你的数据中还有2018,2017这样的年份当成变量来做的?
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 50.]

 
Rutland
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 5 ]

发信人: Rutland (樱桃), 信区: Statistics
标  题: Re: 问个scatter plot的问题
发信站: BBS 未名空间站 (Wed May  1 23:06:05 2019, 美东)

谢谢解释scatter plot!:)


我4个学年作个4个scatter plot, 每年得出的R Squared value都在0.2左右,所以就把
4年的连在一起想不分年份的作了一个regression analysis,测试homogeneity
normality时,4年放在一起和4年分别的都做了,F值总是很大,p值也是significant,
所以觉得不能作regression analysis了,至少不做linear的,nonliear regression也
挺复杂,就做一个4年连在一起的scatter plot, 汇报一下R squared value,而且像你
建议的,不去掉outliers, 因为今天测试了一下outlier, 也没发现strong outliers,
带星号*的那种。你觉得怎样:)

谢谢!


【 在 Bighappy (快乐大大大) 的大作中提到: 】
: normality
: plot
: Scatter plot可以针对任何数据,不管两组数据之间是linear还是nonlinear的关系。
: 发现outlier然后将其拿掉再做regression的做法非常不可取。如何处理outlier必须结
: 合数据的实际情况来处理,在没有见到你的数据之前,我无法妄下结论。
: 另外,我倒是很担心你是如何把所有的年份和毕业时间做的normality test,难道不成
: 你的数据中还有2018,2017这样的年份当成变量来做的?



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2001:558:6033:1]

[分页:1 ]
[快速返回] [ 进入统计讨论区] [返回顶部]
回复文章
标题:
内 容:

未名交友
将您的链接放在这儿

友情链接


 

Site Map - Contact Us - Terms and Conditions - Privacy Policy

版权所有,未名空间(mitbbs.com),since 1996