Hi,大家好,我是编程小6,很荣幸遇见你,我把这些年在开发过程中遇到的问题或想法写出来,今天说一说
R语言期末考试题库及详解答案_R在世界语言有多少种发音,希望能够帮助你!!!。
不管它叫啥,就是一种对数据的可视化方法,可同时描述数据的概率密度和统计量。
当我们获得几组数据的时候,想看一看他们的统计量,在R中可以使用命令:summary() ,会将五分位数和均值等输出到 「Console」。但是相比于文字,一般人对图像的理解要更好,所以可以使用**箱线图(BoxPlot)**展示其统计量(下左),这时就会出现一个问题,(下左)几个箱线图似乎都一样,难道意味着这些组数据都一样?当我们把原始数据点添加上去(下右),就会发现数据之间的不同:数据的分布密度是不一样的。
这个时候就可以使用「 小提琴图(ViolinPlot)」描述数据的分布密度:
这时,有人就把这些东西都集合到了一起:云雨图(RainCloud Plot),一半儿的小提琴 + 箱线图 + 数据点
需要的「R Packages」:ggdist、 tidyquant、 tidyverse
需要的「数据集」:mpg
(源自ggplot2)
# LIBRARIES ---- library(ggdist) library(tidyquant) library(tidyverse) # DATA ----- mpg
mpg %>% filter(cyl %in% c(4, 6, 8)) %>% ggplot(aes(x = factor(cyl), y = hwy, fill = factor(cyl)))
ggdist::stat_halfeye()
# add half-violin from {ggdist} package ggdist::stat_halfeye( ## custom bandwidth adjust = 0.5, ## move geom to the right justification = -.2, ## remove slab interval .width = 0, point_colour = NA )
ggplot2::geom_boxplot()
,限制宽度和不透明度geom_boxplot( width = .12, ## remove outliers outlier.color = NA, alpha = 0.5 )
ggdist::stat_dots()
# Add dot plots from {ggdist} package ggdist::stat_dots( ## orientation to the left side = "left", ## move geom to the left justification = 1.1, ## adjust grouping (binning) of observations binwidth = .25 )
6.「微 」调细节:tidyquant::theme_tq() + coord_flip()
scale_fill_tq() + theme_tq() + labs( title = "Raincloud Plot", subtitle = "Showing the Bi-Modal Distribution of 6 Cylinder Vehicles", x = "Engine Size (No. of Cylinders)", y = "Highway Fuel Economy (MPG)", fill = "Cylinders" ) + coord_flip()
# LIBRARIES ---- library(ggdist) library(tidyquant) library(tidyverse) # DATA ----- mpg # RAINCLOUD PLOTS ---- # Powerful for visualizing modality of distributions mpg %>% filter(cyl %in% c(4, 6, 8)) %>% ggplot(aes(x = factor(cyl), y = hwy, fill = factor(cyl))) + # add half-violin from {ggdist} package ggdist::stat_halfeye( ## custom bandwidth adjust = 0.5, ## move geom to the right justification = -.2, ## remove slab interval .width = 0, point_colour = NA ) + geom_boxplot( width = .12, ## remove outliers outlier.color = NA, alpha = 0.5 ) + # Add dot plots from {ggdist} package ggdist::stat_dots( ## orientation to the left side = "left", ## move geom to the left justification = 1.1, ## adjust grouping (binning) of observations binwidth = .25 ) + # Adjust theme scale_fill_tq() + theme_tq() + labs( title = "Raincloud Plot", subtitle = "Showing the Bi-Modal Distribution of 6 Cylinder Vehicles", x = "Engine Size (No. of Cylinders)", y = "Highway Fuel Economy (MPG)", fill = "Cylinders" ) + coord_flip()
今天的分享到此就结束了,感谢您的阅读,如果确实帮到您,您可以动动手指转发给其他人。
上一篇
已是最后文章
下一篇
已是最新文章