這篇文章給大家分享的是有關(guān)R語言histogram怎么用的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過來看看吧。
10年積累的成都網(wǎng)站制作、成都做網(wǎng)站經(jīng)驗(yàn),可以快速應(yīng)對客戶對網(wǎng)站的新想法和需求。提供各種問題對應(yīng)的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認(rèn)識你,你也不認(rèn)識我。但先網(wǎng)站制作后付款的網(wǎng)站建設(shè)流程,更有蒙城免費(fèi)網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。最近小仙同學(xué)很是煩惱,本以為自己已經(jīng)掌握了ggplot2作圖的語法,用read.csv(),ggplot()+geom_point()/boxplot()/violinplot()…就可以畫遍天下圖表,結(jié)果卻發(fā)現(xiàn)到真正畫圖的時(shí)候,還是會(huì)出現(xiàn)不少的小問題。
比如小仙最近要畫一個(gè)直方圖,最開始用hist()函數(shù)試了一下,看了下形狀, 好像因?yàn)?strong>數(shù)據(jù)取值范圍跨度太大(較大值104,724,最小值30),這個(gè)圖畫出來有點(diǎn)丑,于是決定用ggplot美化一下。
調(diào)整之后好看是好看了,但是大家有沒有看出什么不對的地方,明明bins=10但是只畫出8個(gè)格子,之后調(diào)整bins的值,每次都會(huì)比我指定的值少2個(gè)格子。而且,圖中第一個(gè)格子(取值范圍0-1250)應(yīng)該有700多個(gè)數(shù)據(jù),但是圖上顯示只有不到300個(gè),問題出在哪里呢?小仙同學(xué)百思不得其解。在geom_histogram()函數(shù)中,bins就是用來指定分組數(shù)目(格子),為什么總是會(huì)少兩個(gè)?
小仙同學(xué)考慮到自己能力有限,決定量力而行,另辟蹊徑。
于是設(shè)置另外一個(gè)參數(shù)breaks,終于找回了丟失的格子
經(jīng)過此事,小仙同學(xué)深刻認(rèn)識到了自己的有限水平,哈哈。不過還是分享一下,希望能幫助到大家。實(shí)際的數(shù)據(jù)可真是比書上的例子難處理呢。
按照慣例寫一下整個(gè)作圖的過程。
首先要把你想要繪圖的數(shù)據(jù)調(diào)整成R語言可以識別的格式,建議大家在excel中保存成csv格式。
data<-read.csv(“your file path”, header = T) #注釋:header=T表示數(shù)據(jù)中的第一行是列名,如果沒有列名就用header=F
library(ggplot2) #注釋:package使用之前需要調(diào)用
p<-ggplot(data, aes(x=data$銷量)) + geom_histogram(breaks=seq(0,10000,1000))+ xlim(0,10000) p
感謝各位的閱讀!關(guān)于“R語言histogram怎么用”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學(xué)到更多知識,如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!