真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

R語(yǔ)言線(xiàn)性回歸怎么使用

這篇文章主要講解了“R語(yǔ)言線(xiàn)性回歸怎么使用”,文中的講解內(nèi)容簡(jiǎn)單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來(lái)研究和學(xué)習(xí)“R語(yǔ)言線(xiàn)性回歸怎么使用”吧!

目前成都創(chuàng)新互聯(lián)已為數(shù)千家的企業(yè)提供了網(wǎng)站建設(shè)、域名、虛擬空間、綿陽(yáng)服務(wù)器托管、企業(yè)網(wǎng)站設(shè)計(jì)、應(yīng)縣網(wǎng)站維護(hù)等服務(wù),公司將堅(jiān)持客戶(hù)導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶(hù)和合作伙伴齊心協(xié)力一起成長(zhǎng),共同發(fā)展。

一、R安裝

R for Mac OS

RStudio

二、線(xiàn)性回歸基礎(chǔ)

eg1:

憑我們的學(xué)習(xí)經(jīng)驗(yàn)可知,物理成績(jī)確實(shí)與數(shù)學(xué)成績(jī)有一定的關(guān)系。但是除此之外,還存在其他影響物理成績(jī)的因素,例如,,是否喜歡物理,用再物理學(xué)習(xí)上的時(shí)間等

eg2:

商品銷(xiāo)售收入與廣告支出經(jīng)費(fèi)之間的關(guān)系,商品銷(xiāo)售收入與廣告支出經(jīng)費(fèi)有著密切的聯(lián)系。但是還有很多其他因素

eg3:

糧食產(chǎn)量與施肥量之間的關(guān)系。在一定范圍內(nèi),施肥量越大,糧食產(chǎn)量就越高,但是施肥量并不是影響糧食產(chǎn)量的唯一因素。

年齡23273941454950
脂肪9.517.821.225.927.526.328.2
年齡53545657586061
脂肪29.630.231.430.833.535.234.6

人體的脂肪含量與年齡之間的有怎樣的關(guān)系?

首先我們做散點(diǎn)圖。以x軸表示年齡,y軸表示脂肪。(自己做散點(diǎn)圖,)

從散點(diǎn)圖,可以看出,它們散布在從左下角到右上角的區(qū)域。對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們稱(chēng)之為正相關(guān)。還有一些變量,例如汽車(chē)的重量和汽車(chē)每消耗lL汽油所行駛的平均路程,稱(chēng)為負(fù)相關(guān)。

從散點(diǎn)圖可以看出,這些點(diǎn)大致分布在通過(guò)散點(diǎn)圖中心的一條直線(xiàn)附近。如果散點(diǎn)圖中心分布從整體上看大致在一條直線(xiàn)附近,我們就稱(chēng)這兩個(gè)變量之間具有線(xiàn)性相關(guān)關(guān)系,這條直線(xiàn)稱(chēng)為回歸直線(xiàn)(regression line).如果能夠求出這條回歸直線(xiàn)的方程(回歸方程),那么我們就比較清楚了解年齡與脂肪的關(guān)系。

最小二乘法

實(shí)際上,求回歸方程的關(guān)鍵是如何用數(shù)學(xué)的方法刻畫(huà)“從整體上看,各點(diǎn)到此直線(xiàn)的距離最小

假設(shè)該直線(xiàn)為 y = bx + a

注意:

(x1,y1)(x2,y2)...(xi,yi).. 一個(gè)個(gè)點(diǎn)。到直線(xiàn)的距離,我們可以用點(diǎn)到直線(xiàn)的距離算出,但是這個(gè)比較復(fù)雜。

所以第一個(gè)簡(jiǎn)化==> 點(diǎn)(xi,yi) ,垂直向上,或垂直向下到直線(xiàn)的距離  yi - y = yi - (bxi + a)

但是yi - y 有正負(fù)之分,所以我們第二次簡(jiǎn)化,算平方

Q = (y1 - bx1 - a)^2 + (y2 - bx2 - a)^2 + .... + (yi - bxi - a)^2 + ...

只要計(jì)算出使得Q的最小的a和b,就能得到該回歸方程。 

可以使用偏導(dǎo)數(shù)計(jì)算得出a,b

a = ...

b = ...

b是回歸直線(xiàn)的斜率,a是截距

相關(guān)關(guān)系的強(qiáng)弱

我們知道不是所有兩個(gè)變量的關(guān)系都是線(xiàn)性的,如何判斷是否能使用線(xiàn)性回歸呢?

統(tǒng)計(jì)中用相關(guān)系數(shù)r來(lái)衡量?jī)蓚€(gè)變量之間的線(xiàn)性關(guān)系強(qiáng)弱。

r = ...

統(tǒng)計(jì)學(xué)認(rèn)為 如果 r <- [-1,-0.75] 那么負(fù)相關(guān)很強(qiáng), r<- [-0.75,-0.30] 負(fù)相關(guān)性一般, r<- [-0.25,0.25] 相關(guān)性弱,

 r <- [0.75,1] 那么正相關(guān)很強(qiáng), r<- [0.30,0.75] 正相關(guān)性一般,

三、RStudio測(cè)試

數(shù)據(jù):

研究嬰兒生理發(fā)育issue,并收集了10名嬰兒在出生后一年內(nèi)的月齡和體重?cái)?shù)據(jù)。

年齡(月)01??0305021109030912
體重(kg)4.45.37.25.28.57.36.010.410.2?










03
6.1

我們用c()函數(shù)以向量的形式輸入月齡和體重

> x_age=c(1,3,5,2,11,9,3,9,12,3)
> y_weight=c(4.4,5.3,7.2,5.2,8.5,7.3,6.0,10.4,10.2,6.1)

> mean(y_weight)            => 計(jì)算平均數(shù)
[1] 7.06
> sd(y_weight)              => 計(jì)算標(biāo)準(zhǔn)差
[1] 2.077498
> cor(x_age,y_weight)       => 計(jì)算相關(guān)性
[1] 0.9075655
> plot(x_age,y_weight)      => 畫(huà)散點(diǎn)圖

> cor_xy = lm(y_weight~x_age + 1)  => 設(shè)置擬合曲線(xiàn)方程式
> plot(cor_xy)                    => 畫(huà)回歸直線(xiàn)

> coef(cor_xy)                    => 計(jì)算回歸直線(xiàn)的斜率和截距
(Intercept)       x_age 
  4.3596206   0.4655827
  
> z = data.frmae(x_age=13)     
> predict(cor_xy,z)            => 我們來(lái)預(yù)測(cè)13個(gè)月的嬰兒的體重

感謝各位的閱讀,以上就是“R語(yǔ)言線(xiàn)性回歸怎么使用”的內(nèi)容了,經(jīng)過(guò)本文的學(xué)習(xí)后,相信大家對(duì)R語(yǔ)言線(xiàn)性回歸怎么使用這一問(wèn)題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián),小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!


本文名稱(chēng):R語(yǔ)言線(xiàn)性回歸怎么使用
網(wǎng)站鏈接:http://weahome.cn/article/ihoiho.html

其他資訊

在線(xiàn)咨詢(xún)

微信咨詢(xún)

電話(huà)咨詢(xún)

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部