真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

關(guān)于歐式距離函數(shù)python的信息

Python 計算三維空間某點距離原點的歐式距離

1、點擊“開始”——“ArcGIS”——“ArcMap”,啟動ArcMap程序,并添加兩個點要素類到地圖上。

為桃源等地區(qū)用戶提供了全套網(wǎng)頁設(shè)計制作服務(wù),及桃源網(wǎng)站建設(shè)行業(yè)解決方案。主營業(yè)務(wù)為網(wǎng)站設(shè)計、成都網(wǎng)站制作、桃源網(wǎng)站設(shè)計,以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務(wù)。我們深信只要達(dá)到每一位用戶的要求,就會得到認(rèn)可,從而選擇與我們長期合作。這樣,我們也可以走得更遠(yuǎn)!

2、點擊“ArcToolbox”——“分析工具”——“鄰域分析”——“點距離”,打開點距離工具界面。

3、選擇輸入要素,即作為起點的要素類,可以選擇已添加到地圖上的要素類,也可以選擇外部要素類。

4、選擇鄰近要素,即作為終點的要素類,可以選擇已添加到地圖上的要素類,也可以選擇外部要素類。

5、選擇計算結(jié)果的存放位置和表名稱。

6、輸入搜索半徑,即要計算多大半徑范圍內(nèi)的鄰近點要素之間的距離,可以為空,如果為空,則計算起點到鄰近要素類中所有點要素之間的距離。點擊“確定”,開始計算起點要素到鄰近要素之間的距離。

7、計算完成后,計算結(jié)果表會自動添加到地圖上,右鍵點擊結(jié)果表,點擊打開,可以查看計算結(jié)果。

怎樣用python計算兩個向量的歐式距離

L2距離就是二范數(shù),用norm試一下。

比如兩個1D向量分別為a,b,則歐式距離可以表示為:

norm(a-b), 相當(dāng)于

sqrt(sum((a-b).^2))

121 11 個案例掌握 Python 數(shù)據(jù)可視化--星際探索

星空是無數(shù)人夢寐以求想了解的一個領(lǐng)域,遠(yuǎn)古的人們通過肉眼觀察星空,并制定了太陰歷,指導(dǎo)農(nóng)業(yè)發(fā)展。隨著現(xiàn)代科技發(fā)展,有了更先進(jìn)的設(shè)備進(jìn)行星空的探索。本實驗獲取了美國國家航空航天局(NASA)官網(wǎng)發(fā)布的地外行星數(shù)據(jù),研究及可視化了地外行星各參數(shù)、尋找到了一顆類地行星并研究了天體參數(shù)的相關(guān)關(guān)系。

輸入并執(zhí)行魔法命令 %matplotlib inline, 設(shè)置全局字號,去除圖例邊框,去除右側(cè)和頂部坐標(biāo)軸。

本數(shù)據(jù)集來自 NASA,行星發(fā)現(xiàn)是 NASA 的重要工作之一,本數(shù)據(jù)集搜集了 NASA 官網(wǎng)發(fā)布的 4296 顆行星的數(shù)據(jù),本數(shù)據(jù)集字段包括:

導(dǎo)入數(shù)據(jù)并查看前 5 行。

截至 2020 年 10 月 22 日 全球共發(fā)現(xiàn) 4296 顆行星,按年聚合并繪制年度行星發(fā)現(xiàn)數(shù),并在左上角繪制 NASA 的官方 LOGO 。

從運行結(jié)果可以看出,2005 年以前全球行星發(fā)現(xiàn)數(shù)是非常少的,經(jīng)計算總計 173 顆,2014 和 2016 是行星發(fā)現(xiàn)成果最多的年份,2016 年度發(fā)現(xiàn)行星 1505 顆。

對不同機(jī)構(gòu)/項目/計劃進(jìn)行聚合并降序排列,繪制發(fā)現(xiàn)行星數(shù)目的前 20 。

2009 年至 2013 年,開普勒太空望遠(yuǎn)鏡成為有史以來最成功的系外行星發(fā)現(xiàn)者。在一片天空中至少找到了 1030 顆系外行星以及超過 4600 顆疑似行星。當(dāng)機(jī)械故障剝奪了該探測器對于恒星的精確定位功能后,地球上的工程師們于 2014 年對其進(jìn)行了徹底改造,并以 K2 計劃命名,后者將在更短的時間內(nèi)搜尋宇宙的另一片區(qū)域。

對發(fā)現(xiàn)行星的方式進(jìn)行聚合并降序排列,繪制各種方法發(fā)現(xiàn)行星的比例,由于排名靠后的幾種方式發(fā)現(xiàn)行星數(shù)較少,因此不顯示其標(biāo)簽。

行星在宇宙中并不會發(fā)光,因此無法直接觀察,行星發(fā)現(xiàn)的方式多為間接方式。從輸出結(jié)果可以看出,發(fā)現(xiàn)行星主要有以下 3 種方式,其原理如下:

針對不同的行星質(zhì)量,繪制比其質(zhì)量大(或者?。┑男行潜壤捎谛行琴|(zhì)量量綱分布跨度較大,因此采用對數(shù)坐標(biāo)。

從輸出結(jié)果可以看出,在已發(fā)現(xiàn)的行星中,96.25% 行星的質(zhì)量大于地球。(圖中橫坐標(biāo)小于 e 的紅色面積非常?。?/p>

通過 sns.distplot 接口繪制全部行星的質(zhì)量分布圖。

從輸出結(jié)果可以看出,所有行星質(zhì)量分布呈雙峰分布,第一個峰在 1.8 左右(此處用了對數(shù)單位,表示大約 6 個地球質(zhì)量),第二個峰在 6.2 左右(大概 493 個地球質(zhì)量)。

針對不同發(fā)現(xiàn)方式發(fā)現(xiàn)的行星,繪制各行星的公轉(zhuǎn)周期和質(zhì)量的關(guān)系。

從輸出結(jié)果可以看出:徑向速度(Radial Velocity)方法發(fā)現(xiàn)的行星在公轉(zhuǎn)周期和質(zhì)量上分布更寬,而凌日(Transit)似乎只能發(fā)現(xiàn)公轉(zhuǎn)周期相對較短的行星,這是因為兩種方法的原理差異造成的。對于公轉(zhuǎn)周期很長的行星,其運行到恒星和觀察者之間的時間也較長,因此凌日發(fā)現(xiàn)此類行星會相對較少。而徑向速度與其說是在發(fā)現(xiàn)行星,不如說是在觀察恒星,由于恒星自身發(fā)光,因此其觀察機(jī)會更多,發(fā)現(xiàn)各類行星的可能性更大。

針對不同發(fā)現(xiàn)方式發(fā)現(xiàn)的行星,繪制各行星的距離和質(zhì)量的關(guān)系。

從輸出結(jié)果可以看出,凌日和徑向速度對距離較為敏感,遠(yuǎn)距離的行星大多是通過凌日發(fā)現(xiàn)的,而近距離的行星大多數(shù)通過徑向速度發(fā)現(xiàn)的。原因是:近距離的行星其引力對恒星造成的擺動更為明顯,因此更容易觀察;當(dāng)距離較遠(yuǎn)時,引力作用變?nèi)酰瑪[動效應(yīng)減弱,因此很難借助此方法觀察到行星。同時,可以觀察到當(dāng)行星質(zhì)量更大時,其距離分布相對較寬,這是因為雖然相對恒星的距離變長了,但是由于行星質(zhì)量的增加,相對引力也同步增加,恒星擺動效應(yīng)會變得明顯。

將所有行星的質(zhì)量和半徑對數(shù)化處理,繪制其分布并擬合其分布。

由于:

因此,從原理上質(zhì)量對數(shù)與半徑對數(shù)應(yīng)該是線性關(guān)系,且斜率為定值 3 ,截距的大小與密度相關(guān)。

從輸出結(jié)果可以看出:行星質(zhì)量和行星半徑在對數(shù)變換下,具有較好的線性關(guān)系。輸出 fix_xy 數(shù)值可知,其關(guān)系可以擬合出如下公式:

擬合出曲線對應(yīng)的行星平均密度為:

同樣的方式繪制恒星質(zhì)量與半徑的關(guān)系。

從輸出結(jié)果可以看出,恒星與行星的規(guī)律不同,其質(zhì)量與半徑在對數(shù)下呈二次曲線關(guān)系,其關(guān)系符合以下公式:

同樣的方式研究恒星表面重力加速度與半徑的關(guān)系。

從輸出結(jié)果可以看出,恒星表面對數(shù)重力加速度與其對數(shù)半徑呈現(xiàn)較好的線性關(guān)系:

以上我們分別探索了各變量的分布和部分變量的相關(guān)關(guān)系,當(dāng)數(shù)據(jù)較多時,可以通過 pd.plotting.scatter_matrix 接口,直接繪制各變量的分布和任意兩個變量的散點圖分布,對于數(shù)據(jù)的初步探索,該接口可以讓我們迅速對數(shù)據(jù)全貌有較為清晰的認(rèn)識。

通過行星的半徑和質(zhì)量,恒星的半徑和質(zhì)量,以及行星的公轉(zhuǎn)周期等指標(biāo)與地球的相似性,尋找諸多行星中最類似地球的行星。

從輸出結(jié)果可以看出,在 0.6 附近的位置出現(xiàn)了一個最大的圓圈,那就是我們找到的類地行星 Kepler - 452 b ,讓我們了解一下這顆行星:

數(shù)據(jù)顯示,Kepler - 452 b 行星公轉(zhuǎn)周期為 384.84 天,半徑為 1.63 地球半徑,質(zhì)量為 3.29 地球質(zhì)量;它的恒星為 Kepler - 452 半徑為太陽的 1.11 倍,質(zhì)量為 1.04 倍,恒星方面數(shù)據(jù)與太陽相似度極高。

以下內(nèi)容來自百度百科。 開普勒452b(Kepler 452b) ,是美國國家航空航天局(NASA)發(fā)現(xiàn)的外行星, 直徑是地球的 1.6 倍,地球相似指數(shù)( ESI )為 0.83,距離地球1400光年,位于為天鵝座。

2015 年 7 月 24 日 0:00,美國國家航空航天局 NASA 舉辦媒體電話會議宣稱,他們在天鵝座發(fā)現(xiàn)了一顆與地球相似指數(shù)達(dá)到 0.98 的類地行星開普勒 - 452 b。這個類地行星距離地球 1400 光年,繞著一顆與太陽非常相似的恒星運行。開普勒 452 b 到恒星的距離,跟地球到太陽的距離相同。NASA 稱,由于缺乏關(guān)鍵數(shù)據(jù),現(xiàn)在不能說 Kepler - 452 b 究竟是不是“另外一個地球”,只能說它是“迄今最接近另外一個地球”的系外行星。

在銀河系經(jīng)緯度坐標(biāo)下繪制所有行星,并標(biāo)記地球和 Kepler - 452 b 行星的位置。

類地行星,是人類寄希望移民的第二故鄉(xiāng),但即使最近的 Kepler-452 b ,也與地球相聚 1400 光年。

以下通過行星的公轉(zhuǎn)周期和質(zhì)量兩個特征將所有行星聚為兩類,即通過訓(xùn)練獲得兩個簇心。

定義函數(shù)-計算距離

聚類距離采用歐式距離:

定義函數(shù)-訓(xùn)練簇心

訓(xùn)練簇心的原理是:根據(jù)上一次的簇心計算所有點與所有簇心的距離,任一點的分類以其距離最近的簇心確定。依此原理計算出所有點的分類后,對每個分類計算新的簇心。

定義函數(shù)預(yù)測分類

根據(jù)訓(xùn)練得到的簇心,預(yù)測輸入新的數(shù)據(jù)特征的分類。

開始訓(xùn)練

隨機(jī)生成一個簇心,并訓(xùn)練 15 次。

繪制聚類結(jié)果

以最后一次訓(xùn)練得到的簇心為基礎(chǔ),進(jìn)行行星的分類,并以等高面的形式繪制各類的邊界。

從運行結(jié)果可以看出,所有行星被分成了兩類。并通過上三角和下三角標(biāo)注了每個類別的簇心位置。

聚類前

以下輸出了聚類前原始數(shù)據(jù)繪制的圖像。

Python (3) 如何計算歐式距離

最直接的方式當(dāng)然是用numpy.linalg.norm()來計算

參考:

這里想說的是axis參數(shù)問題:

axis為0的時候,對于二維矩陣是計算它的列向量的norm;

axis為1的時候,對于二維矩陣是計算它的行向量的norm。

這也很好理解,畢竟列是第一維,而行是第二維,故順序如此。

另外還有一個ord參數(shù),定義的是計算什么norm,參數(shù)列表如下:

python如何表示 圓周率

python表示圓周率的方法:

使用“import”語句導(dǎo)入math包?!癿ath.pi”函數(shù)可以獲取到圓周率,那么就可以用“math.pi”函數(shù)來表示圓周率

示例如下:

執(zhí)行結(jié)果如下:

更多Python知識,請關(guān)注:Python自學(xué)網(wǎng)??!

常見的相似度度量算法

本文目錄:

??定義在兩個向量(兩個點)上:點x和點y的歐式距離為:

??常利用歐幾里得距離描述相似度時,需要取倒數(shù)歸一化,sim = 1.0/(1.0+distance),利用numpy實現(xiàn)如下:

python實現(xiàn)歐式距離

??從名字就可以猜出這種距離的計算方法了。想象你在曼哈頓要從一個十字路口開車到另外一個十字路口,駕駛距離是兩點間的直線距離嗎?顯然不是,除非你能穿越大樓。實際駕駛距離就是這個“曼哈頓距離”。而這也是曼哈頓距離名稱的來源, 曼哈頓距離也稱為城市街區(qū)距離(City Block distance)。

??(1)二維平面兩點a(x1,y1)與b(x2,y2)間的曼哈頓距離

??(2)兩個n維向量a(x11,x12,…,x1n)與 b(x21,x22,…,x2n)間的曼哈頓距離

?? python實現(xiàn)曼哈頓距離:

??國際象棋玩過么?國王走一步能夠移動到相鄰的8個方格中的任意一個。那么國王從格子(x1,y1)走到格子(x2,y2)最少需要多少步?自己走走試試。你會發(fā)現(xiàn)最少步數(shù)總是max( | x2-x1 | , | y2-y1 | ) 步 。有一種類似的一種距離度量方法叫切比雪夫距離。

??(1)二維平面兩點a(x1,y1)與b(x2,y2)間的切比雪夫距離

??(2)兩個n維向量a(x11,x12,…,x1n)與 b(x21,x22,…,x2n)間的切比雪夫距離

?? python實現(xiàn)切比雪夫距離:

??閔氏距離不是一種距離,而是一組距離的定義。

??兩個n維變量a(x11,x12,…,x1n)與 b(x21,x22,…,x2n)間的閔可夫斯基距離定義為:

??其中p是一個變參數(shù)。

??當(dāng)p=1時,就是曼哈頓距離

??當(dāng)p=2時,就是歐氏距離

??當(dāng)p→∞時,就是切比雪夫距離

??根據(jù)變參數(shù)的不同,閔氏距離可以表示一類的距離。

??閔氏距離,包括曼哈頓距離、歐氏距離和切比雪夫距離都存在明顯的缺點。

??舉個例子:二維樣本(身高,體重),其中身高范圍是150 190,體重范圍是50 60,有三個樣本:a(180,50),b(190,50),c(180,60)。那么a與b之間的閔氏距離(無論是曼哈頓距離、歐氏距離或切比雪夫距離)等于a與c之間的閔氏距離,但是身高的10cm真的等價于體重的10kg么?因此用閔氏距離來衡量這些樣本間的相似度很有問題。

??簡單說來,閔氏距離的缺點主要有兩個:

??(1)將各個分量的量綱(scale),也就是“單位”當(dāng)作相同的看待了。

??(2)沒有考慮各個分量的分布(期望,方差等)可能是不同的。

??標(biāo)準(zhǔn)歐氏距離的定義

??標(biāo)準(zhǔn)化歐氏距離是針對簡單歐氏距離的缺點而作的一種改進(jìn)方案。標(biāo)準(zhǔn)歐氏距離的思路:既然數(shù)據(jù)各維分量的分布不一樣,好吧!那我先將各個分量都“標(biāo)準(zhǔn)化”到均值、方差相等吧。均值和方差標(biāo)準(zhǔn)化到多少呢?這里先復(fù)習(xí)點統(tǒng)計學(xué)知識吧,假設(shè)樣本集X的均值(mean)為m,標(biāo)準(zhǔn)差(standard deviation)為s,那么X的“標(biāo)準(zhǔn)化變量”表示為:

??而且標(biāo)準(zhǔn)化變量的數(shù)學(xué)期望為0,方差為1。因此樣本集的標(biāo)準(zhǔn)化過程(standardization)用公式描述就是:

??標(biāo)準(zhǔn)化后的值 = ( 標(biāo)準(zhǔn)化前的值 - 分量的均值 ) /分量的標(biāo)準(zhǔn)差

??經(jīng)過簡單的推導(dǎo)就可以得到兩個n維向量a(x11,x12,…,x1n)與 b(x21,x22,…,x2n)間的標(biāo)準(zhǔn)化歐氏距離的公式:

??如果將方差的倒數(shù)看成是一個權(quán)重,這個公式可以看成是一種加權(quán)歐氏距離(Weighted Euclidean distance)。

??有M個樣本向量X1~Xm,協(xié)方差矩陣記為S,均值記為向量μ,則其中樣本向量X到u的馬氏距離表示為:

??而其中向量Xi與Xj之間的馬氏距離定義為:

??若協(xié)方差矩陣是單位矩陣(各個樣本向量之間獨立同分布),則公式就成了:

??也就是歐氏距離了。

??若協(xié)方差矩陣是對角矩陣,公式變成了標(biāo)準(zhǔn)化歐氏距離。

??馬氏距離的優(yōu)缺點:量綱無關(guān),排除變量之間的相關(guān)性的干擾。

??幾何中夾角余弦可用來衡量兩個向量方向的差異,機(jī)器學(xué)習(xí)中借用這一概念來衡量樣本向量之間的差異。

??在二維空間中向量A(x1,y1)與向量B(x2,y2)的夾角余弦公式:

??兩個n維樣本點a(x11,x12,…,x1n)和b(x21,x22,…,x2n)的夾角余弦

??類似的,對于兩個n維樣本點a(x11,x12,…,x1n)和b(x21,x22,…,x2n),可以使用類似于夾角余弦的概念來衡量它們間的相似程度。

??即:

??夾角余弦取值范圍為[-1,1]。夾角余弦越大表示兩個向量的夾角越小,夾角余弦越小表示兩向量的夾角越大。當(dāng)兩個向量的方向重合時夾角余弦取最大值1,當(dāng)兩個向量的方向完全相反夾角余弦取最小值-1。

python實現(xiàn)余弦相似度:

??兩個等長字符串s1與s2之間的漢明距離定義為將其中一個變?yōu)榱硗庖粋€所需要作的最小替換次數(shù)。例如字符串“1111”與“1001”之間的漢明距離為2。

??應(yīng)用:信息編碼(為了增強(qiáng)容錯性,應(yīng)使得編碼間的最小漢明距離盡可能大)。

python實現(xiàn)漢明距離:

??兩個集合A和B的交集元素在A,B的并集中所占的比例,稱為兩個集合的杰卡德相似系數(shù),用符號J(A,B)表示。

??杰卡德相似系數(shù)是衡量兩個集合的相似度一種指標(biāo)。

??與杰卡德相似系數(shù)相反的概念是杰卡德距離(Jaccard distance)。杰卡德距離可用如下公式表示:

??杰卡德距離用兩個集合中不同元素占所有元素的比例來衡量兩個集合的區(qū)分度。

??可將杰卡德相似系數(shù)用在衡量樣本的相似度上。

??樣本A與樣本B是兩個n維向量,而且所有維度的取值都是0或1。例如:A(0111)和B(1011)。我們將樣本看成是一個集合,1表示集合包含該元素,0表示集合不包含該元素。

??p :樣本A與B都是1的維度的個數(shù)

??q :樣本A是1,樣本B是0的維度的個數(shù)

??r :樣本A是0,樣本B是1的維度的個數(shù)

??s :樣本A與B都是0的維度的個數(shù)

??這里p+q+r可理解為A與B的并集的元素個數(shù),而p是A與B的交集的元素個數(shù)。

??而樣本A與B的杰卡德距離表示為:

??皮爾遜相關(guān)系數(shù)即為相關(guān)系數(shù) ( Correlation coefficient )與相關(guān)距離(Correlation distance)

??相關(guān)系數(shù)的定義

??相關(guān)系數(shù)是衡量隨機(jī)變量X與Y相關(guān)程度的一種方法,相關(guān)系數(shù)的取值范圍是[-1,1]。相關(guān)系數(shù)的絕對值越大,則表明X與Y相關(guān)度越高。當(dāng)X與Y線性相關(guān)時,相關(guān)系數(shù)取值為1(正線性相關(guān))或-1(負(fù)線性相關(guān))。

1. 機(jī)器學(xué)習(xí)中的相似性度量

2. 推薦算法入門(1)相似度計算方法大全

3. Python Numpy計算各類距離

4. 皮爾遜積矩相關(guān)系數(shù)


標(biāo)題名稱:關(guān)于歐式距離函數(shù)python的信息
URL網(wǎng)址:http://weahome.cn/article/hijodp.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部