真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

初識(shí)Kubernetes(K8s):各種資源對(duì)象的理解和定義

一、Pod

Kubernetes為每個(gè)Pod都分配了唯一的IP地址,稱(chēng)之為Pod IP,一個(gè)Pod里的多個(gè)容器共享Pod IP地址。Kubernetes要求底層網(wǎng)絡(luò)支持集群內(nèi)任意兩個(gè)Pod之間的TCP/IP直接通信,這通常采用虛擬二層網(wǎng)絡(luò)技術(shù)來(lái)實(shí)現(xiàn),例如Flannel、Open vSwitch等。因此,在Kubernetes里,一個(gè)Pod里的容器與另外主機(jī)上的Pod容器能夠直接通信。
Pod有兩種類(lèi)型:普通的Pod和靜態(tài)Pod(Static Pod),靜態(tài)Pod不存放在etcd存儲(chǔ)里,而是存放在某個(gè)具體的Node上的一個(gè)具體文件中,并且只在此Node上啟動(dòng)運(yùn)行。普通的Pod一旦被創(chuàng)建,就會(huì)被存儲(chǔ)到etcd中,隨后會(huì)被Kubernetes Master調(diào)度到某個(gè)具體的Node上并進(jìn)行綁定(Binding),該Node上的kubelet進(jìn)程會(huì)將其實(shí)例化成一組相關(guān)的Docker容器并啟動(dòng)起來(lái)。當(dāng)Pod里的某個(gè)容器停止時(shí),Kubernetes會(huì)自動(dòng)檢測(cè)到這個(gè)問(wèn)題并且重新啟動(dòng)這個(gè)Pod(重啟Pod里的所有容器);如果Pod所在的Node宕機(jī),則會(huì)將這個(gè)Node上的所有Pod重新調(diào)度到其他節(jié)點(diǎn)上運(yùn)行。
Pod、容器與Node的關(guān)系如下圖:
初識(shí)Kubernetes(K8s):各種資源對(duì)象的理解和定義
Kubernetes里的所有資源對(duì)象都可以采用yaml或者JSON格式的文件來(lái)定義或描述,下面是一個(gè)簡(jiǎn)單的Pod資源定義文件:

成都創(chuàng)新互聯(lián)公司成立以來(lái)不斷整合自身及行業(yè)資源、不斷突破觀念以使企業(yè)策略得到完善和成熟,建立了一套“以技術(shù)為基點(diǎn),以客戶(hù)需求中心、市場(chǎng)為導(dǎo)向”的快速反應(yīng)體系。對(duì)公司的主營(yíng)項(xiàng)目,如中高端企業(yè)網(wǎng)站企劃 / 設(shè)計(jì)、行業(yè) / 企業(yè)門(mén)戶(hù)設(shè)計(jì)推廣、行業(yè)門(mén)戶(hù)平臺(tái)運(yùn)營(yíng)、成都app軟件開(kāi)發(fā)成都做手機(jī)網(wǎng)站、微信網(wǎng)站制作、軟件開(kāi)發(fā)、川西大數(shù)據(jù)中心等實(shí)行標(biāo)準(zhǔn)化操作,讓客戶(hù)可以直觀的預(yù)知到從成都創(chuàng)新互聯(lián)公司可以獲得的服務(wù)效果。

apiVersion: v1
kind: Pod
metadata:
  name: myweb
  labels:
    name: myweb
spec:
  containers:
  - name: myweb
    image: kubeguide/tomcat-app: v1
    ports:
    - containerPort: 8080
    env:
    - name: MySQL_SERVICE_HOST
      value: 'mysql'
    - name: MYSQL_SERVICE_PORT
      value: '3306'

kind為pod表明這是一個(gè)Pod的定義,metadata里的name屬性為Pod的名字,metadata里還能定義資源對(duì)象的標(biāo)簽(Label),這里聲明myweb擁有一個(gè)name=myweb的標(biāo)簽(Label)。Pod里包含的容器組的定義則在spec一節(jié)中聲明,這里定義了一個(gè)名字為myweb,對(duì)應(yīng)鏡像為kubeguide/tomcat-app: v1的容器,該容器注入了名為MYSQL_SERVICE_HOST='mysql'和MYSQL_SERVICE_PORT='3306'的環(huán)境變量(env關(guān)鍵字),并且在8080端口(containerPort)上啟動(dòng)容器進(jìn)程。Pod的IP加上這里的容器端口,就組成了一個(gè)新的概念——Endpoint,它代表著此Pod里的一個(gè)服務(wù)進(jìn)程的對(duì)外通信地址。一個(gè)Pod也存在著具有多個(gè)Endpoint的情況,比如我們把Tomcat定義為一個(gè)Pod時(shí),可以對(duì)外暴露管理端口與服務(wù)端口這兩個(gè)Endpoint。
Docker里的Volume在Kubernetes里也有對(duì)應(yīng)的概念——Pod Volume,Pod Volume有一些擴(kuò)展,比如可以用分布式文件系統(tǒng)GlusterFS等實(shí)現(xiàn)后端存儲(chǔ)功能;Pod Volume是定義在Pod之上,然后被各個(gè)容器掛載到自己的文件系統(tǒng)中的。對(duì)于Pod Volume的定義我們后面會(huì)講到。
這里順便提一下Event概念,Event是一個(gè)事件的記錄,記錄了事件的最早產(chǎn)生時(shí)間、最后重現(xiàn)時(shí)間、重復(fù)次數(shù)、發(fā)起者、類(lèi)型,以及導(dǎo)致此事件的原因等眾多信息。Event通常會(huì)關(guān)聯(lián)到某個(gè)具體的資源對(duì)象上,是排查故障的重要參考信息,當(dāng)我們發(fā)現(xiàn)某個(gè)Pod遲遲無(wú)法創(chuàng)建時(shí),可以用kubectl describe pod xxx來(lái)查看它的描述信息,用來(lái)定位問(wèn)題的原因。
每個(gè)Pod都可以對(duì)其能使用的服務(wù)器上的計(jì)算資源設(shè)置限額,當(dāng)前可以設(shè)置限額的計(jì)算資源有CPU和Memory兩種,其中CPU的資源單位為CPU(Core)的數(shù)量,是一個(gè)絕對(duì)值。
對(duì)于容器來(lái)說(shuō)一個(gè)CPU的配額已經(jīng)是相當(dāng)大的資源配額了,所以在Kubernetes里,通常以千分之一的CPU配額為最小單位,用m來(lái)表示。通常一個(gè)容器的CPU配額被定義為100-300m,即占用0.1-0.3個(gè)CPU。與CPU配額類(lèi)似,Memory配額也是一個(gè)絕對(duì)值,它的單位是內(nèi)存字節(jié)數(shù)。
對(duì)計(jì)算資源進(jìn)行配額限定需要設(shè)定以下兩個(gè)參數(shù):

  • Requests:該資源的最小申請(qǐng)量,系統(tǒng)必須滿(mǎn)足要求。
  • Limits:該資源最大允許使用的量,不能超過(guò)這個(gè)使用限制,當(dāng)容器試圖使用超過(guò)這個(gè)量的資源時(shí),可能會(huì)被Kubernetes Kill并重啟。

通常我們應(yīng)該把Requests設(shè)置為一個(gè)比較小的數(shù)值,滿(mǎn)足容器平時(shí)的工作負(fù)載情況下的資源需求,而把Limits設(shè)置為峰值負(fù)載情況下資源占用的最大量。下面是一個(gè)資源配額的簡(jiǎn)單定義:

spec:
  containers:
  - name: db
    image: mysql
    resources:
      requests:
        memory: "64Mi"
        cpu: "250m"
      limits:
        memory: "128Mi"
        cpu: "500m"

最小0.25個(gè)CPU及64MB內(nèi)存,最大0.5個(gè)CPU及128MB內(nèi)存。

二、Label(標(biāo)簽)

Label相當(dāng)于我們熟悉的“標(biāo)簽”,給某個(gè)資源對(duì)象定義一個(gè)Label,就相當(dāng)于給它打了一個(gè)標(biāo)簽,隨后可以通過(guò)Label Selector(標(biāo)簽選擇器)查詢(xún)和篩選擁有某些Label的資源對(duì)象,Kubernetes通過(guò)這種方式實(shí)現(xiàn)了類(lèi)似SQL的簡(jiǎn)單又通用的對(duì)象查詢(xún)機(jī)制。
Label Selector相當(dāng)于SQL語(yǔ)句中的where查詢(xún)條件,例如,name=redis-slave這個(gè)Label Selector作用于Pod時(shí),相當(dāng)于select * from pod where pod’s name = ‘redis-slave’這樣的語(yǔ)句。Label Selector的表達(dá)式有兩種:基于等式的(Equality-based)和基于集合的(Set-based)。下面是基于等式的匹配例子。
name=redis-slave:匹配所有標(biāo)簽為name=redis-slave的資源對(duì)象。
env != production:匹配所有標(biāo)簽env不等于production的資源對(duì)象。
下面是基于集合的匹配例子

  • name in (redis-master, redis-slave):匹配所有標(biāo)簽為name=redis-master或者name=redis-slave的資源對(duì)象。
  • name not in (php-frontend):匹配所有標(biāo)簽name不等于php-frontend的資源對(duì)象。

還可以通過(guò)多個(gè)Label Selector表達(dá)式的組合實(shí)現(xiàn)復(fù)雜的條件選擇,多個(gè)表達(dá)式之間用“,”進(jìn)行分隔即可,幾個(gè)條件之間是“AND”的關(guān)系,即同時(shí)滿(mǎn)足多個(gè)條件,例如:

name=redis-slave, env!=production
name not in (php-frontend), env!=production

以Pod為例,Label定義在metadata中:

apiVersion: v1
kind: Pod
metadata:
  name: myweb
  labels:
    app: myweb

RC和Service在spec中定義Selector與Pod進(jìn)行關(guān)聯(lián):

apiVersion: v1
kind: ReplicationController
metadata:
  name: myweb
spec:
  replicas: 1
  selector:
    app: myweb
  template:
  …………

Deployment、ReplicaSet、DaemonSet和Job則可以在Selector中使用基于集合的篩選條件:

selector:
  matchLabels:
    app: myweb
  matchExpressions:
    - {key: tier, operator: In, values: [frontend]}
    - {key: environment, operator: NotIn, values: [dev]}

matchLabels用于定義一組Label,與直接寫(xiě)在Selector中作用相同;matchExpressions用于定義一組基于集合的篩選條件,可用的條件運(yùn)算符包括:In、NotIn、Exists和DoesNotExist。
如果同時(shí)設(shè)置了matchLabels和matchExpressions,則兩組條件為“AND”關(guān)系,即所有條件需要同時(shí)滿(mǎn)足才能完成Selector的篩選。
Label Selector在Kubernetes中的重要使用場(chǎng)景如下:

  • Kube-controller進(jìn)程通過(guò)資源對(duì)象RC上定義的Label Selector來(lái)篩選要監(jiān)控的Pod副本的數(shù)量,從而實(shí)現(xiàn)Pod副本的數(shù)量始終符合預(yù)期設(shè)定的全自動(dòng)控制流程。
  • Kube-proxy進(jìn)程通過(guò)Service的Label Selector來(lái)選擇對(duì)應(yīng)的Pod,自動(dòng)建立起每個(gè)Service到對(duì)應(yīng)Pod的請(qǐng)求轉(zhuǎn)發(fā)路由表,從而實(shí)現(xiàn)Service的智能負(fù)載均衡機(jī)制。
  • 通過(guò)對(duì)某些Node定義特定的Label,并且在Pod定義文件中使用NodeSelector這種標(biāo)簽調(diào)度策略,kube-scheduler進(jìn)程可以實(shí)現(xiàn)Pod“定向調(diào)度”的特性。

下面舉個(gè)復(fù)雜點(diǎn)的例子,假設(shè)我們?yōu)镻od定義了3個(gè)Label:release、env和role,不同的Pod定義了不同的Label。如下圖所示,如果我們?cè)O(shè)置了“role=frontend”的Label Selector,則會(huì)選取到Node 1和Node 2上的Pod。
初識(shí)Kubernetes(K8s):各種資源對(duì)象的理解和定義
如果我們?cè)O(shè)置“release=beta”的Label Selector,則會(huì)選取到Node 2和Node 3上的Pod,如下圖所示。
初識(shí)Kubernetes(K8s):各種資源對(duì)象的理解和定義
總結(jié):使用Label可以給對(duì)象創(chuàng)建多組標(biāo)簽,Label和Label Selector共同構(gòu)成了Kubernetes系統(tǒng)中最核心的應(yīng)用模型,使得被管理對(duì)象能夠被精細(xì)地分組管理,同時(shí)實(shí)現(xiàn)了整個(gè)集群的高可用性。

三、Replication Controller

RC的作用是聲明Pod的副本數(shù)量在任意時(shí)刻都符合某個(gè)預(yù)期值,所以RC的定義包括如下幾個(gè)部分。

  • Pod期待的副本數(shù)量(replicas)。
  • 用于篩選目標(biāo)Pod的Label Selector。
  • 當(dāng)Pod的副本數(shù)量小于預(yù)期數(shù)量時(shí),用于創(chuàng)建新Pod的Pod模板(template)。

下面是一個(gè)完整的RC定義的例子,即確保擁有tier=frontend標(biāo)簽的這個(gè)Pod(運(yùn)行Tomcat容器)在整個(gè)Kubernetes集群中始終有三個(gè)副本:

apiVersion: v1
kind: ReplicationController
metadata:
  name: frontend
spec:
  replicas: 3
  selector:
    tier: frontend
  template:
    metadata:
      labels:
        app: app-demo
        tier: frontend
    spec:
      containers:
      - name: tomcat-demo
        image: tomcat
        imagePullPolicy: IfNotPresent
        env:
        - name: GET_HOSTS_FROM
          value: DNS
        ports:
        - containerPort: 80

當(dāng)我們定義了一個(gè)RC并提交到Kubernetes集群中后,Master節(jié)點(diǎn)上的Controller Manager組件就得到通知,定期巡檢系統(tǒng)中當(dāng)前存活的目標(biāo)Pod,并確保目標(biāo)Pod實(shí)例的數(shù)量剛好等于此RC的期望值。如果有過(guò)多的Pod副本在運(yùn)行,系統(tǒng)就會(huì)停掉多余的Pod;如果運(yùn)行的Pod副本少于期望值,即如果某個(gè)Pod掛掉,系統(tǒng)就會(huì)自動(dòng)創(chuàng)建新的Pod以保證數(shù)量等于期望值。
通過(guò)RC,Kubernetes實(shí)現(xiàn)了用戶(hù)應(yīng)用集群的高可用性,并且大大減少了運(yùn)維人員在傳統(tǒng)IT環(huán)境中需要完成的許多手工運(yùn)維工作(如主機(jī)監(jiān)控腳本、應(yīng)用監(jiān)控腳本、故障恢復(fù)腳本等)。
下面我們來(lái)看下Kubernetes如何通過(guò)RC來(lái)實(shí)現(xiàn)Pod副本數(shù)量自動(dòng)控制的機(jī)制,假如我們有3個(gè)Node節(jié)點(diǎn),在RC里定義了redis-slave這個(gè)Pod需要保持兩個(gè)副本,系統(tǒng)將會(huì)在其中的兩個(gè)Node上創(chuàng)建副本,如下圖所示。
初識(shí)Kubernetes(K8s):各種資源對(duì)象的理解和定義
假如Node2上的Pod2意外終止,根據(jù)RC定義的replicas數(shù)量2,Kubernetes將會(huì)自動(dòng)創(chuàng)建并啟動(dòng)一個(gè)新的Pod,以保證整個(gè)集群中始終有兩個(gè)redis-slave Pod在運(yùn)行。
系統(tǒng)可能選擇Node1或者Node3來(lái)創(chuàng)建一個(gè)新的Pod,如下圖。
初識(shí)Kubernetes(K8s):各種資源對(duì)象的理解和定義
通過(guò)修改RC的副本數(shù)量,可以實(shí)現(xiàn)Pod的動(dòng)態(tài)縮放(Scaling)功能。
kubectl scale rc redis-slave --replicas=3
此時(shí)Kubernetes會(huì)在3個(gè)Node中選取一個(gè)Node創(chuàng)建并運(yùn)行一個(gè)新的Pod3,使redis-slave Pod副本數(shù)量始終保持3個(gè)。

四、Replica Set

由于Replication Controller與Kubernetes代碼中的模塊Replication Controller同名,同時(shí)這個(gè)詞也無(wú)法準(zhǔn)確表達(dá)它的意思,所以從Kubernetes v1.2開(kāi)始,它就升級(jí)成了另外一個(gè)新的對(duì)象——Replica Set,官方解釋為“下一代的RC”。它與RC當(dāng)前存在的唯一區(qū)別是:Replica Set支持基于集合的Label selector(Set-based selector),而RC只支持基于等式的Label selector(equality-based selector),所以Replica Set的功能更強(qiáng)大。下面是Replica Set的定義例子(省去了Pod模板部分的內(nèi)容):

apiVersion: extensions/v1beta1
kind: ReplicaSet
metadata:
  name: frontend
spec:
  selector:
    matchLabels:
      tier: frontend
    matchExpressions:
      - {key: tier, operator: In, values: [frontend]}
  template:
  …………

Replica Set很少單獨(dú)使用,它主要被Deployment這個(gè)更高層的資源對(duì)象所使用,從而形成一整套Pod創(chuàng)建、刪除、更新的編排機(jī)制。
RC和RS的特性與作用如下:

  • 在大多情況下,我們通過(guò)定義一個(gè)RC實(shí)現(xiàn)Pod的創(chuàng)建過(guò)程及副本數(shù)量的自動(dòng)控制。
  • RC里包括完整的Pod定義模板。
  • RC通過(guò)Label Selector機(jī)制實(shí)現(xiàn)對(duì)Pod副本的自動(dòng)控制。
  • 通過(guò)改變RC里的Pod副本數(shù)量,可以實(shí)現(xiàn)Pod的擴(kuò)容或縮容功能。
  • 通過(guò)改變RC里Pod模板中的鏡像版本,可以實(shí)現(xiàn)Pod的滾動(dòng)升級(jí)功能。

五、Deployment

Deployment相對(duì)于RC的最大區(qū)別是我們可以隨時(shí)知道當(dāng)前Pod“部署”的進(jìn)度。一個(gè)Pod的創(chuàng)建、調(diào)度、綁定節(jié)點(diǎn)及在目標(biāo)Node上啟動(dòng)對(duì)應(yīng)的容器這一完整過(guò)程需要一定的時(shí)間,所以我們期待系統(tǒng)啟動(dòng)N個(gè)Pod副本的目標(biāo)狀態(tài),實(shí)際上是一個(gè)連續(xù)變化的“部署過(guò)程”導(dǎo)致的最終狀態(tài)。
Deployment的典型使用場(chǎng)景有以下幾個(gè):

  • 創(chuàng)建一個(gè)Deployment對(duì)象來(lái)生成對(duì)應(yīng)的Replica Set并完成Pod副本的創(chuàng)建過(guò)程。
  • 檢查Deployment的狀態(tài)來(lái)看部署動(dòng)作是否完成(Pod副本的數(shù)量是否達(dá)到預(yù)期的值)。
  • 更新Deployment以創(chuàng)建新的Pod(比如鏡像升級(jí))。
  • 如果當(dāng)前Deployment不穩(wěn)定,則回滾到一個(gè)早先的Deployment版本。
  • 暫停Deployment以便于一次性修改多個(gè)Pod Template Spec的配置項(xiàng),之后再恢復(fù)Deployment,進(jìn)行新的發(fā)布。
  • 擴(kuò)展Deployment以應(yīng)對(duì)高負(fù)載。
  • 查看Deployment的狀態(tài),以此作為發(fā)布是否成功的指標(biāo)。
  • 清理不再需要的舊版本ReplicaSet。

Deployment的定義與Replica Set的定義類(lèi)似,只是API聲明與Kind類(lèi)型不同。

apiVersion: extensions/v1beta1
kind: Deployment
metadata:
  name: nginx-deployment
apiVersion: v1
kind: ReplicaSet
metadata:
  name: nginx-repset

下面是Deployment定義的一個(gè)完整例子:

apiVersion: extensions/v1beta1
kind: Deployment
metadata:
  name: frontend
spec:
  replicas: 1
  selector:
    matchLabels:
      tier: frontend
    matchExpressions:
      - {key: tier, operator: In, values: [frontend]}
  template:
    metadata:
      labels:
        app: app-demo
        tier: frontend
    spec:
      containers:
      - name: tomcat-demo
        image: tomcat
        imagePullPolicy: IfNotPresent
        ports:
        - containerPort: 8080

可以通過(guò)命令kubectl get deployment來(lái)查看Deployment的信息,其中的幾個(gè)參數(shù)解釋如下:

  • DESIRED::Pod副本數(shù)量的期望值,即Deployment里定義的Replica。
  • CURRENT:當(dāng)前Replica的值,如果小于DESIRED的期望值,會(huì)創(chuàng)建新的Pod,直到達(dá)成DESIRED為止。
  • UP-TO-DATE:最新版本的Pod的副本數(shù)量,用于指示在滾動(dòng)升級(jí)的過(guò)程中,有多少個(gè)Pod副本已經(jīng)成功升級(jí)。
  • AVAILABLE:當(dāng)前集群中可用的Pod副本數(shù)量,即集群中當(dāng)前存活的Pod數(shù)量。

Pod的管理對(duì)象,除了RC、ReplicaSet、Deployment,還有DaemonSet、StatefulSet、Job等,分別用于不同的應(yīng)用場(chǎng)景。

六、Horizontal Pod Autoscaler

HPA與RC、Deployment一樣,也屬于Kubernetes資源對(duì)象。通過(guò)追蹤分析RC或RS控制的所有目標(biāo)Pod的負(fù)載變化情況,來(lái)確定是否需要針對(duì)性地調(diào)整目標(biāo)Pod的副本數(shù)。
HPA有以下兩種方式作為Pod負(fù)載的度量指標(biāo):

  • CPUUtilizationPercentage
  • 應(yīng)用程序自定義的度量指標(biāo),比如服務(wù)在每秒內(nèi)的相應(yīng)的請(qǐng)求數(shù)(TPS或QPS)。

CPUUtilizationPercentage是一個(gè)算術(shù)平均值,即目標(biāo)Pod所有副本自帶的CPU利用率的平均值。一個(gè)Pod自身的CPU利用率是該P(yáng)od當(dāng)前CPU的使用量除以它的Pod Request的值,比如我們定義一個(gè)Pod的Pod Request為0.4,而當(dāng)前Pod的CPU使用量為0.2,則它的CPU使用率為50%,這樣我們就可以算出來(lái)一個(gè)RC或RS控制的所有Pod副本的CPU利用率的算術(shù)平均值了。如果某一時(shí)刻CPUUtilizationPercentage的值超過(guò)80%,則意味著當(dāng)前的Pod副本數(shù)很可能不足以支撐接下來(lái)更多的請(qǐng)求,需要進(jìn)行動(dòng)態(tài)擴(kuò)容,而當(dāng)請(qǐng)求高峰時(shí)段過(guò)去后,Pod的CPU利用率又會(huì)降下來(lái),此時(shí)對(duì)應(yīng)的Pod副本數(shù)應(yīng)該自動(dòng)減少到一個(gè)合理的水平。
下面是HPA定義的一個(gè)具體的例子:

apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
  name: php-apache
  namespace: default
spec:
  maxReplicas: 10
  minReplicas: 2
  scaleTargetRef:
    kind: Deployment
    name: php-apache
  targetCPUUtilizationPercentage: 90

通過(guò)HPA控制php-apache的Pod副本,當(dāng)Pod副本的CPUUtilizationPercentage的值超過(guò)90%時(shí),會(huì)進(jìn)行自動(dòng)擴(kuò)容增加Pod副本的數(shù)量,擴(kuò)容或縮容時(shí)Pod的副本數(shù)量要介于2-10之間。
除了通過(guò)yaml文件來(lái)定義HPA對(duì)象之外,還可以通過(guò)命令的方式創(chuàng)建:
kubectl autoscale deployment php-apache --cpu-percent=90 --min=1 --max=10

七、StatefulSet

Pod的管理對(duì)象RC、Deployment、DaemonSet和Job都是面向無(wú)狀態(tài)的服務(wù),但實(shí)際中有很多服務(wù)是有狀態(tài)的,比如Mysql集群、MongoDB集群、ZooKeeper集群等,可以使用StatefulSet來(lái)管理有狀態(tài)的服務(wù)。
StatefulSet有如下一些特性:

  • StatefulSet里的每個(gè)Pod都有穩(wěn)定、唯一的網(wǎng)絡(luò)標(biāo)識(shí),可以用來(lái)發(fā)現(xiàn)集群內(nèi)的其他成員。假設(shè)StatefulSet的名字叫kafka,那么第1個(gè)Pod叫kafka-0,第2個(gè)叫kafka-1,以此類(lèi)推。
  • StatefulSet控制的Pod副本的啟停順序是受控的,操作第n個(gè)Pod時(shí),前n-1個(gè)Pod已經(jīng)是運(yùn)行且準(zhǔn)備好的狀態(tài)。
  • StatefulSet里的Pod采用穩(wěn)定的持久化存儲(chǔ)卷,通過(guò)PV/PVC來(lái)實(shí)現(xiàn),刪除Pod時(shí)默認(rèn)不會(huì)刪除與StatefulSet相關(guān)的存儲(chǔ)卷(為了保證數(shù)據(jù)的安全)。

StatefulSet除了要與PV卷捆綁使用以存儲(chǔ)Pod的狀態(tài)數(shù)據(jù),還要與Headless Service配合使用,即在每個(gè)StatefulSet的定義中要聲明它屬于哪個(gè)Headless Service。Headless Service與普通Service的區(qū)別在于,它沒(méi)有Cluster IP,如果解析Headless Service的DNS域名,則返回的是該Service對(duì)應(yīng)的全部Pod的Endpoint列表。StatefulSet在Headless Service的基礎(chǔ)上又為StatefulSet控制的每個(gè)Pod實(shí)例創(chuàng)建了一個(gè)DNS域名,這個(gè)域名的格式為:

$(podname).$(headless service name)

比如一個(gè)3節(jié)點(diǎn)的kafka的StatefulSet集群,對(duì)應(yīng)的Headless Service的名字為kafka,StatefulSet的名字為kafka,則StatefulSet里面的3個(gè)Pod的DNS名稱(chēng)分別為kafka-0.kafka、kafka-1.kafka、kafka-3.kafka,這些DNS名稱(chēng)可以直接在集群的配置文件中固定下來(lái)。

八、Service(服務(wù))

1.概述
Service其實(shí)就是我們經(jīng)常提起的微服務(wù)架構(gòu)中的一個(gè)“微服務(wù)”,Pod、RC等資源對(duì)象其實(shí)都是為它作“嫁衣”的。Pod、RC或RS與Service的邏輯關(guān)系如下圖所示。
初識(shí)Kubernetes(K8s):各種資源對(duì)象的理解和定義
通過(guò)上圖我們看到,Kubernetes的Service定義了一個(gè)服務(wù)的訪問(wèn)入口地址,前端的應(yīng)用(Pod)通過(guò)這個(gè)入口地址訪問(wèn)其背后的一組由Pod副本組成的集群實(shí)例,Service與其后端Pod副本集群之間則是通過(guò)Label Selector來(lái)實(shí)現(xiàn)“無(wú)縫對(duì)接”的。而RC的作用實(shí)際上是保證Service的服務(wù)能力和服務(wù)質(zhì)量始終處于預(yù)期的標(biāo)準(zhǔn)。
通過(guò)分析、識(shí)別并建模系統(tǒng)中的所有服務(wù)為微服務(wù)——Kubernetes Service,最終我們的系統(tǒng)由多個(gè)提供不同業(yè)務(wù)能力而又彼此獨(dú)立的微服務(wù)單元所組成,服務(wù)之間通過(guò)TCP/IP進(jìn)行通信,從而形成了強(qiáng)大而又靈活的彈性集群,擁有了強(qiáng)大的分布式能力、彈性擴(kuò)展能力、容錯(cuò)能力。因此,我們的系統(tǒng)架構(gòu)也變得簡(jiǎn)單和直觀許多。
既然每個(gè)Pod都會(huì)被分配一個(gè)單獨(dú)的IP地址,而且每個(gè)Pod都提供了一個(gè)獨(dú)立的Endpoint(Pod IP+ContainerPort)以被客戶(hù)端訪問(wèn),多個(gè)Pod副本組成了一個(gè)集群來(lái)提供服務(wù),那么客戶(hù)端如何來(lái)訪問(wèn)它們呢?一般的做法是部署一個(gè)負(fù)載均衡器(軟件或硬件),但這樣無(wú)疑增加了運(yùn)維的工作量。在Kubernetes集群里使用了Service(服務(wù)),它提供了一個(gè)虛擬的IP地址(Cluster IP)和端口號(hào),Kubernetes集群里的任何服務(wù)都可以通過(guò)Cluster IP+端口的方式來(lái)訪問(wèn)此服務(wù),至于訪問(wèn)請(qǐng)求最后會(huì)被轉(zhuǎn)發(fā)到哪個(gè)Pod,則由運(yùn)行在每個(gè)Node上的kube-proxy負(fù)責(zé)。kube-proxy進(jìn)程其實(shí)就是一個(gè)智能的軟件負(fù)載均衡器,它負(fù)責(zé)把對(duì)Service的請(qǐng)求轉(zhuǎn)發(fā)到后端的某個(gè)Pod實(shí)例上,并在內(nèi)部實(shí)現(xiàn)服務(wù)的負(fù)載均衡與會(huì)話保持機(jī)制。
下面是一個(gè)Service的簡(jiǎn)單定義:

apiVersion: v1
kind: Service
metadata:
  name: tomcat-service
spec:
  ports:
  - port: 8080
  selector:
    tier: frontend

上述內(nèi)容定義了一個(gè)名為“tomcat-service”的Service,它的服務(wù)端口為8080,擁有“tier=frontend”這個(gè)Label的所有Pod實(shí)例。
很多服務(wù)都存在多個(gè)端口的問(wèn)題,通常一個(gè)端口提供業(yè)務(wù)服務(wù),另外一個(gè)端口提供管理服務(wù),比如Mycat、Codis等常見(jiàn)中間件。Kubernetes Service支持多個(gè)Endpoint,要求每個(gè)Endpoint定義一個(gè)名字來(lái)區(qū)分,下面是tomcat多端口的Service定義樣例。

apiVersion: v1
kind: Service
metadata:
  name: tomcat-service
spec:
  ports:
  - port: 8080
    name: service-port
  - port: 8005
    name: shutdown-port
  selector:
    tier: frontend

多端口為什么需要給每個(gè)端口命名呢?這就涉及Kubernetes的服務(wù)發(fā)現(xiàn)機(jī)制了。
2.Kubernetes的服務(wù)發(fā)現(xiàn)機(jī)制
每個(gè)Kubernetes中的Service都有一個(gè)唯一的Cluster IP及唯一的名字,而名字是由我們自己定義的,那我們是否可以通過(guò)Service的名字來(lái)訪問(wèn)呢?
最早時(shí)Kubernetes采用了Linux環(huán)境變量的方式來(lái)實(shí)現(xiàn),即每個(gè)Service生成一些對(duì)應(yīng)的Linux環(huán)境變量(ENV),并在每個(gè)Pod的容器啟動(dòng)時(shí),自動(dòng)注入這些環(huán)境變量,以實(shí)現(xiàn)通過(guò)Service的名字來(lái)建立連接的目的。
考慮到通過(guò)環(huán)境變量獲取Service的IP與端口的方式仍然不方便、不直觀,后來(lái)Kubernetes通過(guò)Add-On增值包的方式引入了DNS系統(tǒng),把服務(wù)名作為DNS域名,這樣程序就可以直接使用服務(wù)名來(lái)建立連接了。
關(guān)于DNS的部署,后續(xù)博文我會(huì)單獨(dú)講解,有興趣的朋友可以關(guān)注我的博客。
3.外部系統(tǒng)訪問(wèn)Service的問(wèn)題
Kubernetes集群里有三種IP地址,分別如下:

  • Node IP:Node節(jié)點(diǎn)的IP地址,即物理網(wǎng)卡的IP地址。
  • Pod IP:Pod的IP地址,即docker容器的IP地址,此為虛擬IP地址。
  • Cluster IP:Service的IP地址,此為虛擬IP地址。

外部訪問(wèn)Kubernetes集群里的某個(gè)節(jié)點(diǎn)或者服務(wù)時(shí),必須要通過(guò)Node IP進(jìn)行通信。
Pod IP是Docker Engine根據(jù)docker0網(wǎng)橋的IP地址段進(jìn)行分配的一個(gè)虛擬二層網(wǎng)絡(luò)IP地址,Pod與Pod之間的訪問(wèn)就是通過(guò)這個(gè)虛擬二層網(wǎng)絡(luò)進(jìn)行通信的,而真實(shí)的TCP/IP流量則是通過(guò)Node IP所在的物理網(wǎng)卡流出的。
Service的Cluster IP具有以下特點(diǎn):

  • Cluster IP僅僅作用于Service這個(gè)對(duì)象,并由Kubernetes管理和分配IP地址。
  • Cluster IP是一個(gè)虛擬地址,無(wú)法被ping。
  • Cluster IP只能結(jié)合Service Port組成一個(gè)具體的通信端口,供Kubernetes集群內(nèi)部訪問(wèn),單獨(dú)的Cluster IP不具備TCP/IP通信的基礎(chǔ),并且外部如果要訪問(wèn)這個(gè)通信端口,需要做一些額外的工作。
  • Node IP、Pod IP和Cluster IP之間的通信,采用的是Kubernetes自己設(shè)計(jì)的一種特殊的路由規(guī)則,與我們熟悉的IP路由有很大的區(qū)別。

我們的應(yīng)用如果想讓外部訪問(wèn),最常用的作法是使用NodePort方式。

apiVersion: v1
kind: Service
metadata:
  name: tomcat-service
spec:
  type: NodePort
  ports:
  - port: 8080
    nodePort: 31002
  selector:
    tier: frontend

NodePort的實(shí)現(xiàn)方式是在Kubernetes集群里的每個(gè)Node上為需要外部訪問(wèn)的Service開(kāi)啟一個(gè)對(duì)應(yīng)的TCP監(jiān)聽(tīng)端口,外部系統(tǒng)只要用任意一個(gè)Node的IP地址+具體的NodePort端口號(hào)即可訪問(wèn)此服務(wù)。
NodePort還沒(méi)有完全解決外部訪問(wèn)Service的所有問(wèn)題,比如負(fù)載均衡問(wèn)題,常用的做法是在Kubernetes集群之外部署一個(gè)負(fù)載均衡器。
初識(shí)Kubernetes(K8s):各種資源對(duì)象的理解和定義
Load balancer組件獨(dú)立于Kubernetes集群之外,可以是一個(gè)硬件負(fù)載均衡器,也可以是軟件方式實(shí)現(xiàn),例如HAProxy或者Nginx。這種方式,無(wú)疑是增加了運(yùn)維的工作量及出錯(cuò)的概率。
于是Kubernetes提供了自動(dòng)化的解決方案,如果我們使用谷歌的GCE公有云,那么只需要將type: NodePort改成type: LoadBalancer,此時(shí)Kubernetes會(huì)自動(dòng)創(chuàng)建一個(gè)對(duì)應(yīng)的Load balancer實(shí)例并返回它的IP地址供外部客戶(hù)端使用。其他公有云提供商只要實(shí)現(xiàn)了支持此特性的驅(qū)動(dòng),則也可以達(dá)到上述目的。

九、Volume(存儲(chǔ)卷)

Volume是Pod中能夠被多個(gè)容器訪問(wèn)的共享目錄。Volume定義在Pod上,被一個(gè)Pod里的多個(gè)容器掛載到具體的文件目錄下,當(dāng)容器終止或者重啟時(shí),Volume中的數(shù)據(jù)也不會(huì)丟失。Kubernetes支持多種類(lèi)型的Volume,例如GlusterFS、Ceph等分布式文件系統(tǒng)。
除了可以讓一個(gè)Pod里的多個(gè)容器共享文件、讓容器的數(shù)據(jù)寫(xiě)到宿主機(jī)的磁盤(pán)上或者寫(xiě)文件到網(wǎng)絡(luò)存儲(chǔ)中,Kubernetes還提供了容器配置文件集中化定義與管理,通過(guò)ConfigMap對(duì)象來(lái)實(shí)現(xiàn)。
Kubernetes支持多種Volume類(lèi)型,下面我們一一進(jìn)行介紹。
1.emptyDir
emptyDir是在Pod分配到Node時(shí)創(chuàng)建的,它的初始內(nèi)容為空,并且無(wú)須指定宿主機(jī)上對(duì)應(yīng)的目錄文件,它是Kubernetes自動(dòng)分配的一個(gè)目錄,當(dāng)Pod從Node上移除時(shí),emptyDir中的數(shù)據(jù)也會(huì)被永久刪除。
emptyDir的用途如下:

  • 臨時(shí)空間,例如用于某些應(yīng)用程序運(yùn)行時(shí)所需的臨時(shí)目錄,且無(wú)須永久保存。
  • 長(zhǎng)時(shí)間任務(wù)的中間過(guò)程CheckPoint的臨時(shí)保存目錄。
  • 一個(gè)容器需要從另一個(gè)容器中獲取數(shù)據(jù)的目錄(多容器共享目錄)。

emptyDir的定義如下:

template:
  metadata:
    labels:
      app: app-demo
      tier: frontend
  spec:
    volumes:
      - name: datavol
        emptyDir: {}
    containers:
    - name: tomcat-demo
      image: tomcat
      volumeMounts:
        - mountPath: /mydata-data
          name: datavol
      imagePullPolicy: IfNotPresent

2.hostPath
使用hostPath掛載宿主機(jī)上的文件或目錄,主要用于以下幾個(gè)方面:

  • 容器應(yīng)用程序生成的日志文件需要永久保存時(shí),可以使用宿主機(jī)的文件系統(tǒng)存儲(chǔ)。
  • 需要訪問(wèn)宿主機(jī)上Docker引擎內(nèi)部數(shù)據(jù)時(shí),可以定義hostPath的宿主機(jī)目錄為docker的數(shù)據(jù)存儲(chǔ)目錄,使容器內(nèi)部應(yīng)用可以直接訪問(wèn)docker的數(shù)據(jù)文件。

使用hostPath時(shí),需要注意以下幾點(diǎn):

  • 在不同的Node上的Pod掛載的是本地宿主機(jī)的目錄,如果要想讓不同的Node掛載相同的目錄,則可以使用網(wǎng)絡(luò)存儲(chǔ)或分布式文件存儲(chǔ)。
  • 如果使用了資源配額管理,則Kubernetes無(wú)法將其在宿主機(jī)上使用的資源納入管理。

hostPath的定義如下:

volumes:
- name: "persistent-storage"
  hostPath:
    path: "/data"

3.gcePersistentDisk
使用這種類(lèi)型的Volume表示使用谷歌公有云提供的永久磁盤(pán)(Persistent Disk,PD)存放數(shù)據(jù),使用gcePersistentDisk有以下一些限制條件:

  • Node需要是谷歌GCE云主機(jī)。
  • 這些云主機(jī)需要與PD存在于相同的GCE項(xiàng)目和Zone中。

通過(guò)gcloud命令創(chuàng)建一個(gè)PD:
gcloud compute disks create --size=500GB --zone=us-centrall-a my-data-disk
定義gcePersistentDisk類(lèi)型的Volume的示例如下:

volumes:
- name: test-volume
  gcPersistentDisk:
    pdName: my-data-disk
    fsType: ext4

4.awsElasticBlockStore
與GCE類(lèi)似,該類(lèi)型的Volume使用亞馬遜公有云提供的EBS Volume存儲(chǔ)數(shù)據(jù),需要先創(chuàng)建一個(gè)EBS Volume才能使用awsElasticBlockStore。
使用awsElasticBlockStore的一些限制條件如下:

  • Node需要是AWS EC2實(shí)例。
  • 這些AWS EC2實(shí)例需要與EBS volume存在于相同的region和availability-zone中。
  • EBS只支持單個(gè)EC2實(shí)例mount一個(gè)volume。

通過(guò)aws ec2 create-volume命令創(chuàng)建一個(gè)EBS volume:
aws ec2 create-volume --availability-zone eu-west-la --size 10 --volume-type gp2
定義awsElasticBlockStore類(lèi)型的Volume的示例如下:

volumes:
- name: test-volume
  awsElasticBlockStore:
    volumeID: aws:///
    fsType: ext4

5.NFS
使用NFS網(wǎng)絡(luò)文件系統(tǒng)提供的共享目錄存儲(chǔ)數(shù)據(jù)時(shí),我們需要在系統(tǒng)中部署一個(gè)NFS Server。
定義NFS類(lèi)型的Volume的示例如下:

volumes:
- name: nfs-volume
  nfs:
    server: nfs-server.localhost
    path: "/"

6.其他類(lèi)型的Volume

  • iscsi:使用iSCSI存儲(chǔ)設(shè)備上的目錄掛載到Pod中。
  • flocker:使用Flocker來(lái)管理存儲(chǔ)卷。
  • glusterfs:使用GlusterFS網(wǎng)絡(luò)文件系統(tǒng)的目錄掛載到Pod中。
  • rbd:使用Ceph塊設(shè)備共享存儲(chǔ)(Rados Block Device)掛載到Pod中。
  • gitRepo:通過(guò)掛載一個(gè)空目錄,并從GIT庫(kù)clone一個(gè)git repository以供Pod使用。
  • secret:一個(gè)secret volume用于為Pod提供加密的信息,可以將定義在Kubernetes中的secret直接掛載為文件讓Pod訪問(wèn)。Secret volume是通過(guò)tmfs(內(nèi)存文件系統(tǒng))實(shí)現(xiàn)的,所以這種類(lèi)型的volume不會(huì)持久化。

十、Persistent Volume

上面提到的Volume是定義在Pod上的,屬于“計(jì)算資源”的一部分,而實(shí)際上,“網(wǎng)絡(luò)存儲(chǔ)”是相對(duì)獨(dú)立于“計(jì)算資源”而存在的一種實(shí)體資源。比如在使用云主機(jī)的情況下,我們通常會(huì)先創(chuàng)建一個(gè)網(wǎng)絡(luò)存儲(chǔ),然后從中劃出一個(gè)“網(wǎng)盤(pán)”并掛載到云主機(jī)上。Persistent Volume(簡(jiǎn)稱(chēng)PV)和與之相關(guān)聯(lián)的Persistent Volume Claim(簡(jiǎn)稱(chēng)PVC)實(shí)現(xiàn)了類(lèi)似的功能。
PV與Volume的區(qū)別如下:

  • PV只能是網(wǎng)絡(luò)存儲(chǔ),不屬于任何Node,但可以在每個(gè)Node上訪問(wèn)。
  • PV并不是定義在Pod上的,而是獨(dú)立于Pod之外定義。

下面是NFS類(lèi)型PV的yaml定義內(nèi)容,聲明了需要5G的存儲(chǔ)空間:

apiVersion: v1
kind: PersistentVolume
metadata:
  name: pv003
spec:
  capacity:
    storage: 5Gi
  accessModes:
    - ReadWriteOnce
  nfs:
    path: /somepath
    server: 172.17.0.2

PV的accessModes屬性有以下類(lèi)型:

  • ReadWriteOnce:讀寫(xiě)權(quán)限、并且只能被單個(gè)Node掛載。
  • ReadOnlyMany:只讀權(quán)限、允許被多個(gè)Node掛載。
  • ReadWriteMany:讀寫(xiě)權(quán)限、允許被多個(gè)Node掛載。

如果Pod想申請(qǐng)使用PV資源,則首先需要定義一個(gè)PersistentVolumeClaim(PVC)對(duì)象:

apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: myclaim
spec:
  accessModes:
    - ReadWriteOnce
  resources:
    requests:
      storage: 5Gi

然后在Pod的volume定義中引用上述PVC即可

volumes:
  - name: mypd
    persistentVolumeClaim:
      claimName: myclaim

PV是有狀態(tài)的對(duì)象,它有以下幾種狀態(tài):

  • Available:空閑狀態(tài)。
  • Bound:已經(jīng)綁定到某個(gè)PVC上。
  • Released:對(duì)應(yīng)的PVC已經(jīng)刪除,但資源還沒(méi)有被集群收回。
  • Failed:PV自動(dòng)回收失敗。

十一、Namespace(命名空間)

通過(guò)將Kubernetes集群內(nèi)部的資源對(duì)象“分配”到不同的Namespace中,形成邏輯上分組的不同項(xiàng)目、小組或用戶(hù)組,便于不同的分組在共享使用整個(gè)集群的資源的同時(shí)還能被分別管理。
Kubernetes集群在啟動(dòng)后,會(huì)創(chuàng)建一個(gè)名為“default”的Namespace,通過(guò)kubectl可以查看到:
kubectl get namespaces
如果不特別指明Namespace,則用戶(hù)創(chuàng)建的Pod、RC、RS、Service都獎(jiǎng)被系統(tǒng)創(chuàng)建到這個(gè)默認(rèn)的名為default的Namespace中。
下面是Namespace的定義示例:

apiVersion: v1
kind: Namespace
metadata:
  name: development

定義一個(gè)Pod,并指定它屬于哪個(gè)Namespace:

apiVersion: v1
kind: Pod
metadata:
  name: busybox
  namespace: development
spec:
  containers:
  - image: busybox
    command:
      - sleep
      - "3600"
    name: busybox

使用kubectl get命令查看Pod狀態(tài)信息時(shí),需要加上--namespace參數(shù),指定查看哪個(gè)namespace下的資源對(duì)象,不加這個(gè)參數(shù)則默認(rèn)查看 default下的資源對(duì)象。
kubectl get pods --namespace=development
當(dāng)我們給每個(gè)租戶(hù)創(chuàng)建一個(gè)Namespace來(lái)實(shí)現(xiàn)多租戶(hù)的資源隔離時(shí),還能結(jié)合Kubernetes的資源配額管理,限定不同租戶(hù)能占用的資源,例如CPU使用量、內(nèi)存使用量等。

十二、Annotation(注解)

Annotation與Label類(lèi)似,也使用key/value鍵值對(duì)的形式進(jìn)行定義。不同的是Label具有嚴(yán)格的命名規(guī)則,它定義的是Kubernetes對(duì)象的元數(shù)據(jù)(Metadata),并且用于Label Selector。而Annotation則是用戶(hù)任意定義的“附加”信息,以便于外部工具進(jìn)行查找。通常Kubernetes的模塊會(huì)通過(guò)Annotation的方式標(biāo)記資源對(duì)象的一些特殊信息。
使用Annotation來(lái)記錄的信息如下:

  • build信息、release信息、Docker鏡像信息等,例如時(shí)間戳、release id號(hào)、PR號(hào)、鏡像bash值、docker registry地址等。
  • 日志庫(kù)、監(jiān)控庫(kù)、分析庫(kù)等資源庫(kù)的地址信息。
  • 程序調(diào)試工具信息,例如工具名稱(chēng)、版本號(hào)等。
  • 團(tuán)隊(duì)的聯(lián)系信息,例如電話號(hào)碼、負(fù)責(zé)人名稱(chēng)、網(wǎng)址等。

注:本文內(nèi)容摘自《Kubernetes權(quán)威指南:從Docker到Kubernetes實(shí)踐全接觸(紀(jì)念版》,并精減了部分內(nèi)部,而且對(duì)部分內(nèi)容做了相應(yīng)的調(diào)整,可以幫助大家加深對(duì)Kubernetes的各種資源對(duì)象的理解和定義方法,關(guān)注我的博客,跟我一起開(kāi)啟k8s的學(xué)習(xí)之旅吧。


文章名稱(chēng):初識(shí)Kubernetes(K8s):各種資源對(duì)象的理解和定義
當(dāng)前路徑:http://weahome.cn/article/jheoip.html

其他資訊

在線咨詢(xún)

微信咨詢(xún)

電話咨詢(xún)

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部