告警鍵值? ?-----------------------------------------------------中文釋義--------------------------------------------------------------------------------------故障持續(xù)時(shí)間
創(chuàng)新互聯(lián)建站是一家專注于成都做網(wǎng)站、網(wǎng)站制作與策劃設(shè)計(jì),陸良網(wǎng)站建設(shè)哪家好?創(chuàng)新互聯(lián)建站做網(wǎng)站,專注于網(wǎng)站建設(shè)10多年,網(wǎng)設(shè)計(jì)領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:陸良等地區(qū)。陸良做網(wǎng)站價(jià)格咨詢:13518219792AlertmanagerConfigInconsistent | AlertManager群集xxxx的實(shí)例配置不同步。 | 5m |
AlertmanagerDown | AlertManager已從普羅米修斯目標(biāo)發(fā)現(xiàn)中消失。 | 15m |
AlertmanagerFailedReload | 重新加載AlertManager的配置失敗 | 10m |
AlertmanagerMembersInconsistent | AlertManager未找到群集的所有其他成員。 | 5m |
CPUThrottlingHigh | cpu節(jié)流高,使用低CPU限制,就算高峰期,整個(gè)集群還是有很多空閑資源 | 15m |
etcdGRPCRequestsSlow | ETCD GRPC請(qǐng)求緩慢 | 10m |
etcdHighCommitDurations | ETCD提交時(shí)間過(guò)長(zhǎng) | 10m |
etcdHighFsyncDurations | ETCD同步時(shí)間過(guò)長(zhǎng) | 10m |
etcdHighNumberOfFailedGRPCRequests | ETCD失敗的GRPC請(qǐng)求數(shù)太多 | 10m |
etcdHighNumberOfFailedHTTPRequests | ETCD失敗的HTTP請(qǐng)求數(shù)太多 | 10m |
etcdHighNumberOfFailedProposals | ETCD失敗的計(jì)劃數(shù)量很多 | 15m |
etcdHighNumberOfLeaderChanges | ETCD Leader 變更次數(shù)多 | 15m |
etcdHTTPRequestsSlow | ETCD HTTP請(qǐng)求速度慢 | 10m |
etcdInsufficientMembers | ETCD成員不足 | 3m |
etcdMemberCommunicationSlow | ETCD成員通信緩慢 | 10m |
etcdNoLeader | ETCD沒(méi)有Leader | 1m |
KubeAPIDown | KubeAPI 宕掉或不存在 | 15m |
KubeAPIErrorsHigh | API服務(wù)器正在為請(qǐng)求的 值 返回錯(cuò)誤。 | 10m |
KubeAPILatencyHigh | API服務(wù)器每秒鐘延遲超過(guò)99% | 10m |
KubeClientCertificateExpiration | 用于向APIServer進(jìn)行身份驗(yàn)證的客戶端證書將在7天內(nèi)過(guò)期。 | 5m |
KubeClientErrors | 連接客戶端API 錯(cuò)誤 | 15m |
KubeControllerManagerDown | KubeControllerManager 宕掉 | 15m |
KubeCPUOvercommit | 該集群cpu超出資源限額 | 5m |
KubeCronJobRunning | CronJob 運(yùn)行超過(guò)1小時(shí) | 1h |
KubeDaemonSetMisScheduled | DaemonSet調(diào)度錯(cuò)誤,沒(méi)有跑到正確的機(jī)器上 | 10m |
KubeDaemonSetNotScheduled | DaemonSet 位設(shè)置運(yùn)行在哪,也就是分配錯(cuò)誤 | 10m |
KubeDaemonSetRolloutStuck | DaemonSet 啟動(dòng)或滾動(dòng)時(shí)卡??? | 15m |
KubeDeploymentGenerationMismatch | Deployment 生成部署不匹配,部署失敗 | 15m |
KubeDeploymentReplicasMismatch | Deployment 與預(yù)期的副本數(shù)不匹配的時(shí)間已超過(guò)一小時(shí)。 | 1h |
KubeJobCompletion | Job 超過(guò)一小時(shí)才完成 | 1h |
KubeJobFailed | Job 失敗 | 1h |
KubeletDown | Kubelet宕掉了 | 15m |
KubeletTooManyPods | pods數(shù)量太多,超過(guò)極限的110% | 15m |
KubeMemOvercommit | 集群內(nèi)存資源使用過(guò)度,無(wú)法再容忍故障節(jié)點(diǎn)漂移 | 5m |
KubeNodeNotReady | node故障超過(guò)1小時(shí) | 1h |
KubePersistentVolumeErrors | 持久卷Volume 異常 | 5m |
KubePersistentVolumeFullInFourDays | 根據(jù)最近的采樣,某Volume 講在4天內(nèi)填滿 | 5m |
KubePersistentVolumeUsageCritical | 該持久卷使用權(quán)限不足,只能在xxx空間內(nèi)使用 | 1m |
KubePodCrashLooping | 該pod CrashLoopBackOff 狀態(tài)重啟超過(guò)5分鐘 | 1h |
KubePodNotReady | pod處于未就緒狀態(tài)超過(guò)一小時(shí)。 | 1h |
KubeQuotaExceeded | Kube 使用超出配額 | 15m |
KubeSchedulerDown | KubeScheduler 宕掉 | 15m |
KubeStatefulSetGenerationMismatch | StatefulSet 錯(cuò)誤,但尚未回滾 | 15m |
KubeStatefulSetReplicasMismatch | statefulset 副本集不匹配,超過(guò)15分鐘 | 15m |
KubeStatefulSetUpdateNotRolledOut | statefulset 更新尚未結(jié)束(更新超時(shí)) | 15m |
KubeStateMetricsDown | KubeStateMetrics 宕掉 | 15m |
KubeVersionMismatch | kube版本不匹配 | 1h |
NodeDiskRunningFull | node磁盤空間超過(guò)85% | 10m |
NodeExporterDown | NodeExporter 宕機(jī) | 15m |
PrometheusConfigReloadFailed | Prometheus重載配置失敗 | 10m |
PrometheusDown | Prometheus 宕機(jī) | 15m |
PrometheusErrorSendingAlerts | 從Prometheus 向AlertManager 發(fā)送警報(bào)時(shí)出錯(cuò) | 10m |
PrometheusNotConnectedToAlertmanagers | Prometheus 不能連接AlertManager | 10m |
PrometheusNotificationQueueRunningFull | Prometheus的警報(bào)通知隊(duì)列已滿 | 10m |
PrometheusNotIngestingSamples | 信息存儲(chǔ)opentsdb 異常 | 10m |
PrometheusOperatorDown | PrometheusOperator 宕機(jī) | 15m |
PrometheusOperatorNodeLookupErrors | PrometheusOperator 節(jié)點(diǎn)錯(cuò)誤 | 10m |
PrometheusOperatorReconcileErrors | PrometheusOperator 有錯(cuò)誤日志 | 10m |
PrometheusTargetScrapesDuplicate | 由于時(shí)間戳重復(fù)但值不同,拒絕了很多采集數(shù)據(jù) | 10m |
PrometheusTSDBCompactionsFailing | 壓縮實(shí)例塊出現(xiàn)問(wèn)題超過(guò)4個(gè)小時(shí) | 12h |
PrometheusTSDBReloadsFailing | 磁盤重新加載數(shù)據(jù)塊時(shí)出現(xiàn)問(wèn)題超過(guò)4個(gè)小時(shí) | 12h |
PrometheusTSDBWALCorruptions | TSDB 的wal 預(yù)寫日志已損壞 | 4h |
TargetDown | 整體labels.job量下降了10%? | 10m |
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無(wú)理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。