本篇內(nèi)容介紹了“TCP全連接隊(duì)列是什么”的有關(guān)知識,在實(shí)際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
創(chuàng)新互聯(lián)-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價比潞城網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式潞城網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋潞城地區(qū)。費(fèi)用合理售后完善,10多年實(shí)體公司更值得信賴。
今天有個小伙伴跑過來告訴我有個奇怪的問題需要協(xié)助下,問題確實(shí)也很奇怪??蛻舳苏{(diào)用RT比較高并伴隨著間歇性異常Connection reset出現(xiàn),而服務(wù)端CPU 、線程棧等看起來貌似都很正常,而且服務(wù)端的RT很短。
這里先說下結(jié)果:因?yàn)門CP全連接隊(duì)列太小導(dǎo)致的連接被丟棄,因?yàn)轫?xiàng)目使用Spring Boot 內(nèi)置的Tomcat,而默認(rèn)accept-count是100,而這個參數(shù)在這里就代表了全連接隊(duì)列大小。所以在請求波峰的時候全連接隊(duì)列被打滿導(dǎo)致有連接丟棄。所以我們調(diào)整server.tomcat.accept-count這個參數(shù)解決了問題。
好了為了知其然知其所以然,從異常信息來看可能是TCP連接出現(xiàn)了什么問題,其中重點(diǎn)就是半連接隊(duì)列和全連接隊(duì)列。下面就來看看什么是TCP 半連接隊(duì)列和全連接隊(duì)列,其為什么會出現(xiàn)這種奇怪的現(xiàn)象。
TCP三次握手時,Linux內(nèi)核會維護(hù)兩個隊(duì)列:
半連接隊(duì)列,被稱為SYN隊(duì)列
全連接隊(duì)列,被稱為 accept隊(duì)列
老生常談,還要從大家都熟悉TCP三次握手說起,來看一張圖:
1、客戶端發(fā)送SYN包,并進(jìn)入SYN_SENT狀態(tài)
2、服務(wù)端接收到數(shù)據(jù)包將相關(guān)信息放入半連接隊(duì)列(SYN 隊(duì)列),并返回SYC+ACK包給客戶端。
3、服務(wù)端接收客戶端ACK數(shù)據(jù)包,這時如果全連接隊(duì)列(accept 隊(duì)列)沒滿,就會從半連接隊(duì)列里面將數(shù)據(jù)取出來放入全連接隊(duì)列,等待應(yīng)用使用,當(dāng)隊(duì)列已滿就會跟據(jù)tcp_abort_on_overflow配置執(zhí)行策略。
這里半連接隊(duì)列(SYN 隊(duì)列)和全連接隊(duì)列(accept 隊(duì)列)就是重點(diǎn)了。
當(dāng)查詢問題的時候,我們就需要查看全連接隊(duì)列的狀態(tài)。服務(wù)端我們可以使用 ss 命令進(jìn)行查看,ss 命令獲取數(shù)據(jù)又分為LISTEN 狀態(tài),和非LISTEN 狀態(tài)。
LISTEN 狀態(tài)下數(shù)據(jù):
# -l 顯示正在Listener 的socket # -n 不解析服務(wù)名稱 # -t 只顯示tcp # Recv-Q 完成三次握手并等待服務(wù)端 accept() 的 TCP 全連接總數(shù), # Send-Q 全連接隊(duì)列大小 [root@server ~]# ss -lnt |grep 6080 State Recv-Q Send-Q Local Address:Port Peer Address:Port LISTEN 0 100 :::6080 :::*
非LISTEN 狀態(tài)下數(shù)據(jù):
# Recv-Q 已收到但未被應(yīng)用進(jìn)程讀取的字節(jié)數(shù) # Send-Q 已發(fā)送但未收到確認(rèn)的字節(jié)數(shù) [root@server ~]# ss -nt |grep 6080 State Recv-Q Send-Q Local Address:Port Peer Address:Port ESTAB 0 433 :::6080 :::*
當(dāng)有大量請求進(jìn)入,如果TCP全連接隊(duì)列過小的話就會出現(xiàn)全連接隊(duì)列溢出,當(dāng)出現(xiàn)全連接隊(duì)列溢出現(xiàn)象的時候,后續(xù)的請求就會被丟棄,就會出現(xiàn)服務(wù)請求數(shù)量上不去的現(xiàn)象。
前面提到在TCP三次握手的最后一步,當(dāng)全連接隊(duì)列已滿就會根據(jù)tcp_abort_on_overflow策略進(jìn)行處理。Linux 可通過 /proc/sys/net/ipv4/tcp_abort_on_overflow 進(jìn)行配置。
當(dāng)tcp_abort_on_overflow=0,服務(wù)accept 隊(duì)列滿了,客戶端發(fā)來ack,服務(wù)端直接丟棄該ACK,此時服務(wù)端處于【syn_rcvd】的狀態(tài),客戶端處于【established】的狀態(tài)。在該狀態(tài)下會有一個定時器重傳服務(wù)端 SYN/ACK 給客戶端(不超過 /proc/sys/net/ipv4/tcp_synack_retries 指定的次數(shù),Linux下默認(rèn)5)。超過后,服務(wù)器不在重傳,后續(xù)也不會有任何動作。如果此時客戶端發(fā)送數(shù)據(jù)過來,服務(wù)端會返回RST。(這也就是我們的異常原因了)
當(dāng)tcp_abort_on_overflow=1,服務(wù)端accept隊(duì)列滿了,客戶端發(fā)來ack,服務(wù)端直接返回RST通知client,表示廢掉這個握手過程和這個連接,client會報connection reset by peer。
命令查詢,我們可以根據(jù)TCP 的握手特性來看:
[root@server ~] netstat -s | egrep "listen|LISTEN" 7102 times the listen queue of a socket overflowed 全連接隊(duì)列溢出的次數(shù) 7102 SYNs to LISTEN sockets ignored 表示半連接隊(duì)列溢出次數(shù) 710 2times表示全連接隊(duì)列溢出的次數(shù),隔幾秒查詢一次,如果這個數(shù)字一直在遞增,說明全連接隊(duì)列出現(xiàn)了溢出的狀態(tài)
全連接隊(duì)列大小取決于backlog 和somaxconn 的最小值,也就是 min(backlog,somaxconn)
somaxconn 是Linux內(nèi)核參數(shù),默認(rèn)128,可通過/proc/sys/net/core/somaxconn進(jìn)行配置
backlog是 listen(int sockfd,int backlog)函數(shù)中的參數(shù)backlog,Tomcat 默認(rèn)100,Nginx 默認(rèn)511.
半連接隊(duì)列的長度可以通過 /proc/sys/net/ipv4/tcp_max_syn_backlog來設(shè)置.os層面,只能設(shè)一個,由所有程序共享)
半連接,也就是服務(wù)端處于SYN_RECV狀態(tài)的TCP連接,這種狀態(tài)的都在半連接隊(duì)列,因此可以使用如下命令進(jìn)行計算:
#查看半連接隊(duì)列 [root@server ~] netstat -natp | grep SYN_RECV | wc -l 233 #表示半連接狀態(tài)的TCP連接有233個
“TCP全連接隊(duì)列是什么”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!