您所在的位置 : IT客 » 應用技術 » Web服務器

nginx 502 Bad Gateway 錯誤解決辦法

來源:http://www.lvtao.net/html/2020.html
 一些運行在Nginx上的網站有時候會出現“502 Bad Gateway”錯誤,有些時候甚至頻繁的出現。以下是小編蒐集整理的一些Nginx 502錯誤的排查方法,供參考:    Nginx 502錯誤的原因比較多,是因爲在代理模式下後端服務器出現問題引起的。這些錯誤一般都不是nginx本身的問題,一定要從後端找原因!但 nginx把這些出錯都攬在自己身上了,着實讓nginx的推廣者備受置疑,畢竟從字眼上理解,bad gateway?不就是bad nginx嗎?讓 不瞭解的人看到,會直接把責任推在nginx身上,希望nginx下一個版本會把出錯提示寫稍微友好一些,至少不會是現在簡單的一 句 502 Bad Gateway,另外還不忘附上自己的大名。 Nginx 502的觸發條件   502錯誤最通常的 出現情況就是後端主機當機。在upstream配置裏有這麼一項配置:proxy_next_upstream,這個配置指定了 nginx在從一個後端 主機取數據遇到何種錯誤時會轉到下一個後端主機,裏頭寫上的就是會出現502的所有情況拉,默認是error timeout。error就是當機、斷綫 之類的,timeout就是讀取堵塞超時,比較容易理解。我一般是全寫上的: proxy_next_upstream error timeout invalid_header http_500 http_503;    不過現在可能我要去掉http_500這一項了,http_500指定後端返回500錯誤時會轉一個主機,後端的jsp出錯的話,本來會打印一 堆 stacktrace的錯誤信息,現在被502取代了。但公司的程序員可不這麼認爲,他們認定是nginx出現了錯誤,我實在沒空跟他們解釋502的 原理 了…… 503錯誤就可以保留,因爲後端通常是apache resin,如果apache死機就是error,但resin死機,僅僅是503,所以還是有必要保留的。 解決辦法 遇到502問題,可以優先考慮按照以下兩個步驟去解決。 1、查看當前的PHP FastCGI進程數是否夠用: netstat -anpo | grep "php-cgi" | wc -l 如果實際使用的“FastCGI進程數”接近預設的“FastCGI進程數”,那麼,說明“FastCGI進程數”不夠用,需要增大。 2、部分PHP程序的執行時間超過了Nginx的等待時間,可以適當增加nginx.conf配置文件中FastCGI的timeout時間,例如: http {
fastcgi_connect_timeout 300;
fastcgi_send_timeout 300;
fastcgi_read_timeout 300; }
......   php.ini中memory_limit設低了會出錯,修改了php.ini的memory_limit爲64M,重啓nginx,發現好了,原來是PHP的內存不足了。   如果這樣修改了還解決不了問題,可以參考下面這些方案: 一、max-children和max-requests   一臺服務器上運行着nginx php(fpm) xcache,訪問量日均 300W pv左右。   最近經常會出現這樣的情況:php頁面打開很慢,cpu使用率突然降至很低,系統負載突然升至很高,查看網卡的流量,也會發現突然降到了很低。這種情況只持續數秒鐘就恢復了。   檢查php-fpm的日志文件發現了一些綫索。 Sep 30 08:32:23.289973 [NOTICE] fpm_unix_init_main(), line 271: getrlimit(nofile): max:51200, cur:51200 Sep 30 08:32:23.290212 [NOTICE] fpm_sockets_init_main(), line 371: using inherited socket fd=10, “127.0.0.1:9000″ Sep 30 08:32:23.290342 [NOTICE] fpm_event_init_main(), line 109: libevent: using epoll Sep 30 08:32:23.296426 [NOTICE] fpm_init(), line 47: fpm is running, pid 30587   在這幾句的前面,是1000多行的關閉children和開啓children的日誌。    原來,php-fpm有一個參數 max_requests,該參數指明瞭,每個children最多處理多少個請求後便會被關閉,默認的設置是 500。因爲php是把請求輪詢給每個 children,在大流量下,每個childre到達max_requests所用的時間都差不多,這樣就造成 所有的children基本上在同一時間 被關閉。   在這期間,nginx無法將php文件轉交給php-fpm處理,所以cpu會降 至很低(不用處理php,更不用執行sql),而負載會升至很高(關閉和開啓children、nginx等待php-fpm),網卡流量也降至很低 (nginx無法生成數據傳輸給客戶端)   解決問題很簡單,增加children的數量,並且將 max_requests 設置未 0 或者一個比較大的值:   打開 /usr/local/php/etc/php-fpm.conf調大以下兩個參數(根據服務器實際情況,過大也不行) 5120 600   然後重啓php-fpm。 二、增加緩衝區容量大小    將nginx的error log打開,發現 “pstream sent too big header while reading response header from upstream” 這樣的錯誤提示。查閱了一下資料,大意是nginx緩衝區有一個bug造成的,我們網站的頁面消耗佔用緩衝區可能過大。參考老外寫的修 改辦法增加了緩衝 區容量大小設置,502問題徹底解決。後來系統管理員又對參數做了調整隻保留了2個設置參 數:client head buffer,fastcgi buffer size。 三、request_terminate_timeout   如果主要是在一些post或者數據庫操作的時候出現502這種情況,而不是在靜態頁面操作中常見,那麼可以查看一下php-fpm.conf設置中的一項: request_terminate_timeout 這個值是max_execution_time,就是fast-cgi的執行腳本時間。 0s 0s爲關閉,就是無限執行下去。(當時裝的時候沒仔細看就改了一個數字)問題解決了,執行很長時間也不會出錯了。優化fastcgi中,還可以改改這個值5s 看看效果。 php-cgi進程數不夠用、php執行時間長、或者是php-cgi進程死掉,都會出現502錯誤。 四、檢查php-fpm.conf的用戶組
修改php-fpm.conf
Unix user of processes Unix group of processes 將去掉即可。至於user/group根據實際情況修改(www) 五、檢查日誌大小
看看php-fpm的錯誤日誌有多大,超過2G,就會啓動不起來 問題分析:FastCGI調用的是fopen方式去讀寫日志文件,而fopen不支持2G以上文件,所以後續的工作不再繼續進行,出錯直接退出。所以,要根除該故障,就要將日誌中出現的錯誤和告警都消除 可以調整一下記錄日誌的級別
php-fpm.conf
改成error,可以少非常多!
error
幾乎沒記錄了。 六、系統最大連接數 open files 另外還有一種情況就是系統的文件最大打開數(默認1024)小於php-fpm.conf中的配置的最大打開數, ulimit -a 解決如下:
echo 'ulimit -SHn 65535' >>/etc/profile
echo -e "* soft nofile 65535
* hard nofile 65535">>/etc/security/limits.conf
source /etc/profile
然後啓動php試試。 七、NGINX相關防CC參數 主動抑制方法    爲了讓Nginx支持更多的併發連接數,根據實際情況對工作綫程數和每個工作綫程支持的最大連接數進行調整。例如設 置"worker_processes 10"和"worker_connections 1024",那這臺服務器支持的最大連接數就是 10×1024=10240。 worker_processes 10;
events {
use epoll;
worker_connections 10240;
}  Nginx 0.7開始提供了2個限制用戶連接的模塊:NginxHttpLimitZoneModule和NginxHttpLimitReqModule。NginxHttpLimitZoneModule可以根據條件進行併發連接數控制。 例如可以定義以下代碼: http {
limit_zone my_zone $binary_remote_addr 10m;
server {
location /somedir/ {
limit_conn my_zone 1; }
}    其中"limit_zone my_zone $binary_remote_addr 10m"的意思是定義一個名稱爲my_zone的存儲區域、 my_zone中的內容爲遠程IP地址、my_zone的大小爲10M;"location /somedir/"的意思是針對somedir目錄應用規 則;"limit_conn my_zone 1"的意思是針對上面定義的my_zone記錄區記錄的IP地址在指定的目錄中只能建立一個連接。   Nginx Http Limit Req Module可以根據條件進行請求頻率的控制。例如可以定義以下代碼: http {
limit_req_zone $binary_remote_addr zone=my_req_zone:10m rate=1r/s; server { location /somedir/ {
limit_req_zone zone= my_req_zone burst=2;
頂一下
(0)
踩一下
(0)

發表評論:

昵稱: *
內容:
驗證碼:
rss· 投稿· 加入收藏· 手機版