Nginx 프록시 로드 밸런싱, 요즘 어떻게 하는 게 효율적인가요?

neonbada

요즘 백엔드 서비스들이 늘어나면서 Nginx로 리버스 프록시 구성하는 게 필수가 됐어요.

간단하게 서버 묶어두고 로드 밸런싱 걸어주는 건 기본적인 건 아는데,

여기서 L4 레벨로 갈지 L7 레벨로 갈지, 아니면 아예 다른 접근이 좋은 건지 헷갈려서요.

실제 운영 환경에서 가장 많이 쓰면서도 '이게 최적이다' 싶은 조합이나,

특정 시나리오(예: API 게이트웨이 역할)에서 더 유리한 설정 팁 같은 거 있을까요?

어떤 걸 기준으로 판단해야 할지 감이 안 와서요.

orbitdami458

진짜 좋은 질문이십니다.
이거 백엔드 인프라 쪽에서 가장 많이 부딪히면서도, 막상 이론만 배우면 실제 운영 환경의 복잡성까지 커버하기 어려워서 헷갈리기 십상한 부분이에요.
저도 몇 번 겪어보면서 "이게 최선일까?" 싶은 순간들이 많았거든요.
결론부터 말씀드리자면, 요즘 트렌드는 'L7 레벨에서 가능한 한 많은 로직을 처리'하는 방향으로 가고 있고, Nginx는 그 역할을 꽤 잘 수행할 수 있게 발전했어요.
물론 무조건 L7이 최고는 아니기 때문에, 몇 가지 기준을 잡고 설명해 드릴게요.
우선 L4랑 L7 개념부터 간단히 다시 짚고 넘어가야 할 것 같아요.
L4는 전송 계층(TCP/UDP)에서 동작하기 때문에, 여기서는 요청의 IP 주소나 포트 번호 같은 비교적 낮은 수준의 정보만 보고 트래픽을 분산시키는 거죠.
쉽게 말해, "여기로 들어오면 그냥 이쪽 서버 그룹으로 보내줘" 수준이에요.
반면 L7은 응용 계층(HTTP/HTTPS)에서 동작하기 때문에, 요청 헤더, URI 경로, HTTP 메소드(GET, POST 등) 같은 '실제 내용물'을 보고 라우팅 결정을 할 수 있어요.
그래서 API 게이트웨이나 서비스 조합이 복잡할수록 L7이 압도적으로 유리합니다.
어떤 기준으로 판단해야 하냐면, '어떤 기준으로 트래픽을 분산시키고 싶은가'로 보시면 돼요.
만약 "단순히 서버가 다운됐으니까, 살아있는 서버로 보내줘" 수준의 장애 복구만 목표라면 L4로도 충분할 수 있어요.
하지만 "사용자가 /api/v2/user로 요청했으면 A 서버 그룹으로, /api/v1/user로 요청했으면 B 서버 그룹으로 보내줘" 같은 비즈니스 로직 기반의 분기가 필요하다면, 무조건 L7이 필요해요.
요즘 서비스들은 90% 이상 이 비즈니스 로직 기반의 분기가 필요하기 때문에, 저는 L7을 기준으로 생각하시는 걸 추천드려요.
--- [실무 팁] API 게이트웨이 역할일 경우의 L7 최적화 조합 만약 질문하신 것처럼 API 게이트웨이 역할을 한다면, Nginx 설정 시 단순히 upstream 블록에 서버 목록만 넣는 걸 넘어서 몇 가지 고급 설정을 꼭 고려하셔야 해요.
1.
경로 기반 라우팅 (Path-based Routing): 이건 기본 중의 기본이죠.
location /api/v2/ { proxy_pass http://backend_v2; } 이렇게 버전별로 분리하는 건 필수적입니다.
만약 여러 버전이 같은 서버 풀을 사용해야 한다면, rewrite나 proxy_pass의 URL 패턴을 잘 활용해서 백엔드 서비스가 어떤 버전의 요청을 받았는지 알 수 있게 해주는 것이 중요합니다.
2.
헤더 기반 라우팅 및 변환 (Header Manipulation): 이게 진짜 실력을 보여주는 부분이에요.
클라이언트가 보내는 헤더(예: X-Client-Type: mobile 또는 Accept: application/json)를 보고 트래픽을 분기할 수 있어요.
예를 들어, 특정 모바일 앱에서만 접근하는 API가 있다면, if 조건문이나 map 지시어를 사용해서 해당 헤더가 있을 때만 특정 백엔드 그룹으로 보내는 거죠.
또는, 클라이언트가 보낸 헤더를 받아서 백엔드 서버가 이해하기 쉽게 가공(예: X-Forwarded-For 외에 자체적인 X-Request-ID를 추가)해서 전달해 주는 것도 중요해요.
3.
로드 밸런싱 알고리즘 세분화: Nginx 기본 설정은 round-robin이 기본인데, 이게 모든 상황에 최적은 아니에요.
만약 어떤 서버가 트래픽을 많이 받는 패턴을 보인다면, least_conn (가장 적은 연결 수를 가진 서버로 보내기)나 ip_hash (특정 클라이언트 IP를 항상 같은 서버로 보내기, 세션 유지 목적)를 사용하는 게 훨씬 안정적이에요.
특히 세션 유지가 필요한 API(예: 로그인 세션)라면, 반드시 ip_hash를 사용해서 클라이언트 IP를 기준으로 특정 서버에 고정시키는 게 실수 방지책입니다.
4.
트래픽 제어 및 보호 (Rate Limiting & WAF 역할): 게이트웨이의 가장 중요한 역할 중 하나가 바로 '보안과 부하 제어'입니다.
limit_req_status와 limit_req_zone 지시어를 써서, 특정 IP나 전체 API에 대해 초당 요청 횟수를 제한하는 건 필수예요.
이렇게 해야 갑작스러운 트래픽 폭주(DDoS 공격이나 버그로 인한 반복 요청)로부터 백엔드 서버들이 마비되는 걸 막을 수 있습니다.
이걸 아예 WAF(Web Application Firewall)의 기본 기능으로 활용한다고 보시면 됩니다.
--- ️ [흔한 실수] 그리고 주의해야 할 함정들 1.
Keep-Alive와 Timeouts: 백엔드 서버와 Nginx 사이의 연결 유지 시간(Keep-Alive)을 너무 길게 잡거나, 반대로 너무 짧게 잡으면 통신이 불안정해질 수 있어요.
특히 요청이 없을 때 연결을 너무 오래 열어두면 리소스 낭비가 크니, 적절한 proxy_read_timeout과 proxy_send_timeout을 설정해서 유휴 연결은 빨리 끊어주는 게 좋아요.
2.
Health Check의 부재: 가장 흔한 실수 중 하나가 서버 장애 감지를 안 하는 거예요.
upstream 블록 내에서 server backend.local down; 처럼 명시적으로 서버를 비활성화하는 건 수동 작업이므로, Nginx의 Active Health Check 기능을 활용해야 합니다.
server backend.local down; 대신, server backend.local weight=1 max_fails=3 fail_timeout=10s; 와 같이 max_fails와 fail_timeout을 설정해서, 일정 횟수 이상 응답이 없거나 5xx 에러가 오면 자동으로 해당 서버를 로드 밸런싱 풀에서 제외시키는 설정을 하셔야 해요.
3.
Keep-Alive 헤더 누락: L7에서 복잡한 로직을 추가할 때, 요청 헤더를 그대로 전달하지 않고 필요한 것만 가공해서 보내는 경우가 많은데, 이때 클라이언트가 보냈던 중요한 헤더(예: Authorization 토큰, Cookie 등)를 실수로 프록시 과정에서 누락시키는 경우가 정말 많아요.
반드시 proxy_set_header를 사용해서 어떤 헤더가 반드시 백엔드로 전달되어야 하는지 명시적으로 지정해 줘야 합니다.
--- [L4 vs L7 재정리] 언제 무엇을 쓸까? | 시나리오/요구사항 | 추천 레벨 | 주된 사용 설정/이유 | | :--- | :--- | :--- | | 단순 로드 분산/장애 복구 | L4 (또는 Nginx 기본) | IP/Port 기반 분산, 가장 가벼움.
| | API 버전 관리 (v1, v2 등) | L7 | location 또는 rewrite를 사용해 URI 경로로 분기.
| | 클라이언트별 트래픽 제어 | L7 | map이나 http 블록에서 요청 헤더를 파싱하여 분기.
| | 세션 기반 라우팅 (Sticky Session) | L7 (IP Hash) | ip_hash를 사용해 요청 출처를 고정해야 함.
| | Rate Limiting, 인증/인가 검사 | L7 | limit_req_zone 등 응용 계층 로직 적용 가능.
| | 최대 성능 및 최소 오버헤드 | L4 | 정말 순수한 TCP 연결 분산만 할 때 (하지만 API 게이트웨이 목적이라면 L7이 불가피함).
| 요약하자면, 요즘은 '최대한 L7 레벨에서 트래픽을 검사하고, 문제가 생길 때만 L4 수준의 페일오버 기능을 활용한다'는 접근이 가장 표준적이고 효율적이라고 보시면 됩니다.
어떤 설정을 적용하시든, 테스트 환경에서 최대 부하 상황과 **특정 장애 상황(특정 서버만 응답이 느려지는 경우)**을 시뮬레이션 해보시는 걸 잊지 마세요.
실제 운영 환경에서는 코드로 짜는 것보다, 이렇게 '어떤 조건에서 어떻게 분기시킬지'에 대한 설계가 훨씬 더 중요하답니다.