반응형 Web API1 Kubernetes HPA 설계, 웹 API는 정말 CPU-Only가 표준일까? Kubernetes에서 애플리케이션 스케일링을 설계할 때 가장 많이 쓰는 네이티브 오토스케일러가 HPA(Horizontal Pod Autoscaler)입니다.하지만 실제 운영 환경에서는, 스케일링 지표로 무엇을 선택해야 하는가가 장애 안정성과 비용 효율을 좌우합니다.운영 엔지니어들 사이에서는 “대부분 웹 API는 CPU-Only로 scaling한다”는 주장도 있고, “메모리도 트래픽에 따라 늘어난다”고 말하는 경우도 있습니다.이 글에서는 이런 논쟁의 핵심을 짚고, 최근 업계 표준 흐름과 함께 올바른 설계 레이어 분리 원칙을 정리해봅니다.1. “HPA 설계를 CPU-Only로 하는 게 좋은 선택인가?” 라는 질문의 본질클러스터 운영자라면 한 번쯤 이런 질문을 해봤을 거예요.“Kubernetes HPA 설정.. 2025. 12. 2. 이전 1 다음 반응형