반응형 분류 전체보기883 kubernetes의 Request ― startup peak, steady-state, HPA 사이에서의 현실적인 해답Kubernetes(EKS)를 운영하다 보면 거의 반드시 부딪히는 질문이 있다.“request는 평소 사용량 기준으로 잡는 게 맞지 않나?”“그런데 그렇게 하면 startup 시에 Pod가 안 뜨는 것 같은데?”“그럼 request는 HPA용 수단 말고 무슨 의미가 있지?”이 글은 resources.requests의 진짜 역할,startup peak 때문에 발생하는 오해,그리고 startup peak를 request에 포함하지 않고도 안전하게 운영하는 구조를운영 경험 관점에서 하나로 정리한다.1. request에 대한 가장 흔한 오해많은 사람들이 처음에 이렇게 이해한다.“request는 초기 요청량이고,이걸 초과하면 Po.. 2025. 12. 23. AWS CloudFront 요금 정액제 출시 (2025. 11 업데이트) AWS CloudFront는 글로벌 CDN(Content Delivery Network) 서비스로, 전 세계 엣지 로케이션을 통해 사용자에게 콘텐츠를 빠르고 안전하게 전달합니다. 클라우드 기반 서비스 특성상 요금 구조가 다소 복잡할 수 있는데, 2025년 말 AWS는 이를 훨씬 단순화한 정액 요금제(Flat-Rate Pricing Plans) 모델을 도입했습니다. 🔹 CloudFront 요금 모델의 두 가지 축CloudFront 비용은 크게 두 가지 모델로 나뉩니다:1) 📊 종량제(Pay-As-You-Go)기존 방식으로:데이터 전송량(GB)요청 수(요청당 요금)리전/엣지 로케이션별 요율에 따라 사용량만큼 과금되는 방식입니다.장점: 실제 사용량만 지불, 유연함단점: 트래픽이 많을 때 비용 예측이 .. 2025. 12. 23. PC 재부팅 후 프리징·끊김 원인, WHEA PCIe 오류였다 (PCIe Gen3 해결, RTX 50 시리즈) 목차 PC 리부팅 후 갑자기 프리징과 끊김이 발생했다면, WHEA PCIe 오류일 수 있습니다.문제 상황어느 날 PC를 리부팅했더니 갑자기 이상 증상이 나타났습니다:크롬에서 웹페이지 클릭 시 프리징텍스트 드래그 시 UI 끊김전반적인 시스템 버벅임화면이 검게 되거나 블루스크린이 뜨는 것은 아닌데, 뭔가 이상합니다.원인 찾기: 이벤트 뷰어 확인Windows 이벤트 뷰어를 확인해보니 WHEA-Logger Event ID 17 오류가 5분간 수백 건씩 쏟아지고 있었습니다.A corrected hardware error has occurred.Component: PCI Express Root PortError Source: Advanced Error Reporting (PCI Express)WHEA 오류란?WH.. 2025. 12. 22. Claude Code로 문서 쓰다가 당했다… 그래서 만든 ‘정확성 규칙’ 공개 기술 블로그를 운영하다 보면 종종 날짜, 버전, 지원 종료 일정처럼 특정 숫자가 들어가는 정보의 정확성이 매우 중요하다는 사실을 다시 깨닫게 된다. 최근 EKS 버전 지원 일정을 정리하면서 바로 이런 실수를 경험했다. 검색 없이 추정한 날짜를 표로 작성하는 바람에 실제 정보와 차이가 발생했던 것이다.문제는 어떻게 발생했나?당시 작성했던 내용은 아래와 같았다. 항목 잘못 작성한 내용 실제 공식 일정 EKS 1.33 Standard 종료2026년 1월2026년 7월 29일원인은 단순했다.“아마 이쯤일 것이다”라는 추정추정임에도 불구하고 단정적인 표현과 표 형태로 정리이 두 가지가 만나면 독자는 이것을 ‘사실’이라고 오해하게 된다.기술 정보, 특히 클라우드 버전 관련 정보는 사람들이 의사결정에 참고하는 데이터.. 2025. 12. 12. 웹쉘인젝션 공격 분석 및 대응 (Nextjs, React 보안 취약점 CVE-2025-66478) 최근 운영 중이던 웹 애플리케이션에서 원격 코드 실행(RCE)과 웹쉘 인젝션(WebShell Injection) 공격 시도가 탐지되었습니다. API 지연 문제를 조사하던 중 발견한 사례로, 내부망 기반 서비스라 하더라도 CloudFront, ALB 등을 경유하면 언제든 외부 공격이 유입될 수 있다는 점을 다시 확인한 인시던트였습니다.이번 글에서는 공격 타임라인, 원인, 대응 과정, 향후 방어 전략을 정리해 공유합니다.1. 인시던트 개요발견일시: 2025-12-08대상 서비스(예시): example-web (Next.js 기반 프런트엔드)심각도: ★★★★★ Critical탐지 방식: CloudFront → ALB → Pod 로그 분석 중 RCE 및 웹쉘 패턴 확인2. 공격 타임라인 요약 시간(UTC) 공격.. 2025. 12. 9. GitHub Actions Private Repo에서 ARM64 빌드와 비용 최적화 목차 AWS에서 AMD 보다 ARM 계열이 퍼포먼스나 비용 면에서 10~20% 좋아 arm 계열로 변경 하게 되었습니다.그러다보니 빌드 도구를 githubactions에서 사용하는데 기본적으로 AMD 만 지원(arm계열은 team 플랜구매) 하고 있어 다른 ARM 계열 러너를 사용할순 없을가 하여 찾아보는 과정을 포스팅 해보았습니다. 1. 개요CI/CD 파이프라인에서 빌드 속도와 비용 효율은 팀 생산성에 직접적인 영향을 줍니다. 특히 Private 저장소에서 ARM64 빌드를 고려할 경우, runner 유형별 제약과 과금 방식 이해가 필수입니다.주요 runner 유형은 다음과 같이 나뉩니다:GitHub가 제공하는 VM runner → GitHub-hosted runnerAWS EC2 등 외부 인프라에 .. 2025. 12. 4. Kubernetes HPA 설계, 웹 API는 정말 CPU-Only가 표준일까? Kubernetes에서 애플리케이션 스케일링을 설계할 때 가장 많이 쓰는 네이티브 오토스케일러가 HPA(Horizontal Pod Autoscaler)입니다.하지만 실제 운영 환경에서는, 스케일링 지표로 무엇을 선택해야 하는가가 장애 안정성과 비용 효율을 좌우합니다.운영 엔지니어들 사이에서는 “대부분 웹 API는 CPU-Only로 scaling한다”는 주장도 있고, “메모리도 트래픽에 따라 늘어난다”고 말하는 경우도 있습니다.이 글에서는 이런 논쟁의 핵심을 짚고, 최근 업계 표준 흐름과 함께 올바른 설계 레이어 분리 원칙을 정리해봅니다.1. “HPA 설계를 CPU-Only로 하는 게 좋은 선택인가?” 라는 질문의 본질클러스터 운영자라면 한 번쯤 이런 질문을 해봤을 거예요.“Kubernetes HPA 설정.. 2025. 12. 2. Kubernetes 이벤트 기반 오토스케일링, KEDA로 트래픽과 비용을 동시에 최적화하기 Kubernetes 운영을 하다 보면 스케일링의 기준을 CPU/메모리 사용률이 아닌, 비즈니스 이벤트로 잡아야 하는 순간이 옵니다.메시지 큐의 잔량, API 호출 급증, 배치 Job 트리거 등 실제 서비스 부하의 원인을 기준으로 파드를 조정하고 싶다면, KEDA가 훌륭한 선택지가 됩니다.1. KEDA란? — Event-Driven Autoscaling의 등장 배경Kubernetes 기본 오토스케일링인 **HPA(Horizontal Pod Autoscaler)**는 CPU/메모리 기반 스케일링엔 최적이지만,다음과 같은 한계가 있습니다.지표가 실제 서비스 부하 원인과 간접적비동기/배치 워크로드에서는 Scale-to-Zero 적용 어려움외부 이벤트 소스(메시지 큐, 스트림 등)를 스케일링 기준으로 삼기 복잡이.. 2025. 12. 2. Kubernetes 파드 리소스 최적화 자동 추천, Goldilocks로 시작하는 근거 기반 운영 Goldilocks는 Kubernetes 워크로드의 CPU/메모리 request와 limit 값을 자동으로 추천해주는 오픈소스 도구입니다. “과하지도, 부족하지도 않은 딱 맞는 값”을 제안한다는 의미에서 이름이 붙었습니다.어떻게 동작할까?Goldilocks의 분석 엔진은 VPA(Vertical Pod Autoscaler)를 활용합니다. VPA를 워크로드에 직접 적용하지 않아도 모니터링 모드로 활성화된 VPA 객체를 통해:파드의 실제 CPU/메모리 사용량트래픽이나 작업 부하에 따른 resource peak(피크 사용량)CPU limit 으로 인한 throttling(쓰로틀링) 발생 구간OOM(Out of Memory) 발생 가능 지점을 객관적으로 계산해냅니다.분석이 끝나면 Goldilocks Dashboa.. 2025. 12. 2. Kubernetes에서 Vault로 비밀 다루기: Seal, Sync, 주입 들어가며클라우드 네이티브 환경에서 비밀 정보를 안전하게 다루는 것은 DevOps와 플랫폼 팀의 핵심 과제다. Kubernetes에서 HashiCorp Vault를 연동해 Secret을 주입하는 방식은 크게 3가지 흐름으로 나뉜다. 각 방식의 동작 주체, Secret 저장 위치, 갱신 전략이 완전히 다르다. 또한, Vault의 Seal/Unseal 개념은 Vault 서버의 보안 상태를 제어하는 관문 역할을 한다.🔒 Vault Seal / 🔓 Unseal 이란?Vault는 모든 Secret 데이터를 마스터 키(Master Key) 로 암호화하여 storage(기본적으로는 etcd가 아닌 Vault 자체 저장소)에 저장한다. 하지만 마스터 키가 평문으로 디스크에 저장되면 탈취 위험이 있기 때문에, Vaul.. 2025. 11. 27. SSL 인증서 발급/갱신 시 DNS TXT 인증 정리 (일반형 가이드) SSL 인증서를 발급하거나 갱신하는 과정에서도메인 소유를 확인하기 위해 DNS TXT 레코드 추가를 요구하는 경우가 많다.이 글에서는 특정 인증기관에 국한하지 않고,일반적으로 적용되는 DNS TXT 인증 절차를 정리해본다.(Azure DNS 기준 예시 포함)📌 1. DNS TXT 인증이란?도메인이 실제로 본인의 소유인지 검증하기 위한 방식이다.인증기관(CA, Certificate Authority)은 DNS에 특정 TXT 값을 넣고,그 값이 정상적으로 조회되는지 확인해서 도메인 소유권을 증명한다.대표적인 CA들:Let’s EncryptDigiCertSectigoGlobalSignZeroSSLGoogle Trust ServicesAWS ACM 등※ 각 기관마다 TXT 값의 형식은 조금씩 다르지만, 절차는.. 2025. 11. 17. 오픈소스 검색엔진 비교: OpenSearch vs Meilisearch vs Typesense 1️⃣ 들어가며검색 기능은 단순히 문자열을 찾는 기능을 넘어, 언어 구조를 이해하고 유사한 의미까지 탐색하는 기술로 진화하고 있다.특히 한국어는 띄어쓰기 규칙이 불규칙하고 복합명사가 많아, 검색엔진 선택이 검색 품질에 직접적인 영향을 준다.이번 글에서는 대표적인 오픈소스 검색엔진인OpenSearch, Meilisearch, Typesense를 비교하며,한국어 처리력·띄어쓰기 오류 대응·개발 난이도 측면에서 분석한다.2️⃣ 엔진별 개요 항목 OpenSearch Meilisearch 기반 구조Lucene 기반 (Elasticsearch fork)Rust 기반C++ 기반주요 특징대규모 데이터, 고급 쿼리, 형태소 분석설치 간단, 빠른 인덱싱실시간 검색, 자동완성 최적화형태소 분석✅ Nori Analyzer .. 2025. 11. 6. 이전 1 2 3 4 ··· 74 다음 반응형