디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

'오픈인프라서밋'으로 확인한 카카오클라우드의 고가용성·이중화 전략

IT동아갤로그로 이동합니다. 2026.01.14 16:03:38
조회 57 추천 0 댓글 0
[IT동아 남시현 기자] 지난 십수 년 간 IT 인프라는 물리적으로 직접 서버를 구축하는 온프레미스(On-premise)에서 클라우드 환경으로 급격히 이동했다. 초기에는 안전하고 잘 관리되는 클라우드 서비스가 ‘중단되지 않는 무결한 시스템’으로 인식되기도 했지만 최근 몇 년새 발생한 여러 사건들은 클라우드가 완전히 무결한 체계가 아님을 보여준다.

지난해 국가정보자원관리원에서 발생한 사고는 공공 행정 시스템 709개 중 대다수를 마비시킨 사건은 대한민국 국민 모두가 체감한 바 있다. 특히 모든 공공 데이터를 이중화 전략 없이 단일 서버에 저장한 탓에 국가 전체 IT 인프라가 마비되는 일을 겪었다.

지난해 10월 아마존웹서비스(AWS)의 동부 리전(US-East-1)에서 발생한 대규모 장애 역시 비슷한 맥락이다. AWS의 데이터베이스를 자동 관리하는 다이나모 DB에서 인터넷 연결 주소인 DNS를 연결하는 과정에서 오류가 발생해 맥도날드나 스타벅스같은 소매는 물론 증권거래소, 은행 등 금융 서비스까지 장애를 겪었다. 이로부터 열흘 후 마이크로소프트 애저 클라우드도 직원이 설정값을 잘못 입력해 소매 및 항공 서비스가 마비되기도 했다.


지난 10월 17일, 프랑스 파리에서 열린 오픈인프라서밋에서 카카오엔터프라이즈 소속 직원들이 세션을 진행한 바 있다 / 출처=카카오엔터프라이즈



이런 사건들을 통해 클라우드는 더 이상 무결한 서비스가 아니며, 중단 방지를 위한 관리 방안과 운영 전략이 수반되어야 한다는 인식이 확산하고 있다. 업계에서는 시스템이 중단 없이 오랜 기간 안정적으로 운영되는 고가용성(High Availability), 그리고 중요한 데이터와 시스템을 여러 곳으로 분산해 데이터를 안정적으로 활용하는 이중화(Redundancy)에 초점을 맞추고 전략을 구상 중이다.

카카오엔터프라이즈의 고가용성·이중화 전략은?


일련의 사건들을 겪으면서 전 세계 클라우드 기업 소속 인프라 엔지니어, 개발자들은 서버의 안정성과 신뢰도를 끌어올리기 위한 기술적 해법을 모색하고 있다. 지난해 10월 파리에서 열린 오픈인프라서밋은 그 해답을 찾기 위한 구심점이 되는 자리였다. 오픈인프라서밋은 오픈인프라 재단이 주최하는 세계적인 오픈소스 콘퍼런스로 지난 10월 17일에서 19일 사이 개최됐다. 주요 논점은 회복 탄력성, AI 인프라였으며 카카오엔터프라이즈는 IT 인프라를 주제로 발표를 진행했다.


김유하 카카오엔터프라이즈 어드밴스드플랫폼 개발팀 매니저(좌)와 허지현 매니저(우) / 출처=카카오엔터프라이즈



허지현 카카오엔터프라이즈 어드밴스드플랫폼 개발팀 매니저, 김유하 매니저의 발표명은 ‘퍼블릭 클라우드 환경 제공을 위한 오픈스택 기반 관리형 쿠버네티스 서비스 아키텍처 설계(Architecting a Managed Kubernetes Service on OpenStack for Public Cloud Delivery)’이었다. 카카오엔터프라이즈의 클라우드 고가용성, 이중화 전략을 담고 있다.

허지현 매니저는 “이번 발표는 카카오엔터프라이즈가 클라우드 서비스 제공자(CSP) 시장의 후발 주자로서 다른 글로벌 CSP의 사례를 연구하고 다른 기업들이 어떻게 관리형 격리 서비스를 구축하는지 분석했는지를 담는다. 카카오엔터프라이즈는 조사를 바탕으로 사용자가 접근할 수 없는 컨트롤 플레인이 적용된 완전 관리형 쿠버네티스 엔진을 구축했다. 현재는 멀티-AZ(가용영역)를 기반으로 클러스터를 운영 중”이라며 발표를 시작했다.


쿠버네티스의 전체적인 아키텍처를 시각화한 형태, 카카오엔터프라이즈는 API 서버, 스케줄러, 컨트롤 매니저, etcd가 포함된 ‘컨트롤 플레인’ 영역을 직접 관리하는 방식으로 서버 안정성을 높였고, 상태 데이터를 저장하는 etcd는 물리적으로 분산 배치해 복원력을 확보했다 / 출처=도커



개발자가 클라우드 상에서 애플리케이션 등을 실행할 때 필요한 모든 자료와 설정 등을 하나로 표준화한 형태를 ‘컨테이너’라고 한다. 클라우드 상에는 이런 컨테이너가 수백 개 이상 배치돼 있으며 이를 통제하는 중앙 관제 시스템이 ‘쿠버네티스’다. 쿠버네티스 내에는 핵심 명령을 내리는 ‘컨트롤 플레인(마스터 노드)’ 영역이 있는데 사용자 실수나 관리의 어려움을 고려해 카카오엔터프라이즈가 직접 컨트롤 플레인 영역에 대한 운영을 맡는다.

모든 리소스는 다양한 환경에서도 동일하게 배포하고 관리할 수 있도록 컨테이너로 구성하고, 데이터센터 내 쿠버네티스 클러스터와 오픈스택 인프라는 독자적으로 구성한 ‘링제로 클러스터’ 계층 형태로 관리한다. 또한 클러스터 구축도 표준화된 클러스터 API를 활용한다.


카카오엔터프라이즈는 클러스터-API 영역을 직접 개량해 서버 안정성을 높였다 / 출처=오픈인프라재단



클러스터 API 로직의 경우 카카오엔터프라이즈가 자체적으로 개량한 버전이고, 쿠버네티스 엔진 서비스에서도 자동화 절차를 적용한 개량된 컨트롤러를 활용한다. 아울러 컨트롤 플레인 영역이 워커 노드 영역과 독립적으로 실행되도록 구성하고 컨트롤 플레인 내부에서 클러스터 운영에 필요한 요소들(static pod)은 컨테이너 레벨에서 격리하여 숨긴다.

또한 데이터센터의 모든 상태 정보를 저장하는 메모리에 해당하는 etcd를 노드 내부가 아닌 별도의 가상머신으로 분리해서 구성한다. 덕분에 가용영역 단위의 손실이 발생하더라도 다른 서버에 저장된 etcd를 다시 가져와 서비스 연속성을 보장한다.


상태 데이터를 포함한 메모리에 해당하는 etcd와 컨트롤 플레인 머신을 물리적으로 분산 배치해 서버가 연속적으로 운용되는 고가용성을 크게 높였다 / 출처=오픈인프라재단



카카오엔터프라이즈는 가상 사설 클라우드와 온프레미스 네트워크를 상호 연결하는 ‘TGW(Transit Gateway)’ 서비스를 활용해 데이터센터 간 네트워크 초지연 통신 환경을 구현했다. 화재 등으로 인해 한 곳이 멈추더라도 다른 데이터센터에 분산 배치된 컨트롤 플레인과 데이터가 서비스 연속성을 제공한다. 데이터센터 규모가 커질 경우에 컨트롤 플레인과 etcd 사양을 다르게 구성하거나 카카오엔터프라이즈만의 특화된 네트워크 및 보안 설정을 적용할 수 있다.


카카오엔터프라이즈(카카오클라우드)는 장애 발생시에도 가능한 안전하게 서비스를 운영할 수 있는 방안에 초점을 맞추고 있다 / 출처=카카오엔터프라이즈



허지현 매니저가 말하는 핵심은 “카카오클라우드의 쿠버네티스 엔진에서 중요한 설계 원칙들 중 하나는 클라우드 안정성을 확보하기 위해 모든 리소스를 가용영역(AZ) 단위로 분산 배치해 멀티AZ를 구현하는 것”이다. 특정 가용영역에 장애가 발생하더라도 활성 상태를 유지하는 다른 가용 영역으로 데이터를 즉시 사용 가능하도록 가져와 서버가 다운되는 시간을 짧게 가져간다.

정리해보자면 카카오엔터프라이즈의 전략은 ▲ 데이터센터를 다각적으로 나눠 데이터와 서비스를 안전하고 연속성 있게 가져가는 점 ▲ 컨트롤 플레인을 최종 사용자가 아닌 카카오엔터프라이즈가 관리해 안전하게 서비스할 수 있는 점 두 가지로 분류할 수 있다. 대규모 장애 발생으로 인한 손실을 크게 줄일 수 있는 점, 또 서버가 다운되는 시간을 최소화하는 고가용성 측면에서도 분명한 이점이 있다.

고가용성과 안정적 서비스가 2026년 클라우드 산업의 핵심


데이터센터의 신뢰성은 ‘9의 개수’로 정의한다. 가용성 비율이 99.9%인 서버는 연간 관리 시 8.77시간 이내의 다운타임을 가지고, 99.99%인 서버는 52.6분만 허용된다. 전 세계 데이터센터 시장 중 60% 정도가 99.98% 수준이지만 현실은 그렇지 않다. 초고가용성 서버를 운용하는 글로벌 클라우드 서비스 제공자들 조차도 단순한 코드 에러나 정전 등으로 인해 문제가 발생한다는 것이 여러차례 입증됐다.

앞으로 클라우드 사업자들은 가시적인 장애나 운용 시간을 준수하는 것을 넘어 다각적으로 발생할 수 있는 문제를 준비해야 한다. 자동화 수준을 높이고 아키텍처를 최적화하고, 투입 비용보다 신뢰성을 더 우선시하는 전략을 취하고 있다. 클라우드의 문제는 어떤 한 사업자만의 문제가 아닌 사회인프라 전반에 영향을 입힌다. 더 안전한 IT 시대를 만들기 위해 클라우드 인프라 개발자들은 꾸준히 고민하고 있다.

IT동아 남시현 기자 (sh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ [투자를IT다] 2026년 1월 2주차 IT기업 주요 소식과 시장 전망▶ PC 부품값 폭등 시대, 클라우드 PC가 해법 될까?▶ [투자를IT다] 2025년 IT 산업 주요 이슈 총정리



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 시대를 잘 타고나서 뜬 것 같은 스타는? 운영자 26/02/16 - -
6631 [정석희의 기후 에너지 인사이트] 4. ‘우리만의 기후테크’는 위험하다: 글로벌 표준과의 동기화가 시급한 이유 IT동아갤로그로 이동합니다. 02.16 17 0
6630 [신차공개] 페라리 최초 전기차 루체·MINI 쿠퍼 SE 폴스미스 에디션 공개 IT동아갤로그로 이동합니다. 02.16 14 0
6629 연휴 시즌 보이스피싱 주의보…통신사별 막는 방법은? IT동아갤로그로 이동합니다. 02.16 484 2
6628 [주간투자동향] 폴스타게임즈, 프리 시리즈A 브릿지 투자 유치 外 IT동아갤로그로 이동합니다. 02.16 21 0
6627 "피지컬 AI 생태계 구축" NC AI가 꿈꾸는 차세대 AI 기술 주권 IT동아갤로그로 이동합니다. 02.13 35 0
6626 귀성길에 오르기 전, 이것만은 한 번 더...‘운전 체크리스트’ IT동아갤로그로 이동합니다. 02.13 72 0
6625 스트레스솔루션 “스트레스 관리하는 힐링비트로 글로벌 헬스케어 기업으로 도약할 것” [경북대 X SKT] IT동아갤로그로 이동합니다. 02.13 76 0
6624 하모니게이트 “AI 로봇 의족으로 절단 장애인 사회 복귀 돕는다” [서울과기대기술지주 미래기업] IT동아갤로그로 이동합니다. 02.13 39 0
6623 스페이스XㆍxAI 합병 “일론 머스크의 비전 실현일까? 과잉 욕심일까?” IT동아갤로그로 이동합니다. 02.13 485 1
6622 산업부, 'K-온디바이스 AI 반도체 사업'으로 국산 AI 반도체 업계 지원 IT동아갤로그로 이동합니다. 02.12 40 0
6621 네이버 컬리N마트, 당일배송 품었다…쿠팡 이탈 고객 잡을까 [25] IT동아갤로그로 이동합니다. 02.12 1387 5
6620 메디센싱 "소리로 상황 이해하는 AI···의료·일상 돕는 방향으로 확장할 것" [과기대 딥테크] IT동아갤로그로 이동합니다. 02.12 39 0
6619 [스타트업-ing] 오아시스 스튜디오 “플랫폼 개발 역량 강화로 ‘카멜’ 개발 박차” IT동아갤로그로 이동합니다. 02.12 43 0
6618 플룸네트워크 “한국, RWA 시장 성장 잠재력 크다” IT동아갤로그로 이동합니다. 02.12 45 0
6617 서울창조경제혁신센터·LKB평산HB MOU '바이오 딥테크 기업 육성' IT동아갤로그로 이동합니다. 02.12 39 0
6616 플랜즈커피 “무인 카페 편견 깨고 커피 사각지대 해소할 것” [경북대 X IT동아] IT동아갤로그로 이동합니다. 02.12 40 0
6615 폴스타, 올해 판매 목표 4000대 이상…"신차 2종 투입 및 인프라 확충 추진" IT동아갤로그로 이동합니다. 02.11 45 0
6614 [주간스타트업동향] 시프티, 30인 미만 영세사업장 대상 HR 플랫폼 무료 지원 外 IT동아갤로그로 이동합니다. 02.11 33 0
6613 '42주년' 산돌, AI 시대 맞아 한국형 버크셔 해서웨이 꿈꾸는 이유 [4] IT동아갤로그로 이동합니다. 02.11 1117 2
6612 인천대, "실패를 성공의 자산으로"... '2026 재도전성공패키지' 참가자 모집 IT동아갤로그로 이동합니다. 02.11 47 0
6611 [스타트업 브랜딩 가이드] 브랜드 컨셉이 없으면 고객은 가격부터 본다 IT동아갤로그로 이동합니다. 02.11 55 0
6610 "안정적 출력은 기본, 위기에 강해야 됩니다" 마이크로닉스가 말하는 AI 시대 파워서플라이 IT동아갤로그로 이동합니다. 02.10 46 0
6609 양자컴퓨터가 '코인' 암호도 뚫는다던데... 진짜? IT동아갤로그로 이동합니다. 02.10 61 0
6608 [자동차와 法] ADAS가 사고 내고 책임은 사람이 진다...과실비율의 사각지대 IT동아갤로그로 이동합니다. 02.10 40 0
6607 클로드 코워크는 SaaS 업계의 종말일까? 긍정론과 부정론 짚어보니 IT동아갤로그로 이동합니다. 02.10 52 0
6606 [위클리AI] 앤스로픽·오픈AI, 새 모델 동시 발표···역사적인 전면전될까 IT동아갤로그로 이동합니다. 02.10 51 0
6605 [자동차 디자人] ‘라곰’ 철학으로 빛의 균형을 디자인하다…황유지 지커 디자이너 IT동아갤로그로 이동합니다. 02.10 62 0
6604 LG유플러스, AI가 알아서 관리하는 ‘자율 네트워크’ 시대 연다 IT동아갤로그로 이동합니다. 02.10 45 0
6603 [황성진의 '고대 사상가, AI를 만나다'] 소크라테스가 현대인들에게 가장 먼저 던질 질문 한 가지 [3] IT동아갤로그로 이동합니다. 02.10 918 4
6602 [스타트업-ing] 이노디테크 “AI 치아 교정 솔루션 ‘닥터얼라인내비’ 세계 무대에서도 호평” IT동아갤로그로 이동합니다. 02.10 45 0
6601 [K-스페이스 퀀텀 점프] 3. 공항개발 수출은 새로운 성장 동력이다 IT동아갤로그로 이동합니다. 02.10 315 0
6600 [투자를IT다] 2026년 2월 1주차 IT기업 주요 소식과 시장 전망 IT동아갤로그로 이동합니다. 02.09 52 0
6599 [뉴스줌인] 'TV 헤드폰' 젠하이저 RS 275, 일반 헤드폰과 다른점은?? IT동아갤로그로 이동합니다. 02.09 121 0
6598 [신차공개] BYD, 2000만원대 전기차 돌핀 출시·제네시스, 오프로드 콘셉트카 공개 IT동아갤로그로 이동합니다. 02.09 111 0
6597 [주간투자동향] 디자인앤프랙티스, 151억 원 규모 시리즈A 투자 유치 外 IT동아갤로그로 이동합니다. 02.09 118 0
6596 "AI로 언어 진단 골든타임 확보" 송앤스타크코아퍼레이션, 착한 기술 기업 꿈꾼다 [과기대 딥테크] IT동아갤로그로 이동합니다. 02.09 53 0
6595 아티피셜 소사이어티 “기초 학력 길러주는 AI 맞춤형 학습 플랫폼 러니” [경북대 X IT동아] IT동아갤로그로 이동합니다. 02.09 59 0
6594 악성코드검거단 "백신 무용지물인 신종 악성코드, '악단홀'로 바로 차단"[과기대 딥테크] [6] IT동아갤로그로 이동합니다. 02.09 1299 0
6593 빗썸 '62만 비트코인 오지급' 사고···금융당국 “거래소 긴급 점검” [8] IT동아갤로그로 이동합니다. 02.09 1548 1
6592 마크 저커버그가 꿈꾸는 세 번째 인터넷 시대, 슈퍼 인텔리전스는 무엇일까? [27] IT동아갤로그로 이동합니다. 02.06 1688 7
6591 유튜브에 들어온 제미나이, ‘시청 흐름 끊지 않고 궁금증 해결’ [2] IT동아갤로그로 이동합니다. 02.06 152 0
6590 모빌린트, 스페이스린텍과 함께 '우주 산업용 AI 반도체' 도전한다 IT동아갤로그로 이동합니다. 02.06 58 0
6589 교육 인프라 공백 메우는 에듀테크…개발도상국에서 가능성 시험 IT동아갤로그로 이동합니다. 02.06 65 0
6588 [스타트업-ing] 라젠카AI “데이터 인공지능으로 헬스케어 금융 불편 해소” IT동아갤로그로 이동합니다. 02.06 65 0
6587 과학계 이어 오픈AI까지 사로잡은 美 세레브라스, AI 반도체 업계 신화 쓸까 IT동아갤로그로 이동합니다. 02.06 93 0
6586 [생활 속 IT] 통장·카드 없이 ATM 출금 어떻게 할까···스마트폰 하나로 OK [1] IT동아갤로그로 이동합니다. 02.06 1062 4
6585 [리뷰] RTX 3050급 내장 그래픽 인상적, 인텔 코어 울트라 X7 358H IT동아갤로그로 이동합니다. 02.05 190 0
6584 북한 해커들의 긴 잠복...2025년 사이버 공격, 무엇이 달랐나 [6] IT동아갤로그로 이동합니다. 02.05 1449 6
6583 수호아이오, SDMS 2026 개최···스테이블코인 규제·솔루션 논의 IT동아갤로그로 이동합니다. 02.05 48 0
6582 [기고] 창업으로 문제 해결하며 사회 가치를 창출한다 IT동아갤로그로 이동합니다. 02.05 55 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2