Judaeng
쿠버네티스(Kubernetes) - 알아보기 본문
쿠버네티스를 공부하기 전에 Docker에 대해서 미리 공부하고 오는 것을 추천한다.
쿠버네티스에 대해서 공부하기 위해 블로그를 적었고, 아직도 쿠버네티스에 대해서 모르는 것이 너무 많다는 것을 미리 이야기합니다.😭
쿠버네티스(Kubernetes)란?
쿠버네티스는 컨테이너를 쉽고 빠르게 배포/확장하고 관리를 자동화해주는 오픈소스 플랫폼이다.
쿠버네티스는 컨테이너화 된 워크로드와 서비스를 관리하기 위한 이식성이 있고, 확장 가능한 오픈소스 플랫폼이다.
쿠버네티스는 선언적 구성과 자동화를 모두 용이하게 해 준다.
쿠버네티스는 크고, 빠르게 성장하는 생태계를 가지고 있다.
쿠버네티스 서비스, 기술 지원 및 도구는 어디서나 쉽게 이용할 수 있다.
그리고 쿠버네티스는 원래 Google 엔지니어들이 개발하고 설계한 플랫폼이다.
쿠버네티스란 명칭은 키잡이(helmsman)나 파일럿을 뜻하는 그리스어에서 유래되었다고 한다.
K8s라는 표기는 "K"와 "s"와 그 사이에 있는 8글자를 나타내는 약식 표기이다.
간단히 "큐브(kube)"는 Linux 컨테이너 작업을 자동화하는 오픈소스 플랫폼을 뜻한다고 한다.
구글이 2014년에 쿠버네티스 프로젝트를 오픈소스화했다고 한다.
쿠버네티스는 프로덕션 워크로드를 대규모로 운영하는 15년 이상의 구글 경험과 커뮤니티의 최고의 아이디어와 적용 사례가 결합되어 있다고 한다.
단순한 컨테이너 플랫폼이 아닌 마이크로 서비스, 클라우드 플랫폼을 지향하고 컨테이너로 이루어진 것들을 손쉽게 담고 관리할 수 있는 그릇 역할을 한다고 한다.
서버리스, CI/CD, 머신러닝 등 다양한 기능이 쿠버네티스 플랫폼 위에서 동작한다고 한다.
쿠버네티스가 왜 유용하게 쓰이게 되었나요?
전통적인 배포 시대
초기 조직은 애플리케이션을 물리 서버에서 실행했었다고 한다.
한 물리 서버에서 여러 애플리케이션의 리소스 한계를 정의할 방법이 없었기에, 리소스 할당의 문제가 발생했다.
예를 들어 물리 서버 하나에서 여러 애플리케이션을 실행하면, 리소스 전부를 차지하는 애플리케이션 인스턴스가 있을 수 있고, 결과적으로는 다른 애플리케이션의 성능이 저하될 수 있었다.
이에 대한 해결책은 서로 다른 여러 물리 서버에서 각 애플리케이션을 실행하는 것이 있다.
그러나 이는 리소스가 충분히 활용되지 않는다는 점에서 확장 가능하지 않았으므로, 물리 서버를 많이 유지하기 위해서 조직에게 많은 비용이 들었다.
가상화된 배포 시대
위에 해결책으로 가상화가 도입되었다.
이는 단일 물리 서버의 CPU에서 여러 가상 시스템(VM)을 실행할 수 있게 한다.
가상화를 사용하면 VM 간에 애플리케이션을 격리하고 애플리케이션의 정보를 다른 애플리케이션에서 자유롭게 액세스 할 수 없으므로, 일정 수준의 보안성을 제공할 수 있다.
가상화를 사용하면 물리 서버에서 리소스를 보다 효율적으로 활용할 수 있으며, 쉽게 애플리케이션을 추가하거나 업데이트할 수 있고 하드웨어 비용을 절감할 수 있어 더 나은 확장성을 제공한다.
가상화를 통해 일련의 물리 리소스를 폐기 가능한(disposable) 가상 머신으로 구성된 클러스터로 만들 수 있다.
각 VM은 가상화된 하드웨어 상에서 자체 운영체제를 포함한 모든 구성 요소를 실행하는 하나의 완전한 머신이다.
컨테이너 기반의 개발 환경의 변화
기존의 VM과 다르게 컨테이너는 경량화되어 장점을 가진다.
컨테이너는 자체 파일 시스템, CPU, 메모리, 프로세스 공간을 가지며, 인프라와의 종속성을 끊었기 때문에, 클라우드와 OS에 모두 이식할 수 있다.
컨테이너는 다음과 같은 추가적인 혜택을 제공하기 때문에 인기가 있다고 한다.
기민한 애플리케이션 생성과 배포:
VM 이미지를 사용하는 것에 비해 컨테이너 이미지 생성이 보다 쉽고 효율적이다.
지속적인 개발, 통합 및 배포:
안정적이고 주기적으로 컨테이너 이미지를 빌드해서 배포할 수 있고(이미지의 불변성 덕에) 빠르고 효율적으로 롤백할 수 있다.
개발과 운영의 관심사 분리:
배포 시점이 아닌 빌드/릴리스 시점에 애플리케이션 컨테이너 이미지를 만들기 때문에, 애플리케이션이 인프라스트럭처에서 분리된다.
가시성(observability):
OS 수준의 정보와 메트릭에 머무르지 않고, 애플리케이션의 헬스와 그 밖의 시그널을 볼 수 있다.
개발, 테스팅 및 운영 환경에 걸친 일관성:
랩탑에서도 클라우드에서와 동일하게 구동된다.
클라우드 및 OS 배포판 간 이식성:
Ubuntu, RHEL, CoreOS, 온-프레미스, 주요 퍼블릭 클라우드와 어디서든 구동된다.
애플리케이션 중심 관리:
가상 하드웨어 상에서 OS를 실행하는 수준에서 논리적인 리소스를 사용하는 OS 상에서 애플리케이션을 실행하는 수준으로 추상화 수준이 높아진다.
느슨하게 커플 되고, 분산되고, 유연하며, 자유로운 마이크로 서비스:
애플리케이션은 단일 목적의 머신에서 모놀리식 스택으로 구동되지 않고 보다 작고 독립적인 단위로 쪼개져서 동적으로 배포되고 관리될 수 있다.
리소스 격리:
애플리케이션 성능을 예측할 수 있다.
자원 사용량: 리소스 사용량: 고효율 고집적
* 모놀리식(Monolithic):
단어 뜻 그대로 하나의 Massive 한 Context 형태의 아키텍처, 하나의 서비스 또는 애플리케이션이 하나의 거대한 아키텍처를 가질 때, Monolithic 하다고 한다.
* 온-프레미스:
기업의 서버를 클라우드 같은 원격 환경에서 운영하는 방식이 아닌, 자체적으로 보유한 전산실 서버에 직접 설치해 운영하는 방식
셀프 서비스 인터페이스를 통해 여러 클라이언트 사이에 자동으로 프로비저닝되고 할당되는 가상 리소스 풀로서, 타사가 소유하고 관리하는 하드웨어 기반으로 개발된다.
쿠버네티스가 왜 필요하고 무엇을 할 수 있나요?
컨테이너는 애플리케이션을 포장하고 실행하는 좋은 방법이다.
프로덕션 환경에서는 애플리케이션을 실행하는 컨테이너를 관리하고 가동 중지 시간이 없는지 확인해야 한다.
예를 들어 컨테이너가 다운되면 다른 컨테이너를 다시 시작해야 한다.
이 문제를 시스템에 의해 처리한다면 더 쉽지 않을까?
그것이 쿠버네티스가 필요한 이유라고 한다.
쿠버네티스는 분산 시스템을 탄력적으로 실행하기 위한 프레임 워크를 제공한다.
애플리케이션의 확장과 장애 조치를 처리하고, 배포 패턴 등을 제공한다.
예를 들어, 쿠버네티스는 시스템의 카나리아 배포를 쉽게 관리할 수 있다.
서비스 디스커버리와 로드밸런싱:
쿠버네티스는 DNS 이름을 사용하거나 자체 IP 주소를 사용하여 컨테이너를 노출할 수 있다.
컨테이너에 대한 트래픽이 많으면, 쿠버네티스는 네트워크 트래픽을 로드밸런싱 하고 배포하여 배포가 안정적으로 이루어질 수 있다.
스토리지 오케스트레이션:
쿠버네티스를 사용하면 로컬 저장소, 공용 클라우드 공급자 등과 같이 원하는 저장소 시스템을 자동으로 탑재할 수 있다.
자동화된 롤아웃과 롤백:
쿠버네티스를 사용하여 배포된 컨테이너의 원하는 상태를 서술할 수 있으며 현재 상태를 원하는 상태로 설정한 속도에 따라 변경할 수 있다.
예를 들어 쿠버네티스를 자동화해서 배포용 새 컨테이너를 만들고, 기존 컨테이너를 제거하고, 모든 리소스를 새 컨테이너에 적용할 수 있다.
자동화된 빈 패킹(bin packing):
컨테이너화 된 작업을 실행하는 데 사용할 수 있는 쿠버네티스 클러스터 노드를 제공한다.
각 컨테이너가 필요로 하는 CPU와 메모리(RAM)를 쿠버네티스에게 지시한다.
쿠버네티스는 컨테이너를 노드에 맞추어서 리소스를 가장 잘 사용할 수 있도록 해준다.
자동화된 복구(self-healing):
쿠버네티스는 실패한 컨테이너를 다시 시작하고, 컨테이너를 교체하며, '사용자 정의 상태 검사'에 응답하지 않는 컨테이너를 죽이고, 서비스 준비가 끝날 때까지 그러한 과정을 클라이언트에 보여주지 않는다.
시크릿과 구성 관리:
쿠버네티스를 사용하면 암호, OAuth 토큰 및 SSH 키와 같은 중요한 정보를 저장하고 관리할 수 있다.
컨테이너 이미지를 재구성하지 않고 스택 구성에 시크릿을 노출하지 않고도 시크릿 및 애플리케이션 구성을 배포 및 업데이트할 수 있다.
쿠버네티스는 트렌드 그래프에서 봐도 알 수 있듯이 쿠버네티스의 트렌드가 지속적으로 올라가서 가장 높은 것을 확인할 수가 있다고 한다.
또한 주요 클라우드 벤더인 아마존, 구글, 애저 모두 컨테이너 관리 환경을 쿠버네티스를 지원하는 정책으로 변화된 것은 물론이고 IBM이나 시스코와 같은 온프렘(on-premise) 솔루션 업체들도 경쟁적으로 쿠버네티스를 지원하고 있다고 한다.
* 카나리 배포(Canary Release):
SW 배포의 방법 중 하나이다.
조금씩 사용자의 범위를 늘려가며 피드백을 통해 배포하는 방식을 카나리 배포라고 한다.
* 벤더(vendor):
재화나 용역을 제공하는 기업, IT 업체에서의 벤더 개념은 일반적으로 판매인 또는 판매업자를 가르키는 말
컴퓨터 시스템의 하드웨어나 소프트웨어 제품을 사용자에게 판매하였을 때 그 제품의 브랜드에 대해 책임을 지는 기업
* IBM(International Business Machines Corporation): 미국의 다국적 기술 및 컨설팅 회사
쿠버네티스 기능과 장점
실제 프로덕션 애플리케이션은 여러 컨테이너에 걸쳐 있으며 이러한 컨테이너는 여러 서버 호스트에 배포되어야 한다.
컨테이너를 위한 보안은 멀티레이어 구조이며 복잡할 수 있다.
바로 여기에 쿠버네티스가 사용된다고 한다.
쿠버네티스는 이러한 워크로드를 위해 규모에 맞는 컨테이너를 배포하는 데 필요한 오케스트레이션 및 관리 기능을 제공한다.
쿠버네티스 오케스트레이션을 사용하면 여러 컨테이너에 걸쳐 애플리케이션 서비스를 구축하고 클러스터 전체에서 컨테이너의 일정을 계획하고 이러한 컨테이너를 확장하여 컨테이너의 상태를 지속적으로 관리할 수 있다.
쿠버네티스를 활용하면 IT 보안을 한층 강화할 수도 있다고 한다.
물론 이는 실제 환경에서 컨테이너를 사용하는 방식에 따라 달라진다고 한다.
Linux 컨테이너를 사용하는 가장 기본적인 방식은 컨테이너를 효율적이고 빠른 가상 머신으로 다루는 것이다.
이를 프로덕션 환경과 여러 애플리케이션으로 확장하고 나면 개별 서비스를 제공하기 위해 같은 위치에 배치된 여러 개의 컨테이너를 함께 사용해야 한다는 것을 분명히 알 수 있다.
따라서 환경에서 컨테이너 수가 크게 증가하며 컨테이너가 누적됨에 따라 복잡성도 증가한다.
쿠버네티스는 컨테이너를 "포드(pods)"로 분류하여 컨테이너 급증과 관련된 여러 가지 문제를 해결한다.
포드는 그룹화된 컨테이너에 추상화 계층을 추가하므로 사용자가 워크로드를 예약하고 네트워킹 및 저장소와 같은 필수 서비스를 컨테이너에 제공할 수 있다고 한다.
쿠버네티스의 또 다른 부분을 사용해 이러한 포드 전체에서 부하를 분산하고 적합한 수의 컨테이너를 실행하여 워크로드를 지원할 수 있다고 한다.
쿠버네티스를 올바르게 구현하고 Atomic Registry, Open vSwitch, heapster, OAuth, SELinux와 같은 다른 오픈소스 프로젝트를 이용해 컨테이너 인프라의 모든 부분을 오케스트레이션 할 수 있다.
* 클러스터(Cluster): 여러 대의 컴퓨터들이 연결되어 하나의 시스템처럼 동작하는 컴퓨터들의 집합
* 오케스트레이션(Orchestration):
컴퓨터 시스템과 애플리케이션, 서비스의 자동화된 설정, 관리, 조정을 의미한다.
IT 팀이 복잡한 태스크와 워크플로우를 보다 쉽게 관리할 수 있도록 돕는다.
쿠버네티스 기술과 방식
다른 기술과 마찬가지로 쿠버네티스는 초보자가 기술을 이해하고 습득하는 데 장애가 될 수 있는 기술 용어들이 있다.
쿠버네티스를 이해할 수 있도록 좀 더 일반적인 용어로 분류해서 설명해보자.
마스터(Master): 쿠버네티스 노드를 제어하는 머신이다. 여기에서 모든 태스크 할당이 시작된다.
노드(Node): 할당된 태스크를 요청대로 수행하는 시스템이다. 쿠버네티스 마스터가 이러한 노드를 제어한다.
포드(pods):
단일 노드에 배포된 하나 이상의 컨테이너 그룹이다.
포드에 있는 모든 컨테이너는 IP 주소, IPC, 호스트 이름, 기타 리소스를 공유하며 포드는 기본 컨테이너에서 네트워크와 스토리지를 추상화한다. 이렇게 하면 클러스터에서 컨테이너를 더 쉽게 이동할 수 있다.
복제 컨트롤러: 이 컨트롤러는 클러스터에서 실행되어야 하는 동일한 포드 사본의 개수를 제어한다.
서비스(service):
포드에서 작업 정의를 분리한다.
쿠버네티스 서비스 프록시는 클러스터에서 다른 위치로 이동한 경우든 교체된 경우든 서비스 요청을 적절한 포드로 자동 수신한다.
Kubelet:
이 서비스는 노드에서 실행되며 컨테이너 매니페스트를 읽고, 정의된 컨테이너가 시작되어 실행 중인지 확인한다.
kubectl: 쿠버네티스의 명령줄 설정 툴이다.
더 자세한 쿠버네티스 용어를 알고 싶다면 여기를 클릭!
Docker
Docker 기술은 원래 목적대로 계속 사용되고 있다.
쿠버네티스가 노드에 대해 포드를 예약하면 해당 노드의 kubelet이 지정된 컨테이너를 실행하도록 Docker에 명령한다.
그런 다음 kubelet은 Docker로부터 이러한 컨테이너의 상태를 계속해서 수집하고 마스터에서 해당 정보를 집계한다.
Docker는 해당 노드에 컨테이너를 풀링 하고 이러한 노드를 평소와 같이 시작하고 중지합니다.
차이가 있다면 관리자가 모든 컨테이너의 모든 노드에서 작업을 직접 수행하는 것이 아니라 자동화된 시스템이 이러한 작업을 Docker에 요청한다는 것입니다.
🤔 블로그 정리 후, 느낀 점
쿠버네티스 홈페이지를 보고 간단하게 쭉 읽으면서 정리해보았다.
쿠버네티스는 생각보다 너무 어려운 기술(?)이라고 느낌이 들어서 계속 꾸준히 공부하는 방법밖엔 없는 것 같다.
처음에 쿠버네티스를 공부할 땐 정말 막막했는데, 계속 보고, 공부하고, 실습해보는 방법밖엔 없는 것 같다.
개인적으로 진입장벽이 조금 많이 높다고 생각하는 것 같다. 어쩔 수가 없다.
쿠버네티스에 대해 자세하게 알고 있는 사람들도 생각보다 적을 것 같아서, 계속 공부하는 방법이 정답인 것 같다.
이 글에선 쿠버네티스가 무엇이고, 왜 사용해야 되는지, 어떤 점이 좋은 건지만 간단하게 정리했고, 나머지 용어를 사용하고, 쿠버네티스 안에 구조가 어떻고, 어떤 식으로 작동하는지는 다음에 정리해보도록 하겠다.😭
📝 이번 게시물을 만들기 위해 참고한 사이트
3. 쿠버네티스 시작하기(subicura) - Kubernetes란 무엇인가?
'DevOps > Kubernetes' 카테고리의 다른 글
쿠버네티스(Kubernetes) - MiniKube에서 배포해보기 (0) | 2022.04.12 |
---|