Quantum Kubernetes Service
QKS는 QUANTUM C&S가 개발한 온프레미스 완전 관리형 Kubernetes 플랫폼입니다.
컨트롤 플레인 관리, OS 패치, 인프라 구성 없이 클러스터를 생성하고 운영할 수 있으며,
GPU 클러스터, Cluster Mesh, 가상머신까지 하나의 콘솔에서 통합 관리합니다.
QKS를 구성하는 기술 스택
Kubernetes
- v1.33.10 / v1.34.6 / v1.35.3 / v1.36.1
- 멀티테넌트 컨트롤 플레인
- 자동 노드 프로비저닝
- VM 기반 워커 노드
- Rolling 업그레이드 지원
- 노드 풀 오토스케일링
Networking
- Cilium CNI
- Cluster Mesh (클러스터 간 L3 연결)
- Traefik Ingress Controller
- MetalLB LoadBalancer
- NetworkPolicy 지원
- Pod / Service CIDR 자동 할당
Platform
- Prometheus / Grafana 모니터링
- DCGM GPU 메트릭 수집
- Velero 백업 / 오브젝트 스토리지
- Kyverno 정책 엔진
- Cert Manager TLS 자동화
- 가상머신 통합 관리
AI / GPU
- NVIDIA L40S / HPC GPU 지원
- MIG 슬라이스 (1g / 2g / 3g)
- NVIDIA Device Plugin 자동 설치
- vLLM 추론 메트릭 모니터링
- GPU 온도 / 전력 / 사용률 시각화
- 팀별 GPU 할당량 관리
이런 팀을 위해 만들었습니다
온프레미스나 프라이빗 클라우드 환경에서 Kubernetes를 운영해야 하지만, 클러스터 한 대 만들 때마다 며칠씩 걸리는 설치 작업과 컨트롤 플레인 유지 관리가 부담스러운 팀에게 QKS가 필요합니다.
클러스터를 만드는 데 걸리는 시간은 약 5분입니다. 컨트롤 플레인은 QKS가 운영하고, 사용자는 워크로드에만 집중합니다. AI 팀이 GPU 클러스터를 요청하면 개발팀이 직접 콘솔에서 만들어 줄 수 있습니다.