본문 바로가기
NVIDIA

[NVIDIA] NVIDIA vWS , vCS

by Yoon_estar 2025. 7. 24.
728x90

개요

NVIDIA 가상 GPU(vGPU) 소프트웨어는 물리 GPU를 다수의 가상 머신(VM)이 공유하고 사용할 수 있도록 해, 하이퍼바이저 기반 가상화 환경에서도 GPU 성능을 그대로 활용할 수 있게 해줍니다

 

세 가지 주요 에디션이 있으며, 목적과 기능에 따라 구분됩니다:

  • vPC: 일반 사무용·사무직용 가상 데스크톱
  • vApps: 애플리케이션 스트리밍(RDSH 등)
  • vWS: 고사양 그래픽 및 전문 워크스테이션용
  • vCS: AI 및 HPC 같은 연산 중심 워크로드용

각 제품은 라이선스 방식, 제공 기능, 지원 워크로드가 다릅니다.

 

vWS (RTX Virtual Workstation)

개요

  • 고성능 전문 그래픽, 엔지니어링, AI 개발 워크로드에 최적화된 가상 워크스테이션
  • 예: CAD, 3D 렌더링, 과학 시각화, AI 실험 등

주요 특징

 

  • RTX 가속 기능 (레이 트레이싱, AI 가속 포함)
  • 최대 8K 출력, 다중 모니터 지원 (vPC 대비 해상도 우위) 
  • NVIDIA L40S, A40, L4 등의 GPU 권장 
  • NGC 컨테이너와 GPU Operator 연동으로 AI/그래픽 워크로드 배포가 간편

아키텍처

 

  • vGPU 매니저 + 하이퍼바이저 기반, GPU 자원을 분할하여 VM에 할당
  • 각 VM은 실제 GPU와 동일한 드라이버를 사용

 

vCS(Virtual Compute Server)

개요

 

  • 고성능 컴퓨팅(HPC), AI 트레이닝/추론, 데이터 과학 워크로드에 최적화
  • GUI 없이 CLI 기반 혹은 API 워크로드 위주로 설계

주요 특징

 

  • GPU 타임슬라이스 또는 공유를 통해 여러 VM이 GPU 연산 자원을 공유
  • 또는 한 VM이 다수의 vGPU를 할당받아 병렬 연산 가능
  • LUT처럼 vWS보다 UI 요소는 줄이고, 컴퓨팅 집중형 환경에 최적화
  • 1년 GPU 단위 구독 라이선스 + 엔터프라이즈 지원 포함

기능

 

  • 컨테이너 친화적으로 NGC 컨테이너와 GPU Operator 연동 지원
  • GPU 오류 정정(ECC), 페이지 리타이어, 라이브 마이그레이션 등 고가용성 기능

 

설치 및 구성 방법

공통 절차

 

  • 하이퍼바이저 설치(ESXi, KVM, Citrix, Azure 등)
  • NVIDIA vGPU 매니저 & 드라이버 설치 (vGPU 매니저는 호스트에, vGPU 드라이버는 VM에)
  • 원하는 vGPU 프로필 설정 (예: A-series, B-series, Q/C-series)
  • 라이선스 구성: vWS 또는 vCS용 GPU 라이선스 확보
  • VM에 vGPU 연결 → OS/드라이버 설치

vWS 구성

 

  • RTX 기능 활성화를 위해 vPC/vWS 라이선스, 고해상도 설정
  • 워킹 세트 용량 고려해 L40S, A40, L4 선택

vCS

 

  • 컨테이너 중심 환경에 적합
  • GPU 타임슬라이스, 단일 GPU 다중 vGPU 설정 등 유연

vWS vs vCS 비교

항목 vWS(가상 워크스테이션) vCS(가상 컴퓨트 서버)
주 활용 워크 로드 그래픽, CAD, 렌더링, AI 개발 AI 학습, 추론, HPC, 데이터 과학
UI 제공 여부 있음(GUI 환경) 없음(CLI, 배치 중심)
해상도 & 멀티 모니터 최대 8K, 최대 4개 모니터 UI 없음, 디스플레이 항목 없음
GPU 공유 방식 VM 간 공유(mixed/equal) GPU 타임 슬라이스, vGPU 집약
라이선스 방식 vWS 라이선스, vPC 포함 GPU 단위 연간 구독
라이선스 단위 동시 사용자 수 (CCU) - 실제 사용중인 GPU VM 수 GPU 단위
주요 GPU L40S , A40, L4 대부분 Data Center GPU

 

 

 

 

 

 

 

실제 사용 사례

 

  • 디자이너 팀: 고해상도 그래픽 워크스테이션이 필요 → vWS + L40S 최적
  • AI 연구팀: 다중 모델 학습/추론 병렬 처리 → vCS + GPU 타임슬라이스 구성, NGC 컨테이너 사용
  • 혼합 환경 운영: 분석은 vCS에서, 그래픽은 vWS에서 분리 운영