본문 바로가기
728x90
반응형

H1006

[AI] 대한민국 AI 인프라 혁신: GPU 클러스터 구축 사업 사업 개요과학기술정보통신부는 “AI 컴퓨팅자원 활용기반 강화사업”의 일환으로 1조 4,600억 원 규모의 GPU 조달 및 운영 사업을 추진했습니다대상은 엔비디아의 최첨단 GPU인 B200과 H200 모델로, 국내 산학연, 스타트업, 연구기관 등에 제공될 예정입니다 선정된 기업 및 역할 분담기업확보 GPU 모델수량NHN 클라우드 B2007656 장카카오B2002424 장네이버 클라우드H2003056 장 사업 주요 특징과 전략 예산과 인프라 규모2025년 1차 추경 예산 1조4,600억 원 확보엔비디아 GPU 총 1만3천여 장 확보 목표클러스터 구성 방식B200 기반으로 대형 클러스터(510노드, 255노드 × 2세트) 구성: 고밀도 AI 워크로드 대응H200 기반으로 연말까지 안정적 배포 및 서비스 개시 .. 2025. 8. 1.
[Docker, NVIDIA] MIG 를 할당한 컨테이너 생성 MIG 활성화하기활성화 전# nvidia-smiFri Oct 18 10:04:07 2024+-----------------------------------------------------------------------------------------+| NVIDIA-SMI 550.54.14 Driver Version: 550.54.14 CUDA Version: 12.4 ||-----------------------------------------+------------------------+----------------------+| GPU Name Persistence-M | Bus-Id Disp.A | Volati.. 2024. 10. 24.
[NVIDIA] Cuda Toolkit 설치 # nvidia-smiThu Oct 17 16:23:44 2024+-----------------------------------------------------------------------------------------+| NVIDIA-SMI 550.54.14 Driver Version: 550.54.14 CUDA Version: 12.4 ||-----------------------------------------+------------------------+----------------------+| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC.. 2024. 10. 22.
[NVIDIA] MIG(Multi-Instance-GPU) 설정 및 생성 삭제 MIG 설정 순서MIG 활성화GPU Instance(GI) 생성Compute Instance(CI) 생성MIG 활성화 전 확인# nvidia-smiMIG 활성화 /비활성화nvidia-smi -i [활성화할 GPU 번호] -mig [0/1 비활성화 / 활성화]5번 GPU 활성화# nvidia-smi -i 5 -mig 10번 GPU 비활성화# nvidia-smi -i 0 -mig 0활성화 / 비활성화 후 GPU 리셋# nvidia-smi --gpu-reset# nvidia-smiMIG 프로필 확인GPU : 각 GPU 당 7개씩 MIG 나누어진 것 확인Instance Free / Total : GI 생성 가능 개수 확인Memory GIB 유의해서 원하는 만큼 활성화 시키기# nvidia-smi mig -lgi.. 2024. 8. 2.
[NVIDIA] MIG 활용시 배포 및 시스템 고려 사항 배포 고려 사항MIG 기능은 NVIDIA GPU 드라이버의 일부로 제공된다.H100 GPU는 CUDA 12/R525 드라이버부터 지원A100 및 A30 GPU는 CUDA 11/R450 드라이버부터 지원시스템 고려사항지원되는 운영체제 : CUDA 에서 지원하는 Linux 운영체제 배포판에서만 지원됨장치 노드 접근 : ./proc시스템 수준 인터페이스 대신, /dev cgroup을 통해 MIG 장치의 액세스 메커니즘을 제어하는 것이 권장됩니다. 이 기능은 450.80.02+ 드라이버부터 사용할 수 있습니다.지원되는 구성컨테이너를 포함한 베어메탈 환경지원되는 하이퍼바이저 위의 Linux 게스트에 대한 GPU 패스스루 가상화지원되는 하이퍼바이저 위의 vGPU지원되는 MIG 프로필A30 MIG 프로필A100 MI.. 2024. 8. 1.
효율적인 GPU 사용을 위한 MIG 기술 소개 GPU 활용의 중요성AI 및 딥러닝 기술의 발전으로 GPU의 수요가 급증하고 있습니다. GPU는 복잡한 연산을 빠르게 처리할 수 있어 AI 모델 학습과 데이터 분석에 필수적입니다. 그러나 고가의 GPU를 효율적으로 사용하는 방법은 여전히 큰 과제입니다.MIG란?MIG(Multi-Instance GPU)는 NVIDIA의 A100 GPU 및 일부 다른 데이터 센터 GPU에서 지원하는 기술로, 단일 GPU를 여러 개의 독립적인 인스턴스로 분할하여 동시에 여러 작업을 처리할 수 있도록 합니다. 이 기술은 특히 고성능 컴퓨팅(HPC), 딥 러닝, 데이터 분석 등 다양한 워크로드를 보다 효율적으로 처리하기 위해 설계되었습니다.주요 특징다중 인스턴스 생성: 단일 GPU를 여러 개의 독립된 인스턴스로 분할하여 각각의 .. 2024. 6. 12.
728x90
반응형