본문 바로가기
728x90
반응형

nvidia24

[NVIDIA] MIG를 활용한 고성능 컴퓨팅 환경 구축 1. Kubernetes & MIGKubernetes는 컨테이너화된 애플리케이션의 배포, 확장, 관리를 자동화하는 오픈 소스 플랫폼입니다. MIG와 Kubernetes를 통합하면 다음과 같은 이점을 얻을 수 있습니다:리소스 최적화: Kubernetes의 자원 할당 기능과 MIG의 인스턴스 분할 기능을 결합하여 GPU 자원을 최적화할 수 있습니다.유연한 스케줄링: Kubernetes의 스케줄러를 사용하여 다양한 크기의 MIG 인스턴스를 필요에 따라 유연하게 할당할 수 있습니다.자동화된 관리: Kubernetes의 오토스케일링과 자원 모니터링 기능을 통해 GPU 사용량을 자동으로 관리하고 최적화할 수 있습니다.1.1 Kubernetes 설정 예시Kubernetes 노드 설정: 각 노드에서 NVIDIA 드라이.. 2024. 7. 31.
[NVIDIA] CUDA Driver 설치 Cuda Version Check# nvidia-smi Wed Jun 19 18:09:47 2024 +-----------------------------------------------------------------------------+| NVIDIA-SMI 470.239.06 Driver Version: 470.239.06 CUDA Version: 11.4 ||-------------------------------+----------------------+----------------------+| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC || Fan Temp Perf P.. 2024. 7. 29.
[Hardware]인피니밴드 드라이버 설치 매뉴얼 개요인피니밴드는 고성능 컴퓨팅(High-Performance Computing, HPC)에서 널리 사용되는 네트워킹 기술로, 빠른 데이터 전송 속도와 낮은 지연 시간을 제공합니다. 이제 설치 과정을 단계별로 살펴보겠습니다.인피니밴드 드라이버 다운로드 및 설치Mellanox OFED 드라이버를 다운로드하고 설치해야 합니다. Mellanox OFED는 Mellanox 하드웨어에서 사용할 수 있는 드라이버 패키지입니다. 최신 버전을 Mellanox 웹사이트에서 다운로드합니다.https://network.nvidia.com/products/infiniband-drivers/linux/mlnx_ofed/ Linux InfiniBand DriversMellanox OpenFabrics Enterprise Distr.. 2024. 7. 2.
[NVIDIA] NVIDIA 그래픽 드라이버 설치 개요OS : Rocky 8.7NVIDIA 드라이브 설치를 위해서는 kernel-devel 과 kernel-headers 패키지가 설치되어 있어야 한다.nouveau란?오픈 소스 그래픽 드라이버로, NVIDIA 그래픽 카드를 위한 리버스 엔지니어링된 드라이버입니다. 이 드라이버는 NVIDIA의 독점 드라이버와는 달리, 커뮤니티에서 개발 및 유지 관리되며, Linux 커널과 긴밀하게 통합되어 있습니다. NVIDIA의 독점 드라이버를 설치하여 더 나은 성능과 호환성을 원할 경우, nouveau 드라이버를 비활성화해야 합니다. 아래 과정은 nouveau 드라이버 비활성화 하는 과정을 포함하고 있습니다.nouveau module 확인# lsmod | grep nouveaunouveau 24.. 2024. 6. 27.
효율적인 GPU 사용을 위한 MIG 기술 소개 GPU 활용의 중요성AI 및 딥러닝 기술의 발전으로 GPU의 수요가 급증하고 있습니다. GPU는 복잡한 연산을 빠르게 처리할 수 있어 AI 모델 학습과 데이터 분석에 필수적입니다. 그러나 고가의 GPU를 효율적으로 사용하는 방법은 여전히 큰 과제입니다.MIG란?MIG(Multi-Instance GPU)는 NVIDIA의 A100 GPU 및 일부 다른 데이터 센터 GPU에서 지원하는 기술로, 단일 GPU를 여러 개의 독립적인 인스턴스로 분할하여 동시에 여러 작업을 처리할 수 있도록 합니다. 이 기술은 특히 고성능 컴퓨팅(HPC), 딥 러닝, 데이터 분석 등 다양한 워크로드를 보다 효율적으로 처리하기 위해 설계되었습니다.주요 특징다중 인스턴스 생성: 단일 GPU를 여러 개의 독립된 인스턴스로 분할하여 각각의 .. 2024. 6. 12.
InfiniBand 명령: HPC 환경을 위한 종합 가이드 InfiniBand는 낮은 대기 시간과 높은 처리량 기능을 위해 고성능 컴퓨팅(HPC)에 널리 사용되는 고속 네트워킹 기술입니다. 강력한 HPC 네트워크를 설정하고 유지 관리하려면 주요 InfiniBand 명령을 이해하는 것이 필수적입니다. 이 가이드에서는 필수 InfiniBand 명령과 사용법을 다룹니다.주요 infiniband 명령ibstatibstat 명령은 시스템의 InfiniBand 장치에 대한 자세한 정보를 제공합니다. 포트, 펌웨어 버전 및 GUID에 대한 정보를 포함하여 HCA(호스트 채널 어댑터)의 상태를 표시합니다.ibstat [options] [DeviceName] 공통 옵션d: 현재 디버그 설정을 표시합니다.h: ibstat 명령에 대한 도움말을 표시합니다.i: 네트워크 인터페이스 .. 2024. 5. 26.
728x90
반응형