본문 바로가기
728x90

분류 전체보기305

[Slurm]Slurm 수동 설치 https://estar987.tistory.com/164 이전에 포스팅한 Munge를 설치 완료했다면 이제 Slurm을 설치할 차례이다. 이번 포스팅은 마스터 노드에서만 돌아가는 Slurm을 설정할 것이고 차후 업로드하는 게시물에 마스터 노드에 계산 노드를 연동하여 HPC를 구성한 후 Slurm을 사용하는 방법을 포스팅할 예정이다. 아래 모든 설정은 마스터 노드에서 작업한다.Slurm downloadcd /engrid/slurm/src/wget https://download.schedmd.com/slurm/slurm-23.11.6.tar.bz2Slurm installtar xvfj slurm-23.11.6.tar.bz2cd slurm-23.11.6/./configure --prefix=/engrid/s.. 2024. 6. 17.
[Ubuntu]Munge Install 외부망 없이 MUNGE 설치 방법(Munge 수동 설치)외부망이 되지 않을 때 설치하는 과정을 작성하려고 합니다. yum, dnf, apt-get 등 패키지 관리자를 사용하면 편리하지만, 보안이나 고객사의 요구사항 등을 고려하여 수동 설치 방법도 알아야 합니다. 컴파일에 필요한 라이브러리는 외부망에서 미리 가져오고, MUNGE는 수동으로 설치하는 방법을 설명합니다.먼저, MUNGE의 정의에 대해 알아보겠습니다.MUNGE란?MUNGE(MUNGE Uid 'N' Gid Emporium)는 클러스터 환경에서 사용자 및 그룹 ID를 인증하기 위한 서비스입니다. 보안이 강화된 통신을 위해 데이터를 암호화하여 전송하며, HPC(High Performance Computing) 시스템에서 널리 사용됩니다.Munge 수.. 2024. 6. 16.
Windows Server OS 설치 Windows Server 2019 설치 과정이다. 2024. 6. 15.
시스템 손상을 방지하는 방법: 복구 불가한 명령어 실행 전 준비 사항 리눅스 시스템에서 강력한 터미널 명령어를 잘못 실행하면 시스템에 심각한 손상을 초래할 수 있습니다. 이러한 문제를 예방하기 위해 다양한 방법을 통해 시스템 손상을 방지할 수 있습니다. 이번 글에서는 위험한 명령어를 실행하기 전에 시스템을 보호하는 몇 가지 방법을 소개합니다.1. 위험한 명령어 식별 및 테스트주요 위험한 명령어rm -rf시스템의 모든 파일을 삭제합니다.mkfs.ext3 /dev/sda지정된 장치에 새로운 파일 시스템을 생성하여 모든 데이터를 삭제합니다.dd if=/dev/random of=/dev/sda랜덤 데이터를 하드 드라이브에 작성하여 데이터를 삭제합니다테스트 환경에서 실행가상 머신 사용: VirtualBox, VMware와 같은 가상 머신을 사용하여 명령어를 먼저 테스트합니다. 가상.. 2024. 6. 14.
네트워크 인터페이스 MAC 주소 변경되는 오류 재부팅할 때마다 네트워크 인터페이스 MAC 주소가 자동으로 변경되는 오류가 가끔 발생한다. 이때 해결법은 아래와 같다.1. ifconfig로 네트워크 인터페이스 확인 후 usb 지우기2. BMC 창에서 Host interface 끄기 2024. 6. 13.
효율적인 GPU 사용을 위한 MIG 기술 소개 GPU 활용의 중요성AI 및 딥러닝 기술의 발전으로 GPU의 수요가 급증하고 있습니다. GPU는 복잡한 연산을 빠르게 처리할 수 있어 AI 모델 학습과 데이터 분석에 필수적입니다. 그러나 고가의 GPU를 효율적으로 사용하는 방법은 여전히 큰 과제입니다.MIG란?MIG(Multi-Instance GPU)는 NVIDIA의 A100 GPU 및 일부 다른 데이터 센터 GPU에서 지원하는 기술로, 단일 GPU를 여러 개의 독립적인 인스턴스로 분할하여 동시에 여러 작업을 처리할 수 있도록 합니다. 이 기술은 특히 고성능 컴퓨팅(HPC), 딥 러닝, 데이터 분석 등 다양한 워크로드를 보다 효율적으로 처리하기 위해 설계되었습니다.주요 특징다중 인스턴스 생성: 단일 GPU를 여러 개의 독립된 인스턴스로 분할하여 각각의 .. 2024. 6. 12.
728x90