728x90 HPC29 [Slurm]Slurm 환경에서 Abaqus 작업 프로세스가 잔존하는 문제 해결 문제 상황1. Job Kill 후 프로세스 잔존Slurm 스케줄러를 사용해 Abaqus 작업을 수행하던 중, 작업이 Kill 되더라도 관련 프로세스가 남아 있는 문제가 발생했습니다. 이로 인해 시스템 자원이 낭비되고, Abaqus 라이선스가 반환되지 않는 상황이 발생했습니다.2. Abaqus Standard 프로세스 종료 문제일부 경우에서 작업이 정상적으로 종료되었음에도 불구하고, Abaqus Standard 프로세스(standard.exe)가 종료되지 않아 추가적인 문제가 발생했습니다. 해결 접근 방식(trap & Signal 활용)1. Signal 처리(SIGTERM)작업 종료 시 cleanup 함수를 호출하여 잔여 프로세스와 관련된 라이선스를 강제로 정리하도록 설정했습니다.2. 프로세스 추적 및 강.. 2024. 12. 23. [HPC]Singularity 설치 및 사용 가이드 Singularity란?Singularity는 컨테이너 기술로, HPC(고성능 컴퓨팅) 환경에서 주로 사용됩니다. 보안성과 유연성을 제공하며, 연구 및 개발 분야에서 Docker 대안으로 자주 사용됩니다. 설치 환경 OS: Ubuntu 24.04Singularity 버전: 최신 버전주요 패키지: Python3, Numpy, Polib 등설치 과정시스템 업데이트sudo apt update 의존성 문제 해결sudo apt --fix-broken install Singularity 설치sudo apt-get install singularitySingularity 설치 확인$ singularity --version/usr/games/singularity:6: DeprecationWarning: pkg_res.. 2024. 12. 5. [HPC]Singularity 개요Singularity는 HPC(High-Performance Computing) 환경에 특화된 컨테이너 솔루션으로, 과학 연구 및 데이터 집약적인 작업을 위해 설계되었습니다. Docker와 유사하게 컨테이너 기술을 기반으로 하지만, HPC 환경의 요구 사항을 충족하도록 최적화되었습니다. 주요 특징1. 보안 중심 설계 Singularity는 루트 권한 없이 컨테이너 실행이 가능합니다.일반 사용자가 컨테이너를 실행하더라도 호스트 시스템의 보안을 유지합니다.컨테이너 내부의 프로세스는 사용자의 권한으로 실행되며, 이는 HPC 클러스터와 같은 멀티유저 환경에서 매우 중요합니다. 2. HPC 환경 통합 Singularity는 MPI(Message Passing Interface), InfiniBand 등과 같.. 2024. 11. 25. [Linux] ANSYS 소프트웨어 설치 개요os : rockylinux 8.9software : ANSYS2023R1ANSYS 설치는 VNC, rdp 등 GUI 환경을 불러올 수 있는 환경에서 실시한다VNC와 RDP 설치는 이전에 포스팅한 블로그들을 참고하면 된다.2024.04.01 - [Virtual] - Ubuntu에 VNC 설치 Ubuntu에 VNC 설치OS : Ubuntu : 20.04.4 turbovnc_2.2.6_amd64.deb 해당 파일로 설치하였다. # dpkg -i turbovnc_2.2.6_amd64.deb # dpkg -L "turbovnc" | grep bin (경로 찾기) # cd /opt/TurboVNC/bin/ # /opt/TurboVNC/bin/vncviewer (실행) 발생한 오류 # /opt/Turboesta.. 2024. 11. 18. [SLURM] SBATCH(2) 기타 SBATCH 옵션Dependency Job 수행 방법#SBATCH --error=파일이름#SBATCH --mail-type=ALL#SBATCH --mail-user=이메일 주소#SBATCH --cpu-per-task=쓰레드 수 #SBATCH --mem=메모리 크기 // --mem, --mem-per-cpu는 중복 불가, 노드 설정에 RealMemory=8080(M) 부분 반영 필요#SBATCH --mem-per-cpu=메모리 크기#SBATCH --gres=gpu:개수#SBATCH --time=HH:MM:SS#SBATCH --begin=시작시간#SBATCH --partition=파티션이름#SBATCH --qos=QOS 이름#SBATCH --nodelist=노드 리스트#SBATCH --exclude=노.. 2024. 9. 9. [SLURM] SBATCH(1) SBATCH는 사용자가 작성한 스크립트를 스케줄러를 통해 배치 방식으로 작업을 제출하고 출력 결과는 별도의 로그 파일을 통해 확인하는 방식 작업 제출 스크립트 작성$ vi job_submit.sh$ cat job_submit.sh#!/bin/sh#SBATCH --job-name=job_test1 ### 작업명#SBATCH --chdir=/home/admin/temp ### 작업디렉토리#SBATCH --output=/home/admin/temp/job_test1.log ### 결과로그파일#SBATCH --get-user-env ### 현재 터미널에 로드된 환경설정을 그대로 유지#SBATCH --nodes=1 ### 작업할당 노드 수#SBATCH --tasks-per-node=8 ### 작업할당 .. 2024. 9. 6. 이전 1 2 3 4 5 다음 728x90