728x90 반응형 데이터7 [카카오테크 부트 캠프] 모의 면접 리뷰 딥러닝 / 머신 러닝 핵심 개념 정리 : 과적합 방지, 복잡도, 정규화이번 포스팅에서는 면접에서 자주 다루어지는 과적합(Overfitting) 방지 수단, 시간 및 공간 복잡도의 중요성, 그리고 정규화(Normalization)의 필요성에 대해 핵심만 짚어보겠습니다. 1. 과적합(Overfitting) 방지 수단과적합은 모델이 합습 데이터에 너무 특화되어 새로운 데이터(테스트 데이터)에 대한 일반화 성능이 떨어지는 현상을 말합니다. 이를 방지하는 대표적인 수단은 다음과 같습니다. 수단설명면접 시 논의 내용 반영데이터 증강(Data Augmentation)기존 학습 데이터를 변형(회전, 확대, 자르기 등)하여 학습 데이터 세트의 크기를 실질적으로 늘려 모델이 다양한 패턴을 학습하게 합니다. 학습 데이터는.. 2025. 10. 27. [데이터 시각화] HOG란 무엇인가? 객체 검출의 고전적인 역작, HOG 완전 분석 컴퓨터 비전 분야의 딥러닝 시대가 도래하기 전, Histogram of Oriented Gradients(HOG, 기울기 방향 히스토그램)는 객체 검출(Object Detection) 영역에서 가장 강력하고 혁신적인 특징 서술자(Feature Descriptor) 중 하나였습니다. 특히 사람 검출(Pedestrian Detection) 분야에 혁명을 가져왔던 HOG 원리와 작동 방식을 자세히 알아봅시다. HOG 기반 : 이미지 기울기 벡터(Gradient Vector)HOG가 작동하는 원리는 매우 직관적입니다. 객체의 모양(Shape)은 주로 윤곽선(Edge)에 의해 결정되며, 윤곽선은 픽셀 밝기가 급격하게 변하는 곳에서 발생합니다. 이미지 픽셀 위치 $f(x,y)$에 따른 밝기 값으로 이루어진 함수로 .. 2025. 10. 7. [데이터 시각화] 픽셀을 조각하다: 대비, 휘도, 노이즈 필터링으로 이미지 마스터하기 2025.10.01 - [AI/데이터 시각화] - [데이터 시각화] 픽셀을 해부하다: 파이썬으로 배우는 이미지의 다차원 구조 (Part 1) 이전에 이미지를 NumPy 배열로 다루고 기본적인 슬라이싱을 통해 채널을 분리하는 방법을 배웠습니다. 이번에는 더 흥미로운 이미지 처리 기법인 밝기/대비 조절과 노이즈 필터링을 구현해 보겠습니다.1. 밝기 조절 : 클리핑이 핵심픽셀 밝기는 RGB 구성요소 값에 비례합니다. (0 : 빛 없음, 255 : 최대 밝기) 밝기를 조절할 때는 값이 범위를 벗어나지 않도록 주의해야합니다.예를 들어 G = 200 인 픽셀의 밝기를 두 배로 늘리면 G = 400이 되는데, 최대값인 255를 초과하므로 이 값을 255로 클리핑(Clipping) 해야합니다. # NumPy의 cli.. 2025. 10. 6. [데이터 시각화] 픽셀을 해부하다: 파이썬으로 배우는 이미지의 다차원 구조 (Part 1) 개요데이터 과학자나 개발자에게 이미지는 단순히 보는 것을 넘어 분석하고 조작해야 할 다차원 데이터 구조입니다. 이번 글에서는 간단한 Python 라이브러리인 NumPy와 Matplotlib을 이용해 이미지를 데이터 관점에서 해부하고 기본적인 조작을 해보겠습니다. 1. 이미지 NumPy 배열로 바꾸기우리는 Jupyter Notebook 환경에서 작업을 시작합니다. 이미지를 데이터로 다루기 위한 필수 라이브러리들을 볼러옵니다.아래 간단한 코드를 통해 JPG 파일이 메모리에서 NumPy 배열(행렬)로 변환됩니다.import numpy as npimport matplotlib.pyplot as pltimport matplotlib.image as Image# 이미지를 불러와 NumPy 배열로 변환img = Im.. 2025. 10. 5. [데이터 분석] Python 데이터 분석의 핵심: Pandas 완벽 가이드 개요Pandas는 파이썬(Python) 기반의 데이터 조작 및 분석을 위한 강력한 라이브러리입니다. 데이터 과학과 머신러닝 분야에서 정형 데이터를 다루는 데 있어 거의 필수적인 도구로 꼽힙니다. 마치 스프레드시트 프로그램 처럼 데이터를 행과 열로 구조화하여 효율적으로 처리하고 분석할 수 있게 돕습니다. 주제 개념 및 용어 정리용어단어 뜻IT에서 쓰이는 용어 개념PandasPanel + Data(다차원 정형 데이터를 나타내는 경제학 용어) + S (복수형)의 합성어에서 유래구조화된 데이터의 조작과 분석을 위한 데이터 프레임 및 시리즈 객체를 제공하는 파이썬 라이브러리데이터를 구조화하여 효과적으로 처리하고 분석할 수 있도록 사용됨DataFrameData(데이터) + Frame(틀,구조)Pandas의 핵심 자.. 2025. 9. 30. [데이터 분석] 데이터 과학의 핵심, NumPy 마스터하기 개요Numpy는 Numerical Python의 줄임말로, 파이썬에서 대규모 다차원 배열과 행렬 연산은 효율적으로 처리하기 위한 핵심 라이브러리입니다. 데이터 과학, 머신러닝, 과학 컴퓨팅 분야에서 필수적으로 사용되며, 파이썬의 기본 리스트보다 훨씬 빠르고 메모리 효율적인 데이터 처리를 가능하게 합니다.용어 정리Numerical(수치적인) : 숫자로 나타내거나, 데이터를 수학적 및 통계적 방법을 통해 분석하는 것을 의미합니다.Python(파이썬) : '구렁이'라는 뜻을 가지고 있지만, IT 분야에서는 간결하고 가독성 높은 범용 프로그래밍 언어를 의미합니다.Numpy : Numerical + Python 합성어 수치적인 파이썬을 뜻하며, 특히 고성능 수치 연산에 최적화된 라이브러리를 말함사용 사례 및 예시.. 2025. 9. 29. 이전 1 2 다음 728x90 반응형