발제자: 신주희
발제일: 2025년 01월 20일
키워드: [Deep Learning] [Anomaly Detection] [Anomalous Data] [Neural Networks] [Data Mining] [Model Evaluation] [Supervised Learning] [Unsupervised Learning] [Time Series Data] [Anomaly Detection Techniques]
본 논문은 총 5가지를 집중적으로 다룸.
A. Problem nature and challenges : 이상 탐지의 몇 가지 고유한 문제 복잡성과 대부분의 미해결 과제에 대해 논의하고 분석함.
B. Categorization and formulation : 세 가지 원칙적인 프레임워크를 제시함.
end-to-end anomaly score learning : 종단간 이상 점수 학습
C. Comprehensive literature review : 여러 관련 커뮤니티의 주요 연구를 검토하여 연구 진행 사황에 대한 포괄적인 문헌 검토를 제시함. 또한, 각 방법론의 기본 가정, 목적 함수, 핵심 직관 설명하여 심층적인 소개를 제공함.
D. Future opportunities : 향후 연구 방향을 논의하고, 관련 과제 해결을 위한 시사점을 제시함.
E. Source codes and datasets : 공개적으로 접근 가능한 소스 코드를 수집하고 실제 이상이 포함된 데이터셋을 제공하며, 실증적 비교 벤치마크를 제공함.
Diverse types of anomaly : 3가지의 완전히 다른 유형의 이상 현상이 조사됨.
A. Point anomalies : 다른 개별 인스턴스들과 비교했을 때 비정상적인 개별 인스턴스
B. Conditional anomalies(Contextual anomalies) : 특정 상황에서 비정상 현상을 보임
C. Group anomalies(Collective anomalies) : 전체적으로 봤을 때 이상으로 간주되는 데이터 인스턴스의 부분집합, 개별 멤버는 정상일 수 있음.
Deep Learning Methods vs Traditional Methods in Anomaly Detection
모델링 관점에서 심층 이상 탐지 방법들을 3개의 주요 카테고리와 11개의 세부 카테고리로 분류하는 계층적 분류법을 소개함.
A. Deep learning for feature extraction - 심층 학습과 이상 탐지가 완전히 분리되며 심층 학습은 독립적인 특징 추출기로만 사용됨.
B. Learning feature representations of normality - 심층 학습과 이상 탐지가 어떤 형태로든 상호 의존적이며 정상성의 표현력 있는 특징을 학습하는 것이 목표임.
C. End-to-end anomaly score learning - 심층 학습과 이상 탐지가 완전히 통합됨, 신경망을 통해 이상 점수를 종단간 방식으로 학습되며 이상 점수 학습의 공식화 방식에 따라 4개의 하위 카테고리로 구분됨.
사전 학습된 모델 활용
A. AlexNet, VGG, ResNet 등의 사전 학습된 모델을 직접 사용
B. 사례 연구
b1. Unmasking 프레임워크: 연속된 비디오 프레임 간의 구분을 위한 반복적 분류기 학습.
b2. VGG 모델을 통한 외관 특징 추출
b3. 전이학습 활용: ILSVRC에서 사전 학습된 모델을 목표 데이터셋에 미세조정
명시적 특징 추출 모델 학습
A. 사전 학습된 모델 대신 특징 추출을 위한 심층 모델을 직접 학습
B. 주요 접근법
b1. 다중 autoencoder 네트워크 활용
b2. 합성곱 autoencoder를 통한 특징 추출 후 군집화
b3. 그래프 이상 탐지를 위한 표현 학습
이 방법론은 특히 복잡한 고차원 데이터에서 의미 있는 특징을 추출하는데 효과적이나, 특특징 추출과 이상 탐지의 분리로 인한 성능 제한이 주요 한계점으로 지적됨.
f : 이상 점수 계산 함수
가정 : Normal instance는 compressed space에서 이상치보다 더 재구성이 잘 됨.
목적 : 정상 데이터의 특성을 잘 포착하는 잠재 특징 공간 학습
수학적 표현 {Θ, W} = argmin Θ,W Σ(x∈X) ℓ(f(φ(x;Θ);W)) sx = f(φ(x;Θ);W)
목적 : 특정 거리 기반 이상 측정을 위해 최적화된 특징 표현 학습
목적 : 단일 클래스 분류를 위한 최적화된 특징 표현 학습
목적 : 새로운 표현 공간에서 이상이 군집과 명확히 구분되도록 학습
이전의 이상 측정 의존적 특징 학습과 달리, 이 접근법의 이상 점수 계산은 기존 이상 측정 방식에 의존하지 않고 신경망이 직접 이상 점수를 학습함.
목적 : 이상성의 절대적/상대적 순서 관계와 관련된 관찰 가능한 순서형 변수를 기반으로 데이터 인스턴스를 정렬하는 순위 모델을 직접 학습함.
B. A pairwise relation prediction - 소수의 레이블된 이상과 대량의 레이블되지 않은 데이터 활용 - 인스턴스 쌍 간의 관계 학습
목적 : 사전 분포를 사용하여 이상 점수 학습을 인코딩하고 유도함.
목적 : 훈련 데이터의 이벤트 우도를 최대화하여 이상 점수 학습함.
목적 : 정상 여부를 판별하는 단일 클래스 분류기를 종단간 방식으로 학습함.
각 범주의 대표적 알고리즘들의 주요 특성이 Table 2에 요약되어 있으며, 모델 설계와 관련된 주요 관찰 사항은 다음과 같음.
A. 운영 모드
C. 네트워크 구조 : 대부분 5개 이하의 네트워크 층으로 구성, 비교적 깊지 않은 구조
D. 활성화 함수
E. 백본 네트워크
심층 이상 탐지를 위한 도전적 테스트베드 제공
기존 목적 함수들의 한계
A. 일반적이나 이상 탐지에 특화되지 않음
B. 기존 이상 측정 방식의 제약에 구속됨
향후 방향
A. 데이터 재구성과 GAN을 넘어선 새로운 이상 지도 신호 탐색
B. 도메인 지식을 활용한 도메인 중심 이상 탐지 개발
주요 연구 방향
A. 알려지지 않은 이상 탐지
a1. 제한된 레이블 이상에서 미지의 이상으로 일반화
a2. 모델의 일반화 가능성 이해와 성능 향상
B. Data-efficient anomaly detection or Few-shot anomaly detection
b1. 제한된 레이블 이상에서 미지의 이상으로 일반화
b2. 모델의 일반화 가능성 이해와 성능 향상
고려사항
A. 레이블되지 않은 데이터의 이상 오염 방지
B. 이상 오염에 대한 강건성 확보
C. 도메인/응용 특화적 접근 필요성
필요성
A. 모델 결정과 결과의 이해
B. 편향/위험 완화
C. 의사결정 행동 지원
접근법
A. 모델 독립적 설명 방식의 한계
B. 내재적 설명 능력을 가진 심층 모델 개발 필요
새로운 연구 응용 분야
A. 분포 외 탐지(OOD)
a1. 훈련 분포에서 멀리 떨어진 인스턴스 탐지
a2. 세분화된 정상 클래스 레이블 가정
B. Curiosity learning
b1. 희소 보상 강화학습에서의 보너스 보상 함수
b2. 이상 탐지와의 상호 보완 가능성
C. IID
c1. 상호의존적/이질적 비정상성 처리
c2. 복잡한 시나리오에서 중요함
D. 기타 응용
d1. 적대적 예제 탐지
d2. 생체인식 시스템의 위조 방지
d3. 희귀 재난 사건의 조기 탐지