GAN과 Outlier-Exposure를 이용한 관찰되지 않은 반도체 웨이퍼 맵 불량 유형 탐지

Out-of-Distribution Detection for Semiconductor Wafer Map Defect Using GAN and Outlier-Exposure

Article information

J Korean Soc Qual Manag. 2025;53(3):329-342
Publication date (electronic) : 2025 September 30
doi : https://doi.org/10.7469/JKSQM.2025.53.3.329
*Department of Industrial Engineering, Inha University
**YB Research, Incheon, South Korea
김민주*, 홍재협*, 허영범*,**,
*인하대학교 산업경영공학과
**주식회사 와이비리서치
Corresponding Author(youngbum.hur@inha.ac.kr)
*이 논문은 중소벤처기업부에서 지원하는 2025년도 산학연 Collabo R&D 사업(RS-2025-02315681)과 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원(No. RS-2022-NR066632 & No.2022R1F1A1074062)과 정보통신기획평가원의 지원(No. 2022-0-00641, XVoice: Multi-Modal Voice Meta Learning)을 받아 수행된 연구임.
Received 2025 June 24; Revised 2025 July 28; Accepted 2025 August 11.

Trans Abstract

Purpose

Out-of-Distribution(OOD) detection plays a crucial role in semiconductor manufacturing for identifying defects and ensuring quality control. However, collecting diverse real-world defect samples is expensive and challenging, limiting model performance. This study improves OOD detection by using Deep Convolutional Generative Adversarial Networks(DCGAN) to generate synthetic defect images, which are incorporated into the Outlier Exposure(OE) framework as an auxiliary dataset to enhance model generalization.

Methods

Using the WM 811K wafer dataset, we generate synthetic defect images via DCGAN and integrate them into the OE framework. The proposed approach is compared with Maximum Softmax Probability(MSP) and standard OE model to evaluate its effectiveness. Performance is measured using FPR95, AUROC, and AUPR. Additionally, we investigate the impact of DCGAN training epochs on image quality and detection performance.

Results

Experimental results indicate that OE with DCGAN significantly outperforms baseline method. Incorporating DCGAN-generated data reduces FPR95 while increasing AUROC and AUPR, demonstrating improved OOD detection capabilities. The study also highlights how optimizing DCGAN training enhances synthetic data quality and overall model performance.

Conclusion

This study confirms that DCGAN-generated defect images effectively mitigate data scarcity issues in semiconductor OOD detection. Future research should explore alternative generative models (e.g., StyleGAN, VQ-VAE) and address class imbalance challenges to further enhance robustness and reliability.

1. 서 론

4차 산업혁명과 인공지능 기술의 발전은 다양한 산업 분야에서 데이터 분석 및 이상 탐지 기술의 중요성을 더욱 강조하고 있다. 제조 업체들은 품질 관리를 위해 딥러닝과 같은 머신러닝 기법을 적극적으로 도입하고 있으며(Lee et al., 2023), 최근 국내에서도 반도체 제조공정의 이상탐지(Ha et al., 2025)와 품질경영 관점에서의 머신러닝 연구(Kim et al., 2025) 등이 활발히 진행되고 있다. 특히 반도체 제조 공정에서는 웨이퍼의 결함을 조기에 감지하여 품질 관리를 효율적으로 수행하기 위해 대규모 센서 데이터를 실시간으로 분석하고 이상 데이터를 탐지하는 기술이 필수적이다(Chen et al., 2024). 그러나 실제 환경에서의 결함 데이터 수집은 높은 비용과 기술적 한계로 인해 어려움이 따르며, 이로 인해 이상 탐지 모델의 성능이 제한되는 경우가 많다(Khan & Madden, 2014). 이러한 문제를 극복하기 위해 최근에는 생성형 모델을 활용한 가상 데이터 생성 기술이 주목받고 있으며, 이 기술은 다양한 산업 분야에서 데이터 부족 문제를 완화하고 이상 탐지 성능을 향상시키는 데 기여할 수 있다(Zhao et al., 2023). 특히, 반도체 제조 환경에서는 가상으로 생성된 데이터를 활용하여 OOD(Out-of-Distribution) 탐지 기법과 결합함으로써 정밀한 결함 탐지가 가능해진다.

OOD 탐지는 정상 데이터와 실제 환경에서 발생하는 이상 데이터를 구별하여 이상치를 찾아내는 기법으로 데이터 분포의 차이를 포착하여 이상 패턴을 식별한다. 다만, 소프트맥스 확률만을 활용한 기존의 OOD 탐지 연구(Hendrycks & Gimpel, 2017)는 도메인의 특성을 충분히 반영하지 못하는 한계를 보였으며(Lee et al., 2018), 반도체 제조 공정 특성상 결함 유형의 다양성과 데이터 희소성 문제로 인해 기존 방법들이 OOD 데이터를 효과적으로 처리하는 데 어려움을 겪고 있다(Jeong et al., 2022).

이러한 한계를 극복하기 위해 Hendrycks et al.(2019)은 OE(Outlier Exposure) 기법을 제안하였다. OE는 모델이 정상 데이터뿐만 아니라 외부에서 제공된 다양한 비정상 데이터에도 노출되도록 학습하는 방법론으로, OOD 탐지 성능을 향상시키는 것을 목표로 한다. OE 기법은 정상 데이터와 명확히 구분되는 비정상 데이터셋(보조 데이터셋)을 학습에 포함하여, 모델이 다양한 OOD 샘플을 경험하도록 유도함으로써 결정 경계를 더욱 명확하게 형성한다.

그러나 기존 연구들은 대부분 일반적인 이미지 데이터셋에 초점을 맞추고 있으며 현재까지 발표된 연구를 조사한 결과, WM 811K와 같은 반도체 결함 데이터셋을 활용한 OOD 탐지에 관한 연구는 제한적이다. 이러한 연구 공백을 바탕으로 본 논문에서는 반도체 웨이퍼 맵의 OOD 탐지 성능을 향상시키기 위해 OE 기법을 활용하되, 기존 연구에서 주로 사용되는 외부 데이터셋 대신 생성형 모델 기반 결함 이미지를 보조 데이터셋으로 사용하는 방법론을 제안한다. 연구에 사용된 생성형 모델은 DCGAN(Deep Convolutional Generative Adversarial Networks; Radford et al., 2016)으로 CNN(Convolutional Neural Network) 기반의 GAN(Generative Adversarial Network) 구조를 적용하여 학습 안정성과 고품질 이미지 생성을 가능하게 한다. 특히, 반도체 제조 공정에서는 비정상 데이터를 직접 수집하는 것이 어렵기 때문에 DCGAN을 통한 합성 결함 데이터 생성의 필요성이 더욱 부각된다.

본 연구는 DCGAN을 활용하여 생성된 합성 결함 데이터를 OE 기법과 결합함으로써 반도체 웨이퍼 맵의 OOD 탐지 성능을 향상시키는 방법을 제안한다. 이를 기반으로 본 논문은 다음과 같이 구성된다. 2장에서는 관련 연구를 통해 DCGAN, OOD 탐지에 대한 기존 연구를 소개하고, 3장에서는 본 연구에서 제안하는 방법론을 제시한다. 4장에서는 실험과 평가를 통해 제안된 방법의 성능을 분석하며, 마지막 5장에서는 본 연구의 결론과 향후 연구 방향을 논의한다.

2. 이론적 배경 및 선행연구

2.1 OOD 탐지에 관한 연구

OOD 탐지의 개념은 Hendrycks & Gimpel(2017)에 의해 본격적으로 제안되었다. Hendrycks와 Gimpel의 연구에서는 소프트맥스 확률을 기반으로 간단한 기준선을 제시하였으며 예측 확률이 낮은 경우 OOD로 간주하는 방식을 사용하였다. 이러한 초기 연구는 OOD 탐지 문제의 기초를 다졌으나 실제 환경에서 더 정교한 방법이 필요하였다. 이후 Lee et al.(2018)은 Mahalanobis Distance를 활용한 OOD 탐지 방법을 제안하였다. 이 방법은 각 클래스의 평균 벡터와 공분산 행렬을 사용하여 데이터 포인트가 분포 중심에서 얼마나 떨어져 있는지 계산함으로써 OOD 데이터를 효과적으로 구별하였다. Mahalanobis Distance 기반 접근법은 기존 소프트맥스 확률 기반 방법에 비해 높은 정밀도를 제공하였다. Liang et al.(2018)은 Temperature Scaling과 Input Perturbation을 결합하여 OOD 탐지 성능을 더욱 향상시켰다. 이 접근법은 모델 출력의 확률 분포를 조정하고 입력 데이터에 작은 노이즈를 추가하여 OOD 데이터의 탐지 가능성을 높이는 데 성공하였다.

한편, Hein et al.(2019)은 Neural Network의 불확실성을 분석하여 OOD 탐지에서의 신뢰도를 개선하는 방법론을 제안하였다. 이 연구는 네트워크의 경계 영역에서 발생하는 이상 데이터를 효과적으로 탐지할 수 있는 가능성을 열었다. Liu et al.(2020)은 Energy-Based 모델을 도입하여 OOD 탐지 문제를 해결하고자 하였으며 이는 모델 출력의 에너지 스코어를 활용하여 더 정확한 탐지가 가능하게 했다. 또한, DHM(Deep Hybrid Model)은 Residual 기반 DNN(Deep Neural Network)과 Normalizing Flow를 결합하여 데이터의 불확실성을 정밀하게 모델링함으로써 OOD 탐지에서 높은 성능을 보였다(Cao et al., 2022). 최근에는 Diffusion 모델을 활용한 접근법이 등장하여 픽셀 수준에서 OOD 데이터를 생성하고 탐지하는 새로운 방식이 제안되었다(Du et al., 2023).

2.2 DCGAN에 관한 연구

최근 보조 데이터셋 생성을 위해 GAN과 같은 생성형 모델을 활용하는 연구가 주목받고 있다. 특히, 비정형 데이터 환경에서 기존의 정형화된 외부 데이터셋을 사용하는 것보다 도메인 특화 데이터를 생성하여 모델 성능을 향상시키는 접근법이 활발히 연구되고 있다(Kang et al., 2022). GAN은 Goodfellow et al.(2014)에 의해 처음 제안된 생성 모델로 생성자(Generator) 와 판별자(Discriminator)의 경쟁을 통해 새로운 데이터를 생성하는 방식을 기반으로 한다. 이 두 네트워크 간의 경쟁은 생성자가 판별자를 속일 수 있는 현실적인 데이터를 생성하도록 유도한다. 그러나 초기 GAN은 학습의 불안정성과 모드 붕괴(Mode collapse) 문제로 인해 고품질 데이터를 안정적으로 생성하는 데 한계가 있었다(Goodfellow et al., 2014).

이러한 문제를 해결하기 위해 Radford et al.(2016)은 DCGAN을 제안하여 기존 GAN을 CNN 기반으로 개선하여 학습 안정성을 높이고 고해상도 이미지 생성을 가능하게 했다. 더 나아가 DCGAN의 구조를 개선하거나 변형하여 특정 응용 분야에 최적화한 연구들도 발표되었는데 Miyato et al.(2018)은 스펙트럼 정규화(Spectral Normalization)를 적용한 GAN을 제안하여 판별자의 가중치를 최대 특이값으로 정규화함으로써 Lipschitz 연속성을 유지하고 기울기 폭발 및 모드 붕괴를 방지하며 안정적인 학습을 가능하게 했다. 또한, Karras et al.(2020)은 잔차 연결을 활용하여 생성 이미지의 품질을 크게 향상시켰다. 특히, 새로운 노이즈 정규화 기법을 도입하여 이미지의 세부 표현을 개선하고 레이어 정규화를 최적화하여 훈련 안정성과 표현력을 동시에 향상시켰다. 이 외에도 최근 Thottolil et al.(2023)은 RidgeGAN을 제안하여 커널 릿지 회귀(KRR)와 GAN 기반 모델을 결합함으로써 도시 확산과 교통망의 공간적 패턴을 분석하고 인프라 개발의 품질과 예측 신뢰성을 향상시키는 모델을 구축하였다.

2.3 OOD 탐지와 생성형 모델을 적용한 사례에 대한 연구

OOD 탐지 성능을 개선하기 위해 생성형 모델이 적극적으로 활용되고 있다. 특히, GAN, Diffusion Model, VAE(Variational AutoEncoder) 등의 생성형 모델을 이용하여 다양한 도메인에서 OOD 탐지 성능을 향상시키는 연구가 활발히 진행 중이다. 예를 들어, Kwon et al.(2023)은 비전 파운데이션 모델을 활용하여 합성 아웃라이어를 생성하는 SHIFT(Synthetic Harmless Outlier Images Generator From Training Samples) 기법을 제안하였으며 이를 통해 추가적인 OOD 데이터 없이도 OOD 탐지 성능을 향상시킬 수 있음을 보였다. Lee et al.(2023)은 비전 언어 모델을 활용하여 텍스트 기반 OOD 데이터를 생성하고 이를 통해 시각적 OOD 탐지 성능을 향상시킬 수 있음을 입증하였다. 또한, RCC Dual GAN 모델은 제한된 레이블 환경에서도 효과적인 이상치 탐지를 수행할 수 있도록 설계되었다. Li et al.(2020)은 RCC Dual GAN을 활용하여 데이터 구조의 복잡성을 고려한 이상 탐지 성능을 향상시켰다. 이 모델은 소수의 이상치 레이블만으로도 높은 탐지 성능을 유지할 수 있도록 설계되었으며 OOD 탐지 분야에서 효과적인 접근 방식으로 주목받고 있다.

시계열 데이터에서 OOD 탐지를 수행하는 연구도 활발히 진행되고 있다. Jeong & Kim(2023)은 LSTM-GAN을 활용하여 시계열 데이터의 이상치를 탐지하고 보정하는 기법을 제안하였다. 이를 통해 기존 이상 탐지 기법보다 높은 정확도를 달성할 수 있음을 보였다. 이러한 연구들은 생성형 모델이 OOD 탐지에서 중요한 역할을 수행할 수 있음을 보여주며 특정 도메인에 특화된 데이터 생성을 통해 모델의 일반화 능력을 높일 수 있음을 시사한다.

3. 연구 방법론 제안

본 연구는 OOD 탐지 성능을 향상시키기 위해 DCGAN을 활용하여 보조 데이터셋(Auxiliary Dataset)을 생성하고, 이를 OE 기법과 결합하는 방법을 제안한다. 연구방법의 전체적인 흐름은 Figure 1에 제시되어 있다. OE 기법은 모델이 정상 데이터뿐만 아니라 다양한 비정상 데이터를 학습하도록 유도하여 일반화 성능을 높이는 방식이다. 그러나 기존 OE 연구에서 사용되는 데이터셋들은 반도체 제조 공정의 특성을 충분히 반영하지 못하는 한계점을 가졌다. 이를 해결하기 위해 반도체 제조 공정에서 나타날 수 있는 다양한 결함 패턴을 DCGAN을 통해 학습하여 생성하고 OE 기법의 보조 데이터셋으로 사용해 OOD 탐지 성능을 개선한다. 생성된 데이터는 모델이 보다 다양한 결함 유형을 경험하도록 하여 정상 데이터와의 결정 경계를 명확하게 형성한다. 또한, DCGAN을 통해 생성된 데이터의 품질을 보장하기 위해 학습된 데이터의 특성을 분석하고 OE 기법과 결합하여 모델이 보다 강건하게 OOD 데이터를 탐지할 수 있도록 설계하였다.

Figure 1

OOD Detection Framework with DCGAN and OE

3.1 DCGAN을 이용한 보조 데이터셋 생성

본 연구의 방법론에서 사용된 생성형 모델 DCGAN은 기존 GAN의 변형 모델로 안정적인 학습과 고품질 이미지 생성을 목표로 설계되었다. 우선, GAN은 기본적으로 Generator와 Discriminator 두 네트워크로 구성되며 Generator는 랜덤 노이즈로부터 새로운 데이터를 생성하고 Discriminator는 입력된 데이터가 실제(Real)인지 생성된(Fake) 데이터인지 판별하는 역할을 수행한다. 이러한 구조를 통해 Generator와 Discriminator는 서로 경쟁적으로 학습하며 점점 더 정교한 데이터를 생성할 수 있도록 한다. 그러나 기존 GAN은 학습 과정에서 불안정성이 발생할 가능성이 높다는 문제가 존재한다.

DCGAN은 이러한 문제를 해결하기 위해 기존 GAN의 한계를 극복하고 CNN 기반의 구조를 도입하여 학습 안정성을 향상시킨 모델이다. DCGAN의 Generator와 Discriminator는 모두 CNN 기반으로 설계되어 있다. Generator는 임의의 랜덤 벡터를 입력받아 점진적으로 해상도를 증가시키며 실제와 유사한 이미지를 생성하는 역할을 한다. 이 과정은 FSC(Fully Strided Convolution) 연산을 활용하여 단계적으로 업샘플링을 수행하며 진행된다. 먼저, 100 차원의 랜덤 벡터를 입력받아 첫 번째 레이어에서 4×4×1024 크기의 텐서로 변환한 후 점진적으로 해상도를 증가시킨다. 이후 4×4×1024 → 8×8×512 ··· 64×64×3 순서로 업샘플링을 수행하며 최종적으로 64×64 해상도의 RGB 이미지를 생성한다.

이때, DCGAN은 기존 CNN에서 사용되는 MaxPooling과 같은 공간 축소 연산을 제거하고, 대신 Strided Convolution을 활용하여 네트워크가 직접 업샘플링을 학습할 수 있도록 설계되었다. 이를 통해 모델은 공간적 구조를 보존하면서 세밀한 이미지 생성이 가능하다. 각 업샘플링 단계에서는 Batch Normalization을 적용하여 가중치 업데이트를 안정화하고, ReLU(Rectified Linear Unit) 활성화 함수를 사용하여 기울기 소실 문제를 방지한다. 마지막 출력층에서는 Tanh 활성화 함수를 적용하여 픽셀 값이 [-1,1] 범위로 정규화한다. DCGAN의 이러한 구조와 벡터 변환 과정은 Figure 2에 상세히 제시되어 있다.

Figure 2

Structure of DCGAN Composed of Generator and Discriminator Networks

반면, Discriminator는 입력된 이미지(64×64×3)가 실제 데이터인지, Generator가 생성한 가짜 데이터인지를 판별하는 역할을 한다. 입력된 이미지가 64×64×3 크기의 RGB 데이터일 때, 이를 점진적으로 다운 샘플링하며 특징을 추출하는 CNN 기반 구조를 가진다. Generator의 역순의 순서로 컨볼루션 연산을 적용하여 점진적으로 공간 크기를 축소하면서 특징을 추출한다. Discriminator는 일반적인 CNN과 달리 MaxPooling을 사용하지 않고 Strided Convolution을 활용하여 다운 샘플링을 수행하며 특징을 효과적으로 추출할 수 있도록 한다. 활성화 함수로는 일반적인 ReLU 대신 Leaky ReLU를 사용하여 기울기 소실 문제를 완화하고, 작은 음수 값을 허용하여 더욱 안정적인 학습이 가능하도록 한다. 마지막 Fully Connected 레이어에서는 입력 이미지가 실제일 확률을 출력하는 1차원 스칼라 값을 생성하며, 최종 활성화 함수로 시그모이드(Sigmoid)를 적용하여 결과값이 [0,1] 범위에 있도록 조정된다.

DCGAN의 손실 함수는 Generator와 Discriminator로 구분되어 정의된다. Generator의 손실 함수는 식 (1)과 같다. 여기서 G(z)는 Generator가 입력 노이즈 z로부터 생성한 샘플이며, D(G(z))는 Discriminator가 해당 샘플을 실제 데이터로 판별할 확률을 의미한다. Generator는 학습을 통해 Discriminator를 속일 확률을 최대화하는 방향으로 업데이트된다. 한편, Discriminator의 손실 함수는 식 (2)와 같다. 여기서 x는 실제 데이터셋에서 샘플링된 데이터이며, D(x)는 Discriminator가 해당 데이터를 실제 데이터로 분류할 확률을 의미한다. Discriminator는 실제 데이터를 1로, 생성된 데이터를 0으로 올바르게 분류하도록 학습된다.

(1) LG=-Ez~pz[logD(G(z))]
(2) LD=-Ex~pdata[log D(x)]-Ez~pz[log(1-D(G(z)))]

본 연구에서는 WM 811K 데이터셋을 활용하여 반도체 웨이퍼 결함 이미지를 생성하기 위해 DCGAN을 적용하고, 생성된 보조 데이터를 OE 프레임워크에 통합함으로써 OOD 탐지 성능을 향상시키는 것을 목표로 한다. 생성된 보조 데이터는 반도체 제조 공정에서 나타나는 다양한 결함 패턴을 포괄적으로 학습할 수 있도록 지원하며, 기존의 정형화된 데이터셋을 활용한 방법보다 도메인의 고유한 특성을 보다 세밀하게 반영할 수 있다. 이는 모델이 실제 제조 환경에서 발생하는 다양한 이상 데이터를 효과적으로 구분할 수 있게 하여 이상 탐지 성능 개선에 기여할 수 있다. 즉, 본 연구는 WM 811K 데이터셋에서 DCGAN을 통한 결함 이미지 생성과 OE 기법을 결합하여, OOD 탐지의 정확도를 높이는 데 중점을 둔다.

3.2 OE를 통한 OOD 탐지

OE는 Hendrycks와 Gimpel(2019)에 의해 처음 제안된 방법론으로, 보조 데이터셋을 활용하여 모델의 일반화 성능을 향상시키는 것을 목표로 한다. 이 접근 방식은 모델이 훈련 데이터와 분포가 다른 데이터를 인식하고, 해당 데이터를 보다 효과적으로 처리할 수 있도록 유도한다. OE 기법은 모델이 단순히 정상 데이터(In-Distribution 데이터)에만 최적화되는 것을 방지하고, 다양한 비정상 데이터(보조 데이터)를 학습할 수 있도록 도와줌으로써 OOD 탐지 성능을 개선하는 데 기여한다. OE의 학습 과정에서 사용되는 손실 함수는 모델이 In-Distribution 데이터뿐만 아니라 보조 데이터에도 적절히 반응하도록 설계되어 있다. OE 기법의 손실 함수는 식 (3)과 같이 정의된다.

(3) E(x,y)~Din[L(f(x),y)]+λEx~DoutOE[LOE(f(x),f(x),y)]

이 수식에서 첫 번째 항 Din [L(f(x),y]은 In-Distribution 데이터셋에서의 학습 손실을 나타낸다. 모델 f가 입력 x에 대해 올바른 레이블 y를 예측하는지를 평가하며, 일반적으로 크로스 엔트로피 손실을 사용하여 모델이 주어진 학습 데이터에 적합하도록 조정된다. 두 번째 항 λEx'~DoutOELOE(fx',f(x),y)은 보조 데이터셋에 대한 손실을 의미하며, 모델이 OOD 데이터를 In-Distribution 데이터와 명확히 구분하도록 하는 역할을 한다. 이때 x' ~ DoutOE는 보조 데이터에서 샘플링된 입력을 나타내며, LOE는 해당 데이터와 In-Distribution 데이터 간의 분포적 차이를 최소화하거나 특정한 분리 조건을 만족하도록 조정되는 손실 함수이다. 특히, 보조 데이터에 대한 손실 LOE는 OOD 데이터를 더 잘 탐지하기 위해 설계된다. 예를 들어, 보조 데이터를 In-Distribution과 구별하도록 모델의 예측 확률을 낮게 유지하거나, 특정 확률 임계값을 초과하지 않도록 하는 방식으로 정의될 수 있다. 이는 모델이 OOD 데이터를 In-Distribution 데이터로 잘못 분류하지 않도록 학습을 유도한다.

본 연구에서는 DCGAN으로 생성한 보조 데이터에 대해 OE 손실 외에도, Generator 학습 시 사용되는 GAN loss를 추가 손실 항으로 함께 반영하였다. GAN loss는 생성된 데이터가 In-Distribution 데이터와 구별되도록하며, 모델이 다양한 OOD 패턴을 학습할 수 있도록 돕는다. 다만, 이러한 효과에도 불구하고 DCGAN 기반 이미지 생성 과정에서는 데이터 품질 저하(예: 노이즈)와 훈련 불안정성 문제가 발생할 수 있다. 이를 보완하기 위해 생성된 데이터의 품질을 사전에 확인하고, OE 손실과의 결합을 통해 모델 학습을 강화하였다.

4. 실험 결과 및 분석

4.1 실험 환경

본 연구에서는 WM 811K 데이터셋과 CIFAR-100 데이터셋을 활용하여 실험을 수행하였다. WM 811K 데이터셋은 Wu et al.(2015)에 의해 제공된 대규모 웨이퍼 맵 데이터셋을 기반으로 한다. 실험 사용된 WM 811K 데이터셋은 Table 1에 제시되어 있으며 데이터셋 설정은 다음과 같다. In-Distribution 데이터로는 클래스 2, 4를, OOD 데이터로는 클래스 0을, 보조 데이터셋은 클래스 1, 3, 5, 6, 7을 DCGAN 학습하여 새로 생성한 데이터로 설정한 후 실험을 진행하였다. 이는 데이터셋의 클래스별 패턴 특성과 데이터 갯수에 기반하여 설정한 것으로 In-Distribution 데이터는 비교적 국소적인 결함 패턴(Edge_Loc, Loc)의 데이터를, 보조 데이터는 넓게 분포하거나 복잡한 패턴(Donut, Edge_Ring, Random, Scratch, Near_Full)의 서로 상이한 패턴의 클래스를 설정하여 OOD탐지 성능 강화에 기여한다. CIFAR-100 데이터셋에서는 동일한 방식으로 데이터셋의 클래스를 분리하여 각각 In-Distribution 데이터와 보조 데이터, OOD 데이터로 사용하였다. CIFAR-100 데이터셋의 클래스 구분은 부록의 Table 5에서 확인할 수 있다.

Sample count per class in the WM 811K dataset.

OOD 탐지 성능 평가는 FPR95(False Positive Rate at 95% True Positive Rate), AUROC(Area Under the Receiver Operating Characteristic), AUPR(Area Under the Precision-Recall) 지표를 활용하여 모델의 탐지 성능을 정량적으로 분석하였다. FPR95는 TPR(True Positive Rate)이 95%일 때의 FPR(거짓양성 비율, False Positive Rate)을 의미하며 값이 낮을수록 OOD 탐지 성능이 우수함을 나타낸다. AUROC는 FPR과 TPR 간의 관계를 나타내는 ROC 곡선의 면적으로 1에 가까울수록 모델의 전반적인 분류 성능이 뛰어남을 의미한다. AUPR은 Precision-Recall(PR) 곡선 아래 면적을 측정하는 지표로 데이터 불균형이 심한 환경에서 OOD 샘플을 얼마나 효과적으로 구별하는지를 평가하는 데 있어 유용하다. AUROC와 AUPR 지표의 시각적 표현은 Figure 3에서 확인할 수 있다.

Figure 3

Performance Evaluation Curves: AUROC and AUPR

4.2 OE 실험 결과

WM 811K 데이터셋에서 OE와 OE+DCGAN의 성능을 비교한 결과는 Table 2에 요약되어 있다. OE만을 사용한 경우 FPR95는 50.1%였으며 AUROC는 50.6%, AUPR는 76.3%로 나타났다. 그러나 DCGAN으로 생성된 보조 데이터를 활용한 OE+DCGAN 방법은 더욱 향상된 성능을 보여준다. FPR95는 40.8%로 감소하였으며 AUROC와 AUPR은 각각 63.3%와 80.7%로 증가하였다. 비슷한 경향은 CIFAR-100 데이터셋에서도 관찰되었다. OE를 적용한 경우 FPR95는 65.2%, AUROC는 70.2%, AUPR은 25.7%를 기록하였으나 DCGAN을 활용한 OE+DCGAN 방법에서는 FPR95가 55.1%로 감소하고 AUROC와 AUPR이 각각 82.9%와 32.8%로 증가하였다.

Comparison of OOD detection methods with WM 811K and CIFAR-100

이러한 결과는 DCGAN 기반의 데이터 생성이 단순한 데이터 추가 이상의 역할을 한다는 점을 시사한다. WM 811K 데이터셋과 같은 특수한 도메인에서는 실제 제조 공정에서 발생할 가능성이 있는 다양한 결함 패턴을 생성하여 OOD 탐지 모델의 성능을 향상시키며 CIFAR-100과 같은 일반적인 데이터셋에서도 보조 데이터를 다양화함으로써 OOD 탐지 성능을 개선할 수 있다. 이는 DCGAN이 제조 환경뿐만 아니라 다양한 데이터셋에서 OOD 탐지 문제를 해결하는 데 유용한 도구로 활용될 수 있음을 의미한다.

또한, Table 2에서는 MSP(Maximum Softmax Probability) 기법과의 비교 결과도 확인할 수 있다. MSP 기법은 분류 모델의 소프트맥스 출력에서 가장 큰 확률 값을 기준으로 데이터가 In-Distribution인지 OOD인지를 구분하는 간단한 방법이다. 구체적으로 모델이 입력 데이터에 대해 여러 클래스의 확률을 산출할 때 가장 높은 확률을 선택하여 이 값이 미리 정해진 임계값보다 높으면 In-Distribution 데이터로, 낮으면 OOD 데이터로 판단하여 OOD 탐지를 수행한다.

본 연구에서 MSP 방식은 Baseline 실험으로 수행되었으며 실험에 사용된 데이터는 클래스 2, 4를 In-Distribution 데이터로 클래스 0을 OOD 데이터로 앞선 실험과 동일하게 설정하였다. WM 811K 데이터셋에서 MSP를 적용한 결과 FPR95는 59.6%, AUROC는 43.1%, AUPR은 28.7%로 나타났다. 또한 CIFAR-100 데이터셋에 적용한 결과는 FPR95는 71.5%, AUROC는 60.1%, AUPR은 21.3%로 나타났다. 이는 MSP가 In-Distribution과 OOD 간의 분포 차이를 명확하게 학습하기 어렵다는 점을 보여주며 특히 복잡한 도메인 특화 데이터에서는 성능 한계를 보인다는 점을 시사한다. 특히, AUROC 값이 무작위 추측(50%)보다는 높은 수준이지만 FPR95가 높은 동시에 AUPR이 낮다는 점은 MSP가 In-Distribution과 OOD 간의 경계를 명확하게 구분하지 못했음을 의미한다. 즉, MSP는 Baseline 기법으로서 의미가 있지만 기존 OE 및 OE+DCGAN과 같은 보다 정교한 방법과 비교할 때 성능 차이가 명확하게 드러난다.

이와 비교하여 OE+DCGAN 방법은 MSP 대비 OOD 탐지 성능에서 큰 개선을 이루었다. 동일한 실험 조건에서 OE+DCGAN은 FPR95를 40.8%까지 낮추었으며 AUROC와 AUPR는 각각 63.3%와 80.7%로 모든 지표에서 성능이 향상됨을 확인할 수 있었다. 이는 DCGAN을 활용한 보조 데이터 생성이 단순한 소프트맥스 기반 기법보다 더욱 효과적인 대안이 될 수 있음을 보여준다. 특히, WM 811K와 같은 도메인 특화 데이터에서도 OOD 탐지 성능을 효과적으로 개선할 수 있음을 입증하며 본 연구에서 제안한 기법의 신뢰성을 강화한다.

4.3 DCGAN 생성 데이터 품질의 변화와 OE 성능에 미치는 영향

이번 실험에서는 DCGAN을 활용하여 WM 811K 데이터셋에서 결함 이미지를 생성하고, 이를 OE 기법의 보조 데이터로 활용하여 OOD 탐지 성능을 개선하는 실험을 수행하였다. 이때 DCGAN으로 생성된 데이터의 품질은 학습 에폭의 진행에 따라 다르게 나타날 수 있으며 이는 모델이 학습 과정에서 점진적으로 개선되면서 보다 사실적인 결함 이미지를 생성할 수 있음을 의미한다. 따라서 DCGAN 학습 과정에서 생성된 이미지의 품질이 OE 기법의 성능에 미치는 영향을 분석하기 위해 각 에폭 별로 생성된 데이터를 활용하여 OE 모델을 학습하고 OOD 탐지 성능을 비교하였다.

Table 3은 DCGAN 학습 에폭 수에 따른 OE 기법의 OOD 탐지 성능 비교 결과를 나타낸다. 실험 결과, DCGAN을 550 에폭 동안 학습했을 때 FPR95가 가장 낮고(40.8%), AUROC(63.3%)와 AUPR(80.7%)가 최고치를 기록하며 가장 우수한 OOD 탐지 성능을 보였다. 반면 100 에폭과 700 에폭에서는 AUROC가 낮아지고 FPR95가 증가하는 경향을 보이며 300 에폭에서는 일부 성능이 개선되었으나 최적 성능에는 미치지 못했다. 이를 통해 DCGAN 학습이 충분히 진행되지 않거나 과도하게 진행될 경우 OOD 탐지 성능이 저하될 수 있음을 확인할 수 있다.

DCGAN Epoch-wise OE Results Comparison

Figure 4는 DCGAN 학습 에폭에 따른 생성된 결함 이미지를 비교한 결과를 보여준다. 100 에폭에서는 흐릿하고 결함 패턴이 거의 보이지 않으며 300 에폭에서는 일부 패턴이 나타나지만 여전히 노이즈가 많아 원본과 차이가 크다. 550 에폭에서는 가장 선명한 결함 패턴이 생성되었으며 원본 데이터와 유사한 구조를 형성하여 최적의 품질을 보였다. 그러나 700 에폭에서는 과적합으로 인해 심한 노이즈가 발생하며 결함 패턴이 사라지는 현상이 관찰되었다. 에폭 설정에 대한 세부적인 추가 실험 결과는 Table 4에 제시되어 있으며, 이를 바탕으로 본 연구에서는 DCGAN 학습 과정에서 생성된 데이터의 품질이 OOD 탐지 성능에 미치는 영향을 고려하여 최적의 학습 에폭을 550으로 설정하게 되었음을 밝힌다.

Figure 4

Progression of DCGAN-Generated Defect Images Across Training Epochs

Detailed Performance Analysis of DCGAN Training Epochs (500–600)

4.4 실험분석

실험 결과, DCGAN을 활용한 OE 기법이 기존 OE 및 MSP 방식보다 우수한 성능을 보였다. WM 811K 데이터셋에서는 DCGAN이 생성한 보조 데이터가 반도체 제조 공정의 결함 패턴을 효과적으로 반영하여 FPR95를 감소시키고 AUROC와 AUPR을 향상시켰다. 이는 모델이 OOD 데이터를 보다 정확히 탐지할 수 있도록 학습되었음을 의미한다. CIFAR-100 데이터셋에서도 DCGAN 기반 접근법은 MSP 대비 성능 향상을 보였다. MSP는 단순히 모델의 출력 확률을 기준으로 OOD 여부를 판단하지만 DCGAN 기반 보조 데이터는 모델이 다양한 OOD 샘플을 경험하며 구조적 특징을 학습할 수 있도록 기여한 것으로 분석된다. 이를 통해 DCGAN이 단순한 데이터 증강을 넘어, OOD 탐지 모델의 일반화 성능을 높이는 데 기여할 수 있음을 확인하였다. DCGAN을 활용한 보조 데이터 생성 기법은 특정 도메인에 최적화된 데이터셋을 구축할 수 있으며 이는 제조 공정에서의 품질 관리 및 조기 결함 탐지를 위한 실용적인 해결책이 될 수 있음을 시사한다.

5. 결 론

본 연구는 DCGAN을 활용하여 반도체 제조 공정 데이터(WM 811K)에서 결함 이미지를 생성하고, 이를 OE 기법의 보조 데이터셋으로 활용하여 OOD탐지 성능을 향상시키는 방법을 제안하였다. 실험 결과, DCGAN 기반 OE 기법은 WM 811K에서는 기존 OE 대비 FPR95를 9.3% 감소시키고 AUROC와 AUPR을 각각 12.7%, 4.4% 향상시켰으며 CIFAR-100에서는 FPR95를 10.1% 감소, AUROC와 AUPR을 각각 12.7%, 7.1% 향상시키며 OOD 탐지 성능을 개선함을 확인하였다. 또한, CIFAR-100 데이터셋에서도 기존 MSP 방식보다 우수한 성능을 보이며 제안된 기법의 일반화 가능성을 입증하였다. 본 연구의 주요 기여는 다음과 같다. 첫째, 제조 공정의 특성을 반영한 결함 데이터 생성을 통해 OOD 탐지 성능을 개선하고 품질 불량률을 낮출 수 있음을 보였다. 둘째, 기존에 수집이 어려운 결함 데이터를 가상으로 생성하여 데이터 부족 문제를 해결하고 품질 관리 시스템의 데이터 활용도를 높였다. 셋째, OOD 탐지 기법을 품질 관리와 접목함으로써 실시간 모니터링 및 조기 결함 탐지 가능성을 제시하였다.

향후 연구 과제로는 먼저 DCGAN 외에도 VQ-VAE, StyleGAN 등 다양한 생성 모델을 적용하여 보조 데이터의 다양성과 품질을 더욱 향상시킬 필요가 있다. StyleGAN은 고해상도 이미지 생성이 가능하여 복잡한 결함 패턴의 세밀한 표현에 유리하며, VQ-VAE는 안정적인 훈련과 연속적인 잠재 공간 표현을 통해 다양한 결함 변형 생성에 기여할 수 있다는 점에서 본 연구의 DCGAN 접근법을 보완할 수 있을 것으로 기대된다. 또한 본 연구에서는 생성된 합성 결함 데이터의 품질을 OOD 탐지 성능으로만 평가하였으나, 향후 연구에서는 FID(Frechet Inception Distance), IS(Inception Score) 등의 이미지 품질 정량적 지표를 통한 생성 결함 데이터의 품질 평가가 이루어져야 할 것이다. 더불어 제안된 기법의 실시간 모니터링 및 조기 경보 시스템과의 통합, 그리고 모델의 해석 가능성과 신뢰성 향상을 위한 추가 연구를 통해 반도체 제조뿐만 아니라 의료 영상, 자율 주행, 산업 품질 검사 등 다양한 분야에 적용 가능한 범용적인 OOD 탐지 솔루션을 개발하는 방향으로 확장이 기대된다.

References

Cao S, Zhang Z. 2022. Deep Hybrid Models for Out-of-Distribution Detection. In : IEEE/CVF Conference on Computer Vision and Pattern Recognition. p. 4733–4743.
Chen Y-L, Sacchi S, Dey B, Blanco V, Halder S, Leray P, De Gendt S. 2024;Exploring Machine Learning for Semiconductor Process Optimization: A Systematic Review. IEEE Transactions on Artificial Intelligence
Du X, Sun Y, Zhu X, Li Y. 2023;Dream the Impossible: Outlier Imagination with Diffusion Models. Advances in Neural Information Processing Systems 36:60878–60901.
Goodfellow I, Pouget-Abadie J, Mirza M, Xu B, Warde-Farley D, Ozair S, Courville A, Bengio Y. 2014;Generative Adversarial Nets. Advances in Neural Information Processing Systems :27.
Ha J, Lee S, Kim D, Choi J. 2025;A Case Study of Graph Neural Network-Based Anomaly Detection and Root Cause Visualization for Quality Improvement in Semiconductor Manufacturing. Journal of Korean Society for Quality Management 53(2):237–248.
Hein M, Andriushchenko M, Bitterwolf J. 2019. Why ReLU Networks Yield High-Confidence Predictions Far Away from the Training Data and How to Mitigate the Problem. In : IEEE/CVF Conference on Computer Vision and Pattern Recognition. p. 41–50.
Hendrycks D, Gimpel K. 2017. A Baseline for Detecting Misclassified and Out-of-Distribution Examples in Neural Networks. In : International Conference on Learning Representations (ICLR).
Hendrycks D, Mazeika M, Dietterich T. 2019. Deep Anomaly Detection with Outlier Exposure. In : International Conference on Learning Representations.
Jeong H, Kim H-J. 2023;A Dynamic Correction Technique of Time-Series Data using Anomaly Detection Model based on LSTM-GAN. The Journal of The Institute of Internet, Broadcasting and Communication 23(2):103–111.
Jeong J, Jung Y. 2022;Wafer Bin Map Failure Pattern Recognition Using Hierarchical Clustering. The Korean Journal of Applied Statistics 35(3):407–419.
Kang S-H, Chow W-D. 2022. A Study of GAN-based Data Augmentation Technique on Acceleration Data Generation Korea Society of Computer and Information. p. 495–497.
Karras T, Laine S, Aittala M, Hellsten J, Lehtinen J, Aila T. 2020. Analyzing and Improving the Image Quality of StyleGAN. In : IEEE/CVF Conference on Computer Vision and Pattern Recognition. p. 8110–8119.
Khan SS, Madden MG. 2014;One-Class Classification: Taxonomy of Study and Review of Techniques. The Knowledge Engineering Review 29(3):345–374.
Kim Y, Song H, Shin W. 2025;Analysis of Machine Learning Research Patterns from a Quality Management Perspective. Journal of Korean Society for Quality Management 52(1):77–93.
Kwon G, Kim J, Choi H, Yoon B, Choi S, Jung K. 2023. Improving Out-of-Distribution Detection Performance using Synthetic Outlier Exposure Generated by Visual Foundation Models. In : British Machine Vision Conference. p. 10–11.
Lee K, Lee H, Lee K, Shin J. 2018;A Simple Unified Framework for Detecting Out-of-Distribution Samples and Adversarial Attacks. Advances in Neural Information Processing Systems :31.
Lee S, Sim J, Choi J. 2023;A Case Study on Quality Improvement of Electric Vehicle Hairpin Winding Motor Using Deep Learning AI Solution. Journal of the Korean Society for Quality Management 51(2):283–296.
Li Z, Sun C, Liu C, Chen X, Wang M, Liu Y. 2020;RCC-Dual-GAN: An Efficient Approach for Outlier Detection with Few Identified Anomalies. arXiv preprint arXiv:2003.03609
Liang S, Li Y, Srikant R. 2018. Enhancing the Reliability of Out-of-Distribution Image Detection in Neural Networks. In : Proceedings of the International Conference on Learning Representations.
Liu W, Wang X, Owens JD, Li Y. 2020;Energy-based Out-of-distribution Detection. Advances in Neural Information Processing Systems 33:21464–21475.
Miyato T, Kataoka T, Koyama M, Yoshida Y. 2018. Spectral Normalization for Generative Adversarial Networks. In : International Conference on Learning Representations.
Park S, Mok J, Jung D, Lee S, Yoon S. 2023;On the Powerfulness of Textual Outlier Exposure for Visual OoD Detection. Advances in Neural Information Processing Systems 36:51675–51687.
Radford A, Metz L, Chintala S. 2016. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks. In : International Conference on Learning Representations.
Thottolil R, Kumar U, Chakraborty T. 2023;Prediction of Transportation Index for Urban Patterns in Small and Medium-sized Indian Cities Using Hybrid RidgeGAN Model. Scientific Reports 13(1):21863.
Wu Ming-Ju, Jang Jyh-Shing R, Chen Jui-Long. 2015;Wafer Map Failure Pattern Recognition and Similarity Ranking for Large-Scale Data Sets. IEEE Transactions on Semiconductor Manufacturing 28(1):1–12.
Zhao T, Ye R, Yang Q, Liu Y, Li L, Zheng Z, Sun L. 2023;ChatGPT is Not All You Need: A State of the Art Review of Large Generative AI Models. arXiv preprint arXiv:2301.04655

Appendices

부 록
부 록

Class Distribution Setting for CIFAR-100 Experimental Dataset

Article information Continued

Figure 1

OOD Detection Framework with DCGAN and OE

Figure 2

Structure of DCGAN Composed of Generator and Discriminator Networks

Figure 3

Performance Evaluation Curves: AUROC and AUPR

Figure 4

Progression of DCGAN-Generated Defect Images Across Training Epochs

Table 1

Sample count per class in the WM 811K dataset.

Class name Train Test
Center (class 0) 3,462 832
Donut (class 1) 409 146
Edge_loc (class 2) 2,417 2,772
Edge_ring (class 3) 8,554 1,126
Loc (class 4) 1,620 1,973
Random (class 5) 609 257
Scratch (class 6) 500 693
Near_full (class 7) 54 95
Total 17,625 7,894

Table 2

Comparison of OOD detection methods with WM 811K and CIFAR-100

Dataset Method FPR95 (↓) AUROC(↑) AUPR(↑)
WM 811K MSP 59.6 43.1 28.7
OE 50.1 50.6 76.3
OE + DCGAN 40.8 63.3 80.7
CIFAR-100 MSP 71.5 60.1 21.3
OE 65.2 70.2 25.7
OE + DCGAN 55.1 82.9 32.8

Table 3

DCGAN Epoch-wise OE Results Comparison

Epochs FPR95(↓) AUROC(↑) AUPR(↑)
100 100 13.2 64
300 77.21 36.1 70.3
550 40.8 63.3 80.7
700 89 13.1 73.5

Table 4

Detailed Performance Analysis of DCGAN Training Epochs (500–600)

Epochs FPR95(↓) AUROC(↑) AUPR(↑)
500 47.2 58.1 78.4
510 44.8 60.5 79.1
520 42.1 61.8 79.8
530 41.5 62.4 80.2
540 41.0 62.9 80.5
550 40.8 63.3 80.7
560 41.2 62.8 80.4
570 41.8 62.1 79.9
580 42.5 61.4 79.2
590 58.8 55.2 75.1
600 60.1 53.8 73.5

Class Distribution Setting for CIFAR-100 Experimental Dataset

Type Super Class Sub Class
In-Distribution Aquatic Mammals Beaver, Dolphin, Otter, Seal, Whale
Fish Aquarium Fish, Flatfish, Ray, Shark, Trout
Flower Orchids, Poppies, Roses, Sunflowers, Tulips
Large Natural Outdoor Scenes Cloud, Forest, Mountain, Plain, Sea
Large Omnivores and Herbivores Camel, Cattle, Chimpanzee, Elephant, Kangaroo
Trees Maple, Oak, Palm, Pine, Willow
Reptiles Crocodile, Dinosaur, Lizard, Snake, Turtle
Small Mammals Hamster, Mouse, Rabbit, Shrew, Squirrel
Medium-Sized Mammals Fox, Porcupine, Possum, Raccoon, Skunk
Auxiliary Household Furniture Bed, Chair, Couch, Table, Wardrobe
Household Electrical Devices Clock, Computer Keyboard, Lamp, Telephone, Television
Insects Bee, Beetle, Butterfly, Caterpillar, Cockroach
Vehicles 1 Bicycle, Bus, Motorcycle, Pickup Truck, Train
Fruit and Vegetables Apples, Mushrooms, Oranges, Pears, Sweet Peppers
OOD Large Man-Made Outdoor Things Bridge, Castle, House, Road, Skyscraper
People Baby, Boy, Girl, Man, Woman
Non-Insect Invertebrates Crab, Lobster, Snail, Spider, Worm
Large Carnivores Bear, Leopard, Lion, Tiger, Wolf
Food Containers Bottle, Bowl, Can, Cup, Plate
Vehicles 2 Streetcar, Tank, Tractor, Lawn-Mower, Rocket