글: 스티브 자멕, 존 홀트, 샌디 첸
2026년 APEC(세션 IS02.1: AI 및 디지털 트윈이 주도하는 전력 소자 혁신)에서 우리 팀은 전력 반도체 제조업체들과 10년 넘게 쌓아온 경험을 바탕으로, 실제 생산 현장에 도입된 두 가지 AI/ML 활용 사례를 발표했습니다. 이 글에서는 그 핵심 교훈을 정리해 보았습니다.
이 블로그 게시물과 프레젠테이션은 반도체 및 전력 반도체 제조 분야에 AI/ML을 도입하는 실용적인 접근법에 대해 이 팀이 발표한 일련의 자료 중 일부입니다:
파워 반도체는 왜 다른가?
AI를 활용한 수율 개선은 로직 및 메모리 제조 분야에서 이미 충분히 연구되어 왔다. 그러나 전력 반도체(SiC, GaN, IGBT, 디스크리트 실리콘)는 그 자체로 독특한 난제를 안고 있다. 사용되는 소재의 종류가 더 다양하고, 결함 발생률이 더 높으며, 제조 공정은 더 높은 수준의 수직 통합을 요구합니다. 즉, 실리콘 잉곳 성장, 기판 등급 분류, 에피택시, 여러 단계의 번인(burn-in) 공정, 다이 부착, 모듈 조립 등이 포함됩니다. 또한 제조 시설은 일반적으로 노후화되어 있으며, 성숙한 실리콘 팹들이 수년 전에 대부분 해결했던 추적성 및 데이터 품질 측면에서 아직 미흡한 상태입니다.
Yole의 ‘2025년 전력 전자 산업’ 보고서에 소개된 기업 중 11곳이 10년 이상 Exensio를 꾸준히 사용해 온 고객사입니다. APEC에서 발표한 두 가지 활용 사례는 이러한 도입 사례를 통해 우리가 얻은 통찰력을 반영한 것입니다.

사용 사례 1: SiC의 기판 제한 수율
문제점
기판의 품질은 SiC 제조 과정에서 수율 저하의 주요 원인 중 하나입니다. 문제는 다음과 같습니다. 어떤 기판이 수율을 저해할지 예측하고, 비용이 많이 드는 후속 공정을 진행하기 전에 그 예측에 따라 조치를 취할 수 있을까요?
접근 방식
킬 결함을 식별하는 기존의 방법은 킬 비율(Kill Ratio) 지표를 활용하는데, 이는 2×2 혼동 행렬을 사용하여 “결함 없는” 다이와 “결함이 있는” 다이의 수율을 비교하는 방식입니다. 이 방법은 각 결함 분류에 대한 다이 수준의 요약 정보를 기반으로 합니다. 실리콘 기판 자체는 결함이 거의 없으며, 대부분의 관심은 팹(fab)이나 파운드리(foundry) 공정에서 발생하는 인라인 결함에 집중됩니다.
복합 반도체의 경우 상황은 더 복잡합니다. 여러 검사 단계와 베어 기판(에피타키시 전후), 그리고 패터닝된 웨이퍼(인라인)를 아우르는 작업을 수행하게 됩니다. 패턴이 형성되지 않은 기판의 다이 그리드가 정의되어 있지 않기 때문에 다이 수준 요약은 적합하지 않습니다. 또한 전기적 웨이퍼 선별만으로 다이의 양호/불량 여부를 판단하는 것만으로는 불충분합니다. 전력 소자는 고유한 부하 조건 하에서 고전류·고전압 테스트를 필요로 하는데, 이는 웨이퍼 선별 단계에서는 종종 구현할 수 없습니다.
당사의 접근 방식은 베어 기판 및 에피택셜 결함 데이터를 활용하여 예측 모델을 훈련시킵니다. 이 모델은 전기적 테스트에 앞서 예상 합격/불합격 결과를 다이(die) 및 웨이퍼(wafer) 단위로 분류한 예측 전기적 빈 맵을 생성합니다 . 이를 통해 작업자는 기판을 본격적인 제조 공정에 투입하기 전에 등급을 매길 수 있습니다. 또한, 이러한 예측은 모든 가상 다이 크기에 대해 수행될 수 있어, 사용자가 다양한 다이 크기를 시험해 보며 수율을 추정할 수 있게 해줍니다.

결과
아래에서 논의할 결과는 여러 공급업체의 실리콘 카바이드(SiC) 기판을 사용한 경험을 바탕으로 한 것입니다. 그럼에도 불구하고, 이러한 접근 방식은 SiC에 국한되지 않고 다른 유형의 반도체에도 적용될 수 있습니다. 실제 생산 환경에서는 다음 모델이 적용됩니다:
- SiC 결함 제거 메커니즘에 관한 기존 문헌과 일치하는, 수율 제한 요인을 정확하게 규명한다
- 상류 공정에서 기판 처분 결정을 가능하게 함으로써 수율 손실을 몇 퍼센트 포인트 절감합니다
- 모델의 동작을 해석 가능하고 검증 가능하게 만드는 실제 값, 예측 값, 차이의 빈 맵을 생성합니다
또한 이 모델은 각 결함 유형에 대해 네 가지 분류 범주를 제시합니다:
- TP (진양성): 실제 합격, 예측 합격 — 올바른 판정
- TN (진양성): 실제 실패, 예측 실패 — 올바른 판정
- FP (오탐지): 실제 실패, 예측 통과 — 과소 탐지, 수율 저하 요인
- FN (위음성): 실제로는 합격했으나 불합격으로 판정됨 — 과도한 조치, 비용 부담
제작상의 어려움
시범 운영 단계에서 본격적인 운영 단계로 넘어가면서 다양한 어려움이 드러났다.
검사: 동일한 기판이라도 로트나 재료 흐름에 따라 서로 다른 검사 장비에서 측정될 수 있습니다. 장비마다 결함 분류 체계가 다르기 때문에, 표준화하지 않으면 결함 수치를 직접 비교할 수 없습니다. 검사 레시피는 아직 완전히 정립되지 않았으며 지속적으로 수정되고 있습니다.
공간적 정렬: 베어 기판에 대한 광학 검사는 웨이퍼 전체 좌표계를 사용합니다. 이 좌표계는 다이 좌표계와 정확하게 정렬되어야 합니다. 많은 구형 팹에서는 웨이퍼 전체 좌표와 다이 좌표 간에 적절한 정렬이 이루어지지 않습니다. 게다가 비정방 격자 반도체(예: SiC)의 결함은 크기가 크고 하나의 다이 이상을 덮을 수 있습니다. 그러나 검사 스캔 데이터만으로는 이러한 결함의 공간적 범위를 파악하기에 정보가 부족합니다.
프로브 + 번인(Burn-In): 데이터 품질 저하는 만연한 문제입니다. 방향 오류, 검사 좌표와 테스트 좌표 간의 다이 오프셋, 일관성 없는 다이 ID 규칙 등으로 인해 공간적 정렬이 결코 쉬운 일이 아닙니다. 따라서 의미 있는 모델을 구축하기 전에 데이터 정제 및 검증이 필수적입니다.
모듈 + 번인(Burn-In): 많은 제조업체들이 칩(die)의 종단 간 추적성 문제로 어려움을 겪고 있습니다. 기판 단계에서의 선별 및 등급 분류로 인해, 에피타키셜(epi) 공정 후의 팹 로트는 에피타키셜 공정 전의 로트 구성과 완전히 다르게 보일 수 있습니다. 웨이퍼 분류 단계에 이르면, 한 로트에 포함된 거의 모든 웨이퍼가 서로 다른 에피타키셜 전(pre-epi) 소재 로트에서 유래했을 수 있습니다. 모듈 조립 단계에서는 하위 조립체 전반에 걸쳐 개별 칩을 추적하게 됩니다.
누락된 데이터: 추가적인 편향 위험을 초래합니다. 검사 데이터가 누락된 기록을 단순히 제거하는 경우, 이는 무작위적인 제거가 아닙니다. 특정 공구 유형, 시간대 또는 재료 등급의 기록을 제거할 가능성이 더 높으며, 이는 훈련 집합에 체계적인 편향을 초래합니다. 예를 들어, 누락된 데이터는 조립 과정에서 불량 칩을 제거하는 과정에서 발생하는 경우가 많습니다. 이러한 칩을 제거한다는 것은 불량 칩의 상당 부분을 제거하는 것을 의미하므로, 결과적으로 지나치게 낙관적인 모델(일명 “언더킬”)이 생성됩니다.
사용 사례 2: 조립을 위한 예측형 다이 비닝
문제점
자동차 구동 인버터와 같은 파워 모듈은 여러 웨이퍼에서 나온 다수의 다이, 종종 여러 제품 및 여러 공급업체의 부품을 조립하여 만드는 매우 고가의 부품입니다. 불량 다이가 모듈에 조립되는 품질 관리 누락 사례는 막대한 비용을 초래합니다. 문제는: 웨이퍼 선별 데이터를 바탕으로 최종 테스트 결과를 예측할 수 있으며, 그 예측을 활용하여 조립 전 다이 배치를 최적화할 수 있는가?
이는 전력 반도체에만 국한된 문제가 아닙니다. 고성능 컴퓨팅 모듈(데이터센터용 MCM) 역시 동일한 과제에 직면해 있습니다. 두 경우 모두 모듈당 수십 개의 칩을 포함하고 있습니다. 두 경우 모두 모듈 고장으로 인한 비용이 해당 모듈 내 모든 칩의 조립 비용에 전가됩니다.

접근 방식
목표는 웨이퍼 분류 파라메트릭 데이터로 훈련된 이진 분류기 (모듈 최종 테스트 합격/불합격 판정)를 구축한 다음, 정확도가 아닌 최종 모듈 비용을 기준으로 분류 임계값을 최적화하는 것입니다.
왜 정확도가 아니라 비용일까요? 과소 대응과 과잉 대응의 비용 구조가 매우 비대칭적이기 때문입니다. 모듈 테스트에 불합격할 칩을 조립 라인으로 보내면 모듈 전체의 조립 비용, 즉 개별 칩 비용의 최대 50배에 달하는 비용이 낭비됩니다. 반면 정상 칩을 과잉 대응하여 폐기하더라도 낭비되는 비용은 해당 칩 자체의 비용($x)뿐입니다. 따라서 이러한 비대칭적 결과를 고려할 때, 총 기대 비용을 최소화하는 분류기가 최적의 분류기입니다.

현실 세계의 복잡성
이러한 유형의 솔루션을 실제 환경에 적용하는 것은 매우 복잡합니다:
- 불완전하거나 누락된 데이터: 양산 단계의 실제 빈 맵(bin map)과 파라메트릭 맵은 공간적으로 왜곡되거나, 테스트가 불완전하게 수행되거나, 데이터 변환 과정에서 손상될 수 있습니다. 이는 테스터와 프로버가 서로 다른 엔지니어링 부서에서 프로그래밍되기 때문입니다. 프로버의 역할은 웨이퍼 상의 올바른 다이에 정밀하게 위치하는 것인 반면, 테스터는 테스트 프로그램을 실행하는 데 중점을 둡니다. 그 결과, 테스터의 출력값에는 종종 잘못된 다이 크기, 좌표, 심지어 웨이퍼 방향 정보가 포함되기도 합니다.
- 여러 단계의 테스트: 웨이퍼 프로브, 웨이퍼 번인, 모듈 조립 테스트, 모듈 번인, 최종 테스트 등 각 단계마다 고유한 데이터 형식, 허용 오차 범위 및 분류 기준이 적용됩니다. 이로 인해 여러 가지 의문이 제기됩니다. ‘양품’과 ‘불량’ 다이의 기준은 무엇일까요? 테스트 결과 양품으로 판정되었으나, 공간적 이상치 선별(예: GDBN) 과정에서 잉크 처리되어 후속 테스트에 도달하지 못한 다이들은 어떻게 처리해야 할까요?
- 수십 개의 칩을 탑재한 모듈: 서로 다른 제품, 서로 다른 로트, 서로 다른 제조 공정마다 각각 고유한 예측 모델과 추적성 요구 사항이 필요합니다. 수십 개의 칩을 탑재한 모듈은 모델 훈련 규모를 기하급수적으로 증가시킵니다. 이러한 모델을 훈련하려면 많은 제조업체가 감당하기 어려운 수준의 컴퓨팅 인프라가 필요합니다.
- 다중 하위 조립: 부품들은 단계별 하위 조립 공정을 거치며, 한 단계에서 조립 및 테스트를 마친 부품은 더 높은 통합 단계의 다음 하위 조립을 위한 기초 재료가 됩니다. 이로 인해 다음과 같은 의문이 제기됩니다. 최적화의 목표는 무엇일까요? 각 하위 조립 단계마다 별도의 결정(분류)이 필요하지만, 궁극적인 목표는 모든 하위 조립 단계의 총 비용입니다. 하위 조립 단계의 수가 늘어날수록 복잡성은 급격히 증가합니다.
- 추적성 부족: 전력 반도체 제조 과정에서 웨이퍼부터 모듈에 이르는 다이(die)의 추적성을 확보하려면 별도의 공학적 노력이 필요하며, 이는 자동으로 이루어지지 않는다
당사의 생산 환경 구축 과정에서는 모델 훈련을 시작하기 전에 모든 제조 공정의 데이터가 일관성을 유지하고, 추적 가능성이 보장되며, 데이터 세트가 분석에 즉시 활용될 수 있도록 상당한 노력을 기울이고 있습니다. 그럼에도 불구하고 이러한 모델을 구축, 검증, 배포 및 유지 관리하는 일은 여전히 어려운 과제입니다.
데이터 인프라의 중요성
두 사용 사례 모두 근본적으로 동일한 과제를 지적하고 있습니다. 바로 데이터를 분석에 활용할 수 있는 상태로 만드는 것입니다. 여러 고객사에 따르면, 이러한 모델을 실제 운영 환경에서 성공적으로 활용하기 위해 필요한 엔지니어링 작업의 최대 90%가 데이터 전처리 및 검증 작업에 소요된다고 합니다.
파워 반도체 산업의 제조 데이터는 실제로 매우 분산되어 있습니다. 팹리스(fabless) 기업의 경우, 칩(dice)이 서로 다른 공급업체에서 공급받고, 각기 다른 OSAT 업체로 보내지기 때문에 이 모든 데이터를 단일 플랫폼에 통합하는 것은 막대한 작업이 됩니다. 자체 생산 시설을 갖춘 수직 통합형 반도체 제조업체(IDM)의 경우 이 작업이 더 쉬울 것이라고 생각할 수도 있습니다. 하지만 현실은 그렇지 않습니다. 데이터가 동일한 회사의 소유일지라도, MES, ERP, QMS, FDC, SPC 시스템 등 다양한 시스템과 여러 사업장에 분산되어 있으며, 종종 사업장마다 서로 다른 시스템을 사용하기도 합니다. 이러한 각 시스템은 고립된 정보 저장소(silo)가 되기 때문에, Exensio와 같은 수율 관리 플랫폼을 전사적으로 도입하는 것이 매우 중요해집니다.
이러한 도입 사례로 온세미(onsemi)를 살펴보겠습니다. 2025년 12월 PDF Solutions 사용자 컨퍼런스에서 온세미의 톰 그레인(Tom Grein)은 온세미가 실리콘 카바이드 분말부터 결정 성장, 에피택시, 소자 제조, 모듈 조립에 이르는 전체 SiC 제조 공정 전반에 걸쳐 Exensio를 단일 플랫폼이자 신뢰할 수 있는 데이터의 근원(single source of truth)으로 활용하는 방식을 발표했습니다. 이들의 계보 체인은 다음과 같이 추적됩니다: 불 성장 → 기판 → 에피택시 → 팹 웨이퍼 → 모듈. 이러한 종단간 데이터 인프라는 단순히 있으면 좋은 것이 아닙니다. 이는 본격적인 분석을 위한 필수 전제 조건입니다.
행동 촉구: 데이터를 AI 활용에 적합하게 준비하세요
전력 반도체 제조업체들과의 10년 이상의 생산 현장 도입 경험을 바탕으로, 성공적인 AI 전략의 기반을 마련하기 위해 필요한 요소는 다음과 같습니다:
- 제조업용 IT 인프라를 구축하십시오. 활용 가능한 형태로 존재하지 않는 데이터로는 AI 모델을 실행할 수 없습니다. 따라서 데이터 수집, 저장 및 접근 인프라에 대한 투자가 최우선 과제입니다.
- 데이터 사일로를 해소하십시오. 모든 제조 데이터, 자재, 공정 중 웨이퍼, 공정 중 장비, 조립 및 테스트 데이터를 단일 플랫폼에 통합하십시오. 결합할 수 없는 데이터는 모델링할 수 없는 데이터입니다.
- 데이터의 원본에서 정제 작업을 수행하십시오. 이상적으로는 데이터 수집 단계에서 데이터 품질을 확보해야 합니다. 만약 이러한 단계가 불가능하다면, 데이터가 분석 환경으로 유입되기 전에 형식을 표준화하고, 값을 검증하며, 이상치를 표시하는 전사적인 “데이터 정제 계층”을 구축하십시오.
- 모든 사업장과 자재 흐름에 걸쳐 표준화를 구축해야 합니다. SEMI 표준만으로는 데이터 분석이 직면한 과제를 해결하기에 충분한 표준화를 제공하지 못합니다. 제조업체는 각 데이터 영역에 대한 자체 데이터 표준을 수립하고, 이를 모든 사업장과 자재 흐름에 걸쳐 일관되게 적용해야 합니다.
- 공급망 추적 체계를 구축하십시오. 전력 반도체 분야의 제품 다양성으로 인해 자재 흐름도 복잡해집니다. 이는 완전 내재화, 부분 외주화, 완전 외주화(턴키) 방식이 혼합된 형태로 나타납니다. 원자재부터 출하된 모듈에 이르기까지, 출하된 모듈 내의 특정 다이를 원자재 단계까지 추적하는 것은 결코 쉬운 일이 아닙니다. 그러나 전력 반도체 분야에서 자재의 품질은 우수한 모듈과 현장에서 반품되는 모듈을 가르는 결정적인 요인이 되는 경우가 많습니다.
이 다섯 가지 단계는 제조 분야의 탁월성을 실현하기 위한 필수 조건입니다. 불완전하거나 정렬되지 않았거나 편향된 데이터로 훈련된 AI 모델은 오해의 소지가 있는 결과를 산출하게 되며, 생산 처분 시스템에서 이러한 결과는 직접적인 비용 손실로 이어집니다.
반도체 산업의 AI 전환은 이미 본격화되었습니다. 가장 큰 가치를 창출할 제조업체는 반드시 가장 정교한 모델을 보유한 곳이 아닐 수 있습니다. 오히려 데이터를 학습에 적합하도록 정제하는, 눈에 띄지 않는 노력을 기울여 온 기업들이 바로 그들입니다.
이 글은 2026년 3월 24일 PDF Solutions의 스티브 자멕(Steve Zamek), 존 홀트(Jon Holt), 샌디 첸(Sandy Chen)이 발표한 APEC 2026 세션 IS02.1의 발표 자료인 “반도체 비용 및 품질 개선을 위한 고급 분석 및 AI”를 바탕으로 작성되었습니다.