소프트웨어 테스트는 크게 두 가지 관점으로 나눌 수 있습니다.
- 화이트박스 테스트 (White-box Test) caixa branca
- 정의: 소프트웨어의 내부 구조, 코드, 동작 원리를 모두 알고 그 내부 로직이 올바르게 작동하는지 테스트하는 방식입니다.
- 비유: 자동차 엔진의 내부 구조를 잘 아는 정비사가 엔진을 분해하여 각 부품(피스톤, 밸브 등)이 제대로 움직이는지 하나하나 점검하는 것과 같습니다.
- 핵심: "내부를 들여다본다."
- 블랙박스 테스트 (Black-box Test) caixa preta
- 정의: 소프트웨어의 내부 구조는 전혀 모른 채, 오직 입력과 출력 결과만을 보고 기능이 요구사항에 맞게 동작하는지 테스트하는 방식입니다.
- 비유: 일반 운전자가 자동차의 내부 구조는 모르지만, 가속 페달을 밟으면 차가 잘 나가는지, 브레이크를 밟으면 잘 멈추는지 등 기능적인 부분만 확인하는 것과 같습니다.
- 핵심: "내부를 보지 않는다."
AI 커버리지 테스트는 모델의 '겉모습'(입력과 출력)만 보는 것이 아니라, 신경망 내부의 뉴런, 레이어, 값의 변화 등 속사정을 훤히 들여다보며 테스트하는 전형적인 화이트박스 테스트입니다.
| 구분 | 블랙박스 테스트 (AI) | 화이트박스 테스트 (AI) |
| 관점 | 내부 구조를 모름 | 내부 구조를 앎 |
| 테스트 대상 | 모델의 최종 예측 결과 (정확도, F1-score 등) | 모델 내부의 동작 (뉴런, 레이어, 경로 등) |
| 예시 | 고양이 사진을 넣었을 때 '고양이'라고 맞추는지 확인 | 고양이 사진을 넣었을 때 어떤 뉴런과 레이어가 활성화되는지 확인 |
| 해당 기법 | 일반적인 모델 성능 평가 | AI 커버리지 테스트 |
AI 시스템의 커버리지 테스트는 소프트웨어 테스트에서 사용되는 커버리지 개념을 AI 모델에 적용한 것입니다. 즉, 모델이 학습하거나 추론하는 동안 얼마나 다양한 입력값을 경험하는지 측정하는 방식입니다.
1. 왜 커버리지 테스트가 필요할까요?
만약 자율주행차가 있다고 상상해 봅시다. 이 차가 특정 시나리오(예: 맑은 날 낮에 고속도로 주행)에 대해서만 학습되었다면, 비가 오는 밤길이나 예상치 못한 장애물이 나타나는 상황에서는 어떻게 반응할까요? 제대로 학습되지 않은 상황에서는 위험한 결과를 초래할 수 있습니다. 커버리지 테스트는 이런 "사각지대"를 찾아내고, 모델이 다양한 상황에 대해 충분히 학습되었는지, 그리고 실제 환경에서 안정적으로 작동할 준비가 되었는지 확인하는 데 도움을 줍니다.
2. 커버리지 테스트의 실제 적용
커버리지 테스트는 주로 다음과 같은 경우에 활용됩니다.
- 모델 학습 단계: 학습 데이터셋이 모델의 잠재적인 동작 범위를 충분히 커버하는지 확인합니다. 커버리지가 낮으면 더 많은 데이터를 수집하거나 데이터 증강(Data Augmentation) 기법을 사용하여 데이터 다양성을 높일 수 있습니다.
- 모델 검증 단계: 학습된 모델이 실제 환경에서 마주칠 수 있는 다양한 시나리오를 얼마나 잘 처리할 수 있는지 평가합니다. 테스트 데이터셋이 모델의 일반화 성능을 충분히 측정하는지 확인합니다.
- 모델 업데이트/배포: 모델을 업데이트하거나 새로운 환경에 배포하기 전에, 기존 커버리지가 유지되는지 또는 새로운 환경에 대한 커버리지가 충분한지 확인합니다.
3. 커버리지 테스트의 과제
AI 시스템, 특히 딥러닝 모델은 매우 복잡하기 때문에 커버리지를 측정하고 해석하는 것이 쉽지 않습니다.
- 높은 차원의 입력 공간: 이미지, 음성 등은 차원이 매우 높아 모든 가능한 입력값을 커버하는 것은 사실상 불가능합니다.
- 추상적인 내부 동작: 신경망의 내부 동작은 인간이 직관적으로 이해하기 어렵기 때문에, 뉴런이나 경로 커버리지의 의미를 해석하는 것이 복잡할 수 있습니다.
- "좋은" 커버리지의 정의: 단순히 높은 커버리지 숫자가 항상 좋은 모델을 의미하는 것은 아닙니다. 어떤 커버리지가 모델의 품질과 직결되는지 연구가 계속되고 있습니다.
결론적으로, AI 시스템의 커버리지 테스트는 모델의 신뢰성과 견고성을 높이기 위한 중요한 도구입니다. 복잡한 AI 모델을 들여다보고, 잠재적인 약점을 파악하여 더 안전하고 효율적인 AI 시스템을 구축하는 데 기여합니다.

4. 커버리지 테스트 종류
1) 뉴런 커버리지 (Neuron Coverage) 🧠
뉴런 커버리지는 인공 신경망 내부의 각 뉴런(neuron)이 얼마나 활성화되었는지를 측정하는 방법입니다. 뇌의 신경세포가 특정 자극에 반응하여 활성화되는 것처럼, 인공 신경망의 뉴런도 특정 데이터가 입력되었을 때 활성화됩니다.
쉽게 비유하자면, 신경망을 거대한 전구 장식이라고 생각할 수 있습니다.
- 뉴런: 각각의 전구
- 입력 데이터: 전기를 공급하는 스위치
- 뉴런 활성화: 전구에 불이 들어오는 것
뉴런 커버리지 테스트는 다양한 입력 데이터(다양한 스위치 조작)를 통해 전체 전구 중 몇 개나 켜봤는지 확인하는 과정과 같습니다. 만약 한 번도 켜지지 않은 전구가 있다면, 그 전구는 장식의 역할을 제대로 못 하고 있거나, 우리가 시도해보지 않은 특정 스위치 조합에서만 켜질 수 있다는 의미입니다.
왜 중요할까요?
- 모델의 비활성 영역 탐지: 테스트 중에 전혀 활성화되지 않는 뉴런들은 모델이 학습하지 못한 특정 패턴이나 기능과 관련이 있을 수 있습니다. 이는 모델의 '맹점'을 의미합니다.
- 과적합(Overfitting) 확인: 특정 뉴런들만 과도하게 활성화된다면, 모델이 특정 학습 데이터에만 너무 치우쳐져 학습되었을 가능성을 시사합니다.

2) 임계점 커버리지 (Threshold Coverage)
임계점 커버리지는 AI 모델, 특히 신경망의 활성화 함수(activation function)가 특정 임계값을 기준으로 얼마나 다양한 출력을 생성하는지를 측정하는 기법입니다. 신경망의 각 뉴런은 입력값을 받아 처리한 후, 활성화 함수를 통해 다음 뉴런으로 전달할 출력값을 결정합니다. 이 활성화 함수에는 종종 특정 '임계값'이 존재하여, 그 값을 넘어서면 특정 방식으로 활성화되고, 넘지 못하면 다른 방식으로 활성화됩니다.
쉽게 비유하자면, 어떤 결정 장치가 '덥다'/'덥지 않다'를 판단한다고 해봅시다.
- 임계값: 예를 들어 '28도'
- 활성화: 온도가 28도를 넘으면 '덥다'는 신호를 보내고, 넘지 않으면 '덥지 않다'는 신호를 보냅니다.
임계점 커버리지 테스트는 이 '덥다'/'덥지 않다'라는 두 가지 상태를 얼마나 골고루 경험했는지를 확인하는 과정과 같습니다. 즉, 입력 데이터들을 주었을 때, 각 뉴런의 활성화 함수가 임계값 이상으로 활성화된 경우와 임계값 미만으로 활성화된 경우를 모두 충분히 거쳤는지를 측정하는 것입니다.
왜 중요할까요?
- 뉴런의 행동 다양성 확인: 모델 내의 각 뉴런이 다양한 조건에서 어떤 방식으로 반응하는지 이해하는 데 도움을 줍니다. 특정 임계값을 기준으로 뉴런의 동작이 극적으로 변할 수 있기 때문입니다.
- 결정 경계(Decision Boundary) 탐색: 모델이 특정 클래스를 구분하는 결정 경계 근처에서 어떻게 동작하는지 파악하는 데 유용합니다. 임계값 주변의 동작은 모델의 민감도를 나타낼 수 있습니다.
- 비활성 뉴런 진단 보완: 단순히 뉴런이 활성화되었는지 여부(뉴런 커버리지)를 넘어, 활성화의 '강도'나 '방향'까지 고려하여 뉴런의 역할을 더 세밀하게 분석할 수 있습니다.
예시: ReLU (Rectified Linear Unit) 활성화 함수
딥러닝에서 많이 사용되는 ReLU 함수는 '0'이라는 임계값을 가집니다.
- 입력값이 0보다 크면, 그 값을 그대로 출력합니다.
- 입력값이 0보다 작거나 같으면, 0을 출력합니다.
따라서 ReLU 함수를 사용하는 뉴런의 임계점 커버리지를 측정한다는 것은, 해당 뉴런이 양수(활성화)인 경우와 0 또는 음수(비활성화)인 경우를 얼마나 다양하게 경험했는지를 보는 것입니다.
이미지 1: 뉴런의 활성화
이 그림은 여러 입력 신호를 받은 뉴런이 활성화되어 하나의 출력 신호를 내보내는 기본적인 과정을 보여줍니다. 뉴런이 '켜지는' 순간을 볼 수 있습니다.

이미지 2: 임계점(Threshold) 기준의 상태 변화
이 그림은 임계점 커버리지의 핵심 개념을 보여줍니다. 특정 '임계값'을 경계로 뉴런의 상태가 '비활성화(inactive)'와 '활성화(active)' 두 가지로 명확하게 나뉘는 것을 볼 수 있습니다. 임계점 커버리지 테스트는 이 두 가지 상태를 모두 충분히 경험했는지 확인하는 것입니다.

3) 부호 변경 커버리지 (Sign Change Coverage)
부호 변경 커버리지는 AI 모델의 내부 계산 과정에서 발생하는 값들의 부호(양수/음수)가 얼마나 다양하게 변하는지를 측정하는 기법입니다. 이는 특히 뉴런의 출력값이나 가중치(weights)의 변화, 또는 특정 계산 결과의 부호가 모델의 최종 결정에 어떤 영향을 미치는지 분석하는 데 중요합니다.
쉽게 비유하자면, 어떤 의사 결정 시스템이 여러 단계를 거쳐 최종 결정을 내린다고 해봅시다. 각 단계에서 중간 결과값이 '긍정적'(+) 또는 '부정적'(-)인 신호로 처리될 수 있습니다.
부호 변경 커버리지 테스트는
- 특정 뉴런이나 계산 노드의 출력이 양수(+)인 경우
- 동일한 뉴런이나 계산 노드의 출력이 음수(-)인 경우
- 그리고 그 중간에 부호가 한 번이라도 변경되는 지점(0을 지나는 지점)을 얼마나 다양하게 경험했는지를 확인하는 과정과 같습니다.
왜 중요할까요?
- 모델의 민감도 파악: 입력값이 미세하게 변했을 때, 모델 내부의 어떤 뉴런이나 계산 노드에서 부호가 바뀌면서 최종 결정에 영향을 미치는지 파악할 수 있습니다. 이는 모델의 민감한 영역을 식별하는 데 도움을 줍니다.
- 결정 경계 근처 분석: 모델이 '클래스 A'와 '클래스 B'를 구분하는 결정 경계(decision boundary) 근처에서 뉴런의 활성화 값 부호가 자주 변할 수 있습니다. 부호 변경 커버리지는 이러한 경계에서의 모델 동작을 더 잘 이해할 수 있도록 돕습니다.
- 불안정성 진단: 특정 입력에 대해 모델 내부의 부호 변화가 너무 잦거나 예측 불가능하게 발생한다면, 모델이 불안정하거나 특정 시나리오에 대해 견고하지 못하다는 것을 의미할 수 있습니다.
- 다양한 경로 탐색: 특정 부호 변화가 발생할 때 모델이 어떤 다른 내부 경로를 따르는지 분석하여, 모델의 의사결정 과정을 더 깊이 이해할 수 있습니다.
작동 원리 예시:
신경망의 한 뉴런을 생각해보세요.
- 어떤 입력 데이터 A가 들어왔을 때, 이 뉴런의 출력이 +0.5 였습니다. (양수)
- 다른 입력 데이터 B가 들어왔을 때, 이 뉴런의 출력이 -0.3 였습니다. (음수)
- 또 다른 입력 데이터 C가 들어왔을 때, 이 뉴런의 출력이 +0.1 이었다가, 다른 입력 D에서 -0.05로 변했습니다. 이처럼 양수에서 음수로, 또는 음수에서 양수로 부호가 변경되는 지점들이 중요하게 측정됩니다.
아래 이미지는 동일한 뉴런이 서로 다른 입력에 따라 어떻게 출력값의 부호가 양수(+)에서 음수(-)로 바뀌는지를 명확하게 보여줍니다. 부호 변경 커버리지 테스트는 이처럼 (+)와 (-) 양쪽 상태를 모두 경험했는지 확인하는 과정입니다.

4) 값 변경 커버리지 (Value Change Coverage)
값 변경 커버리지는 AI 모델 내부의 특정 뉴런, 가중치, 또는 기타 계산 노드의 출력값이 얼마나 다양하게 변화했는지를 측정하는 기법입니다. 이는 단순히 활성화 여부(뉴런 커버리지)나 부호 변화(부호 변경 커버리지)를 넘어, 값 자체의 범위와 변화폭에 초점을 맞춥니다.
쉽게 비유하자면, 자동차의 속도계를 생각해보세요.
- 값 변경: 0km/h에서 100km/h, 50km/h, 다시 20km/h 등으로 속도 바늘이 다양하게 움직이는 것.
값 변경 커버리지 테스트는 모델에게 다양한 입력값을 주었을 때, 특정 뉴런이나 노드의 출력값이 얼마나 넓은 범위의 값을 가졌는지, 그리고 이 값들이 얼마나 다양한 수준으로 변했는지를 확인하는 과정과 같습니다. 예를 들어, 어떤 뉴런이 주로 0.1~0.3 사이의 값만 출력한다면, 그 뉴런은 값 변경 커버리지가 낮다고 볼 수 있습니다. 반면, -1.0에서 +1.0까지 넓은 범위를 커버한다면 값 변경 커버리지가 높습니다.
왜 중요할까요?
- 뉴런의 기능 범위 분석: 각 뉴런이 처리할 수 있는 값의 스펙트럼을 이해하여, 뉴런이 특정 기능이나 패턴에 대해 얼마나 다양한 강도로 반응할 수 있는지 파악합니다.
- 이상치(Outlier) 및 비정상 동작 감지: 특정 뉴런의 값이 예상치 못하게 극단적으로 변하거나, 반대로 전혀 변하지 않는 경우를 감지하여 모델의 불안정성이나 잠재적 결함을 식별할 수 있습니다.
- 활성화 함수의 효율성 평가: 활성화 함수가 입력값에 대해 다양한 출력값을 생성하는지 평가하여, 모델이 학습하는 동안 정보를 얼마나 다양하게 변환하고 전달하는지 이해할 수 있습니다.
- 모델의 견고성 및 일반화 능력 향상: 값 변경 커버리지를 높이도록 테스트 데이터를 구성함으로써, 모델이 다양한 입력 조건에 대해 더 견고하고 일반화된 성능을 갖도록 유도할 수 있습니다.
작동 원리 예시:
신경망의 특정 뉴런이 있다고 가정해 봅시다.
- 입력 데이터 A에 대해 뉴런 출력이 0.2
- 입력 데이터 B에 대해 뉴런 출력이 0.8
- 입력 데이터 C에 대해 뉴런 출력이 -0.5
- 입력 데이터 D에 대해 뉴런 출력이 0.1
이 뉴런은 [-0.5, 0.8] 범위의 값을 출력했으며, 0.1, 0.2, 0.8, -0.5와 같이 다양한 값들을 경험했습니다. 값 변경 커버리지는 이처럼 뉴런이 어떤 값들을 경험했는지, 그리고 그 값들의 분포가 얼마나 넓고 고른지를 측정합니다. 이는 단순히 '활성화되었다'를 넘어, '얼마나 강하게 활성화되었는가' 또는 '얼마나 음의 값으로 활성화되었는가'를 파악하는 것입니다.
아래 이미지는 하나의 뉴런이 다양한 종류의 입력에 따라 단순히 켜지고 꺼지는 것을 넘어, 얼마나 다채로운 강도로 반응하는지를 속도계(gauge)에 비유하여 보여줍니다.
값 변경 커버리지 테스트의 핵심은 이처럼 뉴런의 출력값이 낮음, 중간, 높음 등 다양한 범위를 골고루 경험했는지 확인하는 것입니다.

5) 부호-부호 커버리지 (Sign-Sign Coverage)
부호-부호 커버리지는 AI 모델 내에서 서로 연결된 두 개(또는 그 이상)의 뉴런(노드) 출력값의 부호 조합이 얼마나 다양하게 발생했는지를 측정하는 기법입니다. 이는 개별 뉴런의 부호 변화뿐만 아니라, 뉴런 간의 상호작용 및 조건부 동작을 분석하는 데 중점을 둡니다.
쉽게 비유하자면, 두 명의 친구 A와 B가 특정 상황에 대해 '찬성'(+) 또는 '반대'(-) 의견을 낸다고 해봅시다.
- 친구 A: 찬성(+) 또는 반대(-)
- 친구 B: 찬성(+) 또는 반대(-)
부호-부호 커버리지 테스트는 다음과 같은 네 가지 가능한 의견 조합이 얼마나 다양하게 나타났는지를 확인하는 과정과 같습니다.
- A는 찬성(+), B는 찬성(+)
- A는 찬성(+), B는 반대(-)
- A는 반대(-), B는 찬성(+)
- A는 반대(-), B는 반대(-)
AI 모델에서는 인접하거나 의미 있는 연결을 가진 두 뉴런 N1과 N2의 출력(O1, O2)을 보고, 이들의 부호 조합 $(sign(O_1), sign(O_2))$이 위 네 가지 경우를 얼마나 골고루 경험했는지 측정합니다.
왜 중요할까요?
- 뉴런 간의 상호작용 이해: 개별 뉴런의 동작을 넘어, 특정 뉴런 쌍이 어떤 식으로 협력하거나 길항하는지 이해하는 데 도움을 줍니다. 예를 들어, 한 뉴런이 양수일 때 다른 뉴런도 양수인지, 아니면 음수인지 등의 패턴을 파악할 수 있습니다.
- 복합적인 결정 조건 분석: 모델의 복잡한 의사결정 과정에서 여러 뉴런의 조합된 상태가 특정 결과를 유발할 수 있습니다. 부호-부호 커버리지는 이러한 조건부 패턴을 발견하는 데 유용합니다.
- 숨겨진 경로 및 로직 발견: 특정 부호 조합이 전혀 발생하지 않는다면, 해당 조합으로 이어지는 모델의 내부 로직이나 경로가 활성화되지 않았다는 의미일 수 있습니다. 이는 테스트 데이터의 부족을 시사하거나, 모델의 설계상 해당 조합이 불가능하다는 것을 나타낼 수 있습니다.
- 모델의 견고성 테스트: 다양한 입력에 대해 뉴런 쌍의 부호 조합이 균형 있게 분포되는지 확인하여, 모델이 특정 편향 없이 다양한 시나리오에 잘 대응하는지 평가합니다.
작동 원리 예시:
이미지 분류 모델에서 '눈'과 '코'를 감지하는 두 개의 뉴런이 있다고 가정해 봅시다.
- N_눈: 눈 감지 여부에 따라 양수/음수 출력
- N_코: 코 감지 여부에 따라 양수/음수 출력
다양한 얼굴 이미지를 모델에 넣었을 때,
- N_눈 (+) & N_코 (+): 눈과 코가 모두 감지된 경우 (일반적인 얼굴)
- N_눈 (+) & N_코 (-): 눈은 감지되었으나 코가 잘 안 보이는 경우 (측면 얼굴 등)
- N_눈 (-) & N_코 (+): 코는 감지되었으나 눈이 잘 안 보이는 경우 (마스크 착용 등)
- N_눈 (-) & N_코 (-): 눈과 코 모두 잘 감지되지 않은 경우 (가려진 얼굴 등)
이러한 네 가지 조합이 테스트 데이터셋을 통해 얼마나 골고루 경험되었는지를 측정하는 것이 부호-부호 커버리지의 핵심입니다.
아래 이미지는 서로 연결된 두 뉴런(A와 B)이 다양한 입력에 따라 양수(+) 또는 음수(-) 출력을 낼 때, 이 두 뉴런의 부호 조합이 얼마나 다양하게 발생하는지를 보여줍니다. 마치 두 친구가 동시에 '찬성' 또는 '반대'를 외치는 다양한 시나리오를 확인하는 것과 같습니다.

6) 레이어 커버리지 (Layer Coverage)
레이어 커버리지는 AI 모델, 특히 딥러닝 신경망에서 각 계층(layer)이 얼마나 다양한 입력 패턴을 경험하고 활성화되었는지를 측정하는 기법입니다. 신경망은 여러 계층(입력 계층, 은닉 계층, 출력 계층)으로 구성되어 있으며, 각 계층은 입력 데이터를 받아 특정 변환을 수행한 후 다음 계층으로 전달하는 역할을 합니다.
쉽게 비유하자면, 여러 부서로 이루어진 공장을 생각할 수 있습니다.
- 각 부서 (레이어): 원재료(입력)를 받아 가공한 후 다음 부서로 넘기는 역할
- 각 부서 내의 직원 (뉴런): 실제 가공 작업을 수행
레이어 커버리지 테스트는 이 공장의 각 부서들이 얼마나 다양하고 복잡한 종류의 원재료를 처리해 봤는지, 그리고 각 부서가 다양한 방식으로 활발하게 작동했는지를 확인하는 과정과 같습니다. 즉, 단순히 뉴런 하나하나의 활성화를 보는 것이 아니라, 계층 전체가 얼마나 '일'을 제대로 하고 다양한 상태를 거쳤는지를 평가하는 것입니다.
왜 중요할까요?
- 계층별 기능 파악: 각 계층은 모델 내에서 특정 추상화 수준의 특징을 학습합니다. 예를 들어, 이미지 처리 모델의 초기 계층은 선이나 모서리와 같은 저수준 특징을, 후반 계층은 얼굴이나 객체와 같은 고수준 특징을 학습합니다. 레이어 커버리지는 각 계층이 이러한 기능을 얼마나 다양하게 수행했는지 보여줍니다.
- 모델의 "사각지대" 식별: 특정 계층이 전혀 활성화되지 않거나, 특정 유형의 입력에 대해서만 극단적으로 활성화된다면, 해당 계층이나 그 계층이 담당하는 기능에 문제가 있거나 테스트 데이터가 부족하다는 신호일 수 있습니다.
- 모델의 효율성 및 중복성 진단: 일부 계층이 거의 동일한 패턴으로만 활성화된다면, 해당 계층들이 중복되거나 불필요할 수 있음을 시사합니다. 반대로, 너무 적게 활성화된다면 모델의 정보 전달에 병목 현상이 있을 수 있습니다.
- 일반화 능력 향상: 다양한 입력 데이터를 통해 모든 계층이 광범위한 패턴을 경험하도록 유도함으로써, 모델의 일반화 능력을 향상시키고 특정 데이터에 대한 과적합을 방지할 수 있습니다.
측정 방법의 예시:
레이어 커버리지는 주로 다음과 같은 방식으로 측정될 수 있습니다.
- 뉴런 활성화 임계값: 각 레이어 내의 뉴런들이 특정 임계값 이상으로 활성화된 비율을 측정 (레이어별 뉴런 커버리지 확장)
- 활성화 값 분포: 각 레이어의 출력값(활성화 값)이 얼마나 넓은 범위에 걸쳐 분포하는지 분석 (레이어별 값 변경 커버리지 확장)
- 부호 조합 다양성: 레이어 내 뉴런들의 부호 조합이 얼마나 다양한지 측정 (레이어별 부호-부호 커버리지 확장)
아래 이미지는 딥러닝 신경망을 여러 층으로 이루어진 건물에 비유하여, 테스트가 얼마나 깊이 도달했는지를 보여줍니다.
- 나쁜 커버리지: 테스트가 건물의 1층(초기 레이어)만 확인하고 끝나는 경우입니다. 건물의 위층(후반 레이어)에서는 어떤 일이 일어나는지 전혀 알 수 없습니다.
- 좋은 커버리지: 테스트가 건물의 모든 층(모든 레이어)을 구석구석 확인하는 경우입니다. 이를 통해 모델 전체가 다양한 상황에서 어떻게 반응하는지 종합적으로 파악할 수 있습니다.
레이어 커버리지의 핵심은 이처럼 모델의 얕은 부분부터 가장 깊은 부분까지 모든 계층이 활성화되고 테스트되었는지 확인하는 것입니다.

'AI' 카테고리의 다른 글
| Agentic AI (3) | 2025.09.20 |
|---|---|
| VAE (Variational AutoEncoder) (1) | 2025.09.02 |
| [AI 테스트] 메타모픽 테스트 기법 (Metamorphic Testing) (2) | 2025.08.31 |
| MCP (Model Context Protocol) (4) | 2025.08.25 |
| RAG (Retrieval Augmented Generation) (5) | 2025.08.20 |