[지문 연구]
※ 기계 학습과 확산 모델
• 해제: 이 글은 인공 지능 생성 모델 중 확산 모델의 기본적인 원리에 대해 설명하고 있다. 확산 모델은 원본 이미지에 노이즈를 점진적으로 추가하였다가 그 노이즈를 제거해 나가면서 원본 이미지를 복원하는 것이 기본 발상이다. 확산 모델은 노이즈 생성기, 이미지 연산기, 노이즈 예측기로 구성되며, 순확산 과정과 역확산 과정 순으로 작동한다. 순확산 과정은 이미지에 노이즈를 추가하면서 노이즈 예측기를 학습 시키는 과정으로, 이 과정에서 노이즈 예측기는 노이즈의 특성을 추출하여 수치들로 표현한 잠재 표현을 구하고 노이즈를 예측하는 방식을 학습한다. 한편 역확산 과정은 노이즈 이미지에서 노이즈를 제거하여 원본 이미지를 복원하는 과정으로, 노이즈 이미지나 확산 이미지를 노이즈 예측기에 입력하면 잠재 표현을 구하여 노이즈를 예측하고, 이미지 연산기는 이 노이즈를 빼서 확산 이미지를 출력한다. 이러한 단계를 반복함으로써 원본 이미지에 가까운 이미지를 얻을 수 있다.
• 주제: 기계 학습의 원리와 확산 모델
[지문]
▣ 다음 글을 읽고 물음에 답하시오.
문장이나 영상, 음성을 만들어 내는 인공 지능 생성 모델 중 확산 모델은 영상의 복원, 생성 및 변환에 뛰어난 성능을 보인다. 확산 모델의 기본 발상은, 원본 이미지에 노이즈를 점진적으로 추가하였다가 그 노이즈를 다시 제거해 나가면 원본 이미지를 복원할 수 있다는 것이다. 노이즈는 불필요하거나 원하지 않는 값을 의미한다. 원하는 값만 들어 있는 원본 이미지에 노이즈를 단계별로 더하면 노이즈가 포함된 확산 이미지가 되고, 여러 단계를 거치면 결국 원본 이미지가 어떤 이미지였는지 전혀 알아볼 수 없는 노이즈 이미지가 된다. 역으로, 단계별로 더해진 노이즈를 알 수 있다면 노이즈 이미지에서 원본 이미지를 복원할 수 있다. 확산 모델은 노이즈 생성기, 이미지 연산기, 노이즈 예측기로 구성되며, 순확산 과정과 역확산 과정 순으로 작동한다.
순확산 과정은 이미지에 노이즈를 추가하면서 노이즈 예측기를 학습시키는 과정이다. 첫 단계에서는, 노이즈 생성기에서 노이즈를 만든 후 이미지 연산기가 이 노이즈를 원본 이미지에 더해서 노이즈가 포함된 확산 이미지를 출력한다. 다음 단계부터는 노이즈 생성기에서 만든 노이즈를 이전 단계에서 출력된 확산 이미지에 더한다. 이러한 단계를 충분히 반복하면 최종적으로 노이즈 이미지가 출력된다. 이때 더해지는 노이즈는 크기나 분포 양상 등 그 특성이 단계별로 다르다. 따라서 노이즈 예측기는 단계별로 확산 이미지를 입력받아 이미지에 포함된 노이즈의 특성을 추출하여 수치들로 표현하고, 이 수치들을 바탕으로 노이즈를 예측한다. 노이즈 예측기 내부의 이러한 수치들을 잠재 표현이라고 한다. 노이즈 예측기는 잠재 표현을 구하고 노이즈를 예측하는 방식을 학습한다.
노이즈 예측기의 학습 방법은 기계 학습 중에서 지도 학습에 해당한다. 지도 학습은 학습 데이터에 정답이 주어져 출력과 정답의 차이가 작아지도록 모델을 학습시키는 방법이다. 노이즈 예측기를 학습시킬 때는 노이즈 생성기에서 만들어 넣어 준 노이즈가 정답에 해당하며 이 노이즈와 예측된 노이즈 사이의 차이가 작아지도록 학습시킨다.
역확산 과정은 노이즈 이미지에서 노이즈를 제거하여 원본 이미지를 복원하는 과정이다. 노이즈를 제거하려면 이미지에 단계별로 어떤 특성의 노이즈가 더해졌는지 알아야 하는데 노이즈 예측기가 이 역할을 한다. 노이즈 이미지 또는 중간 단계에서의 확산 이미지를 노이즈 예측기에 입력하면 이미지에 포함된 노이즈의 특성을 추출하여 잠재 표현을 구하고 이를 바탕으로 노이즈를 예측한다. 이미지 연산기는 입력된 확산 이미지로부터 이 노이즈를 빼서 현 단계의 노이즈를 제거한 확산 이미지를 출력한다. 확산 이미지에 이런 단계를 반복하면 결국 노이즈가 대부분 제거되어 원본 이미지에 가까운 이미지만 남게된다.
한편, 많은 종류의 이미지를 학습시킨 후 학습된 이미지의 잠재 표현에 고유 번호를 붙이면 역확산 과정에서 이미지를 선택하여 생성할 수 있다. 또한 잠재 표현의 수치들을 조정하면 다른 특성의 노이즈가 생성되어 여러 이미지를 혼합하거나 실재하지 않는 이미지를 만들어 낼 수도 있다.
10. 학생이 윗글을 읽은 방법으로 적절하지 않은 것은?
① 확산 모델이 지도 학습을 사용한다는 점에 주목하고, 지도 학습 방법이 확산 모델에 어떻게 적용되는지 확인하며 읽었다.
② 확산 모델이 두 가지 과정으로 이루어진다는 점에 주목하고, 두 과정 중 어느 과정이 선행되어야 하는지 살피며 읽었다.
③ 확산 모델에서 노이즈의 중요성을 파악하고, 사용되는 노이즈의 종류가 모델의 성능에 미치는 영향을 이해하며 읽었다.
④ 잠재 표현의 개념을 파악하고, 그 개념을 바탕으로 확산 모델이 노이즈를 예측하고 제거하는 원리를 이해하며 읽었다.
⑤ 확산 모델의 구성 요소를 파악하고, 그 구성 요소가 노이즈 처리 과정에서 어떤 기능을 하는지 확인하며 읽었다.
[정답 해설] ③ 이 글에는 노이즈의 종류가 모델의 성능에 미치는 영향이 제시되어 있지 않다. 따라서 노이즈의 종류가 미치는 영향을 이해하며 읽었다는 말은 적절하지 않다.
[오답 해설] ① 3문단에서 확산 모델을 구성하는 노이즈 예측기의 학습 방법은 기계 학습 방법 중에서 지도 학습에 해당한다고 하였다. 따라서 이 점에 주목하여 지도 학습 방법이 확산 모델에 어떻게 적용되는지 확인하며 읽은 것은 적절하다. ② 1문단에서 확산 모델은 순확산 과정과 역확산 과정 순으로 작동한다고 하였다. 따라서 이 점에 주목하여 순확산 과정이 먼저 일어나고 역확산 과정이 나중에 일어난다는 것을 확인하며 읽은 것은 적절하다. ④ 2문단에서 이미지에 포함된 노이즈의 특성을 추출한 수치들을 잠재 표현이라고 하였으며, 노이즈 예측기는 이 수치들을 바탕으로 노이즈를 예측한다고 하였다. 또한 노이즈를 제거하려면 이미지에 단계별로 어떤 특성의 노이즈가 더해졌는지 알아야 하는데, 잠재 표현을 구해 이를 바탕으로 노이즈를 예측한다고 하였다. 따라서 이 개념을 바탕으로 확산 모델의 노이즈 예측기가 노이즈를 예측하는 원리나 역확산 과정에서 노이즈를 제거하는 원리를 이해하며 읽은 것은 적절하다. ⑤ 1문단에서 확산 모델은 노이즈 생성기, 이미지 연산기, 노이즈 예측기로 구성된다고 하였다. 따라서 이 구성 요소들이 어떤 기능을 하는지 확인하며 읽은 것은 적절하다.
11. 윗글을 이해한 내용으로 가장 적절한 것은?
① 노이즈 생성기는 순확산 과정에서만 작동한다.
② 확산 모델에서의 학습은 역확산 과정에서 이루어진다.
③ 이미지 연산기와 노이즈 예측기는 모두 확산 이미지를 출력한다.
④ 노이즈 예측기를 학습시킬 때는 예측된 노이즈가 정답으로 사용된다.
⑤ 역확산 과정에서 단계가 반복될수록 출력되는 확산 이미지는 원본 이미지와의 유사성이 줄어든다.
[정답 해설] ① 2문단에서 순확산 과정은 이미지에 노이즈를 추가하면서 노이즈 예측기를 학습시키는 과정으로, 노이즈 생성기가 노이즈를 만든다고 하였다. 한편 4문단에서 역확산 과정은 노이즈를 제거하여 원본 이미지를 복원하는 과정으로, 이미지 연산기가 입력된 확산 이미지로부터 노이즈를 빼서 노이즈를 제거한 확산 이미지를 출력한다고 하였다. 따라서 노이즈 생성기는 순확산 과정에서만 작동한다는 것을 알 수 있다.
[오답 해설] ② 2문단을 통해 순확산 과정에서 노이즈 예측기가 잠재 표현을 구하고 노이즈를 예측하는 방식을 학습한다는 것을 알 수 있다. ③ 2문단에서 순확산 과정에서의 이미지 연산기는 노이즈를 원본 이미지에 더해 노이즈가 포함된 확산 이미지를 출력한다고 하였고, 4문단에서 역확산 과정에서의 이미지 연산기는 입력된 확산 이미지로부터 노이즈를 제거한 확산 이미지를 출력한다고 하였다. 그러나 노이즈 예측기는 이미지에 포함된 노이즈의 특성을 추출하여 잠재 표현을 바탕으로 노이즈를 예측하는 것이다. ④ 3문단을 통해 노이즈 예측기를 학습시킬 때는 노이즈 생성기에서 만들어 넣어 준 노이즈가 정답에 해당한다는 것을 알 수 있다. ⑤ 4문단에서 단계를 반복하면 결국 노이즈가 대부분 제거되어 원본 이미지에 가까운 이미지만 남게 된다고 하였다. 따라서 단계가 반복될수록 출력되는 확산 이미지는 원본 이미지와 유사해진다는 것을 알 수 있다.
12. 잠재 표현에 대한 설명으로 적절하지 않은 것은?
① 잠재 표현의 수치들을 조정하면 여러 이미지를 혼합할 수 있다.
② 역확산 과정에서 잠재 표현이 다르면 예측되는 노이즈가 다르다.
③ 확산 모델의 학습에는 잠재 표현을 구하는 방식이 포함되어 있다.
④ 잠재 표현은 이미지에 더해진 노이즈의 크기나 분포 양상에 따라 다른 값들이 얻어진다.
⑤ 잠재 표현은 노이즈 예측기가 원본 이미지를 입력받아 노이즈의 특성을 추출한 결과이다.
[정답 해설] ⑤ 2문단에서 노이즈 예측기는 단계별로 확산 이미지를 입력받아 이미지에 포함된 노이즈의 특성을 추출한다고 하였다. 원본 이미지를 입력받는 것이 아니다.
[오답 해설] ① 5문단에서 잠재 표현의 수치들을 조정하면 여러 이미지를 혼합하거나 실재하지 않는 이미지를 만들어 낼 수도 있다고 하였다. ② 4문단에서 노이즈 예측기에 확산 이미지를 입력하면 노이즈의 특성을 추출하여 잠재 표현을 구하고 이를 바탕으로 노이즈를 예측한다고 하였다. 따라서 노이즈 예측기에서 구한 잠재 표현에 따라 예측되는 노이즈도 달라질 것이다. ③ 2문단에서 확산 모델의 학습은 노이즈 예측기를 학습시키는 과정이라는 것을 알 수 있다. 노이즈 예측기는 단계별로 입력받은 확산 이미지에서 노이즈의 특성을 추출하여 수치들로 표현하는데, 이 수치들이 잠재 표현이다. 따라서 확산 모델의 학습에는 잠재 표현을 구하는 방식이 포함된다고 할 수 있다. ④ 2문단에서 노이즈의 크기나 분포 양상 등 그 특성은 단계별로 다르다고 하였다. 따라서 노이즈의 특성을 추출하여 구하는 잠재 표현은 노이즈의 크기나 분포 양상에 따라 다른 값들이 얻어진다고 할 수 있다.
13. 윗글을 바탕으로 <보기>를 이해한 내용으로 적절하지 않은 것은?
보 기
A단계는 확산 모델 과정 중 한 단계이다. ㉠은 원본 이미지이고, ㉡은 확산 이미지 중의 하나이며, ㉢은 노이즈 이미지이다. (가)는 이미지가 A단계로 입력되는 부분이고, (나)는 이미지가 A단계에서 출력되는 부분이다.
① (가)에 ㉠이 입력된다면, A단계의 이미지 연산기에서는 ㉠에 노이즈를 더하겠군.
② (나)에 ㉢이 출력된다면, A단계의 노이즈 생성기에서 생성된 노이즈가 이미지 연산기에서 확산 이미지에 더해졌겠군.
③ 순확산 과정에서 (가)에 ㉡이 입력된다면, A단계의 노이즈 예측기에서 예측한 노이즈가 이미지 연산기에 입력되겠군.
④ 역확산 과정에서 (가)에 ㉢이 입력된다면, A단계의 이미지 연산기에서는 ㉢에서 노이즈를 빼겠군.
⑤ 역확산 과정에서 (나)에 ㉡이 출력된다면, A단계의 노이즈 예측기에서 예측한 노이즈가 이미지 연산기에 입력되었겠군.
[정답 해설] ③ 순확산 과정에서 (가)에 ㉡의 확산 이미지가 입력된다면 이미지 연산기는 노이즈 생성기에서 만든 노이즈를 더하는 과정을 거쳐 ㉢의 노이즈 이미지를 만들 것이다. 노이즈 예측기에서 예측한 노이즈가 이미지 연산기에 입력되는 것이 아니다.
[오답 해설] ① (가)에 ㉠의 원본 이미지가 입력된다면 이미지 연산기는 노이즈 생성기에서 만든 노이즈를 원본 이미지에 더해 확산 이미지를 출력할 것이다. ② (나)에 ㉢의 노이즈 이미지가 출력된다면 노이즈 생성기에서 생성된 노이즈가 이미지 연산기에서 확산 이미지에 더해졌을 것이다. ④ 역확산 과정에서 (가)에 ㉢의 노이즈 이미지가 입력된다면 이미지 연산기가 노이즈 예측기에서 예측한 노이즈를 뺀 확산 이미지를 출력할 것이다. ⑤ 역확산 과정에서 (나)에 ㉡의 확산 이미지가 출력된다면 이미지 연산기에는 노이즈 예측기가 예측한 노이즈가 입력되어 노이즈 이미지나 중간 단계에서의 확산 이미지에서 제거되었을 것이다.
2025학년도 수능 국어영역 평가원 기출