사탐은 처음이지 [1388503] · MS 2025 · 쪽지

2025-09-24 21:58:10
조회수 84

노이즈 지문 이해 안 되는 점

게시글 주소: https://orbi.kr/00074800743

애초에 노이즈를 추가하고 다시 제왜를 왜 하나요? 마치 낙서하고 다시 지우는 그런걸 왜 하는지… 마지막 문단에 나오는 여러 이미지 혼합? 이런 거 때문인지.  아시는 분….

0 XDK (+0)

  1. 유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.

사탐은 처음이지 [1388503]

쪽지 보내기

  • 일오_ · 1335396 · 2시간 전 · MS 2024 (수정됨)

    둘이 다른 과정입니다...
    노이즈 추가 >>> 원래 이미지에 어떤 노이즈가 추가되어야 특정 노이즈 이미지가 되는지를 학습
    노이즈 제거 >>> 학습된 것을 바탕으로 특정 노이즈에 어떤 노이즈가 들어가있는지를 판단, 그 노이즈를 제거(=이미지 생성 ai 작동 방식)
    즉, 노이즈를 추가하는 과정은 이미지 생성 ai를 훈련하는 거고, 노이즈를 제거하는 과정은 이미지 생성 ai를 실제로 쓰는 겁니다

  • NeurIPS · 1277071 · 1시간 전 · MS 2023

    좀 첨언하자면

    제 생각에 저 지문은 연계지문이었거나 과거 퍼셉트론의 학습 과정에 대한 출제가 있었기 때문에 기계학습이 무엇인지 어느 정도는 알고 있다고 보고 출제를 한 것 같습니다.

    지문에 있었을 텐데 지도학습은 정답과 출력값의 차이 = 손실을 최소화하는 과정으로 이루어집니다. 학습은 가중치를 손실이 감소하는 방향으로 갱신하면서 이루어진다고 예전 기출에 나와있었을 겁니다.

    이 모델에서는 사용자가 입력한 노이즈 값(보통 가우시안 분포 이용)과 예측기가 예측한 노이즈의 차이가 감소하는 방향으로 학습이 이루어집니다.

    결국 각 시점에서 어떤 노이즈가 들어간 건지 예측을 하는 건데 그럼 그 예측된 노이즈를 제거하면 그 시점에 더해진 노이즈와 거의 같은 노이즈를 제거할 수 있습니다. (그렇게 학습을 시켰으니)

    그래서 왜 굳이 이미지를 생성하는데 노이즈 같은 게 필요하냐? 깡으로 이미지를 생성하는 건 기술적으로 매우 어렵고, 가우시안 분포를 따르는 노이즈를 입력으로 받아서 다루는 게 훨씬 편하기 때문입니다. 지문에서 얘를 어떻게 활용하는가는 설명을 안 해놔서 좀 난해할 수 있는데 글에 있는 대로 특정 이미지를 노이즈 입력을 통해 생성할 수도 있고, 시중 모델들 처럼 이런저런 매개변수나 프롬프트 같은 걸 통해 원하는 이미지를 노이즈 조합을 통해 생성할 수도 있습니다.

    관련 내용이 더 깊이 궁금하시면 딥러닝과 디퓨전, 그 중에서도 DDPM 관련 이해가 필요합니다. 지문에 있는 대로만 이해하시는 게 좋습니다.