Diffusion과 Deep fake

 

AI로 이미지를 생성해내는 대표적 두가지 기술에 Diffusion과 GAN이 있습니다.

 

GAN(Generative Adversarial Nextworks) 기술은  Generator (생성)과 Discriminator(판별)이 서로 대립하면서 이미지를 생성합니다. Generator이 유사 이미지를 생성하면, Discriminator가 이미지가 실제인지 생성된 것인지 판단합니다. GAN은 그래서 현실성 있는 이미지 생성을 중점에 두고, 생성된 이미지가 실제와 구별하기 어렵도록 하는 것이 목표가 됩니다.

 

Diffusion의 경우에는 입력데이터를 압축하여 다시 확장하여 원래 데이터를 복원하는 형태로 작동합니다. 이 과정에서 모델이 이미지의 잠재적인 표현을 학습하고, 이를 토대로 새로운 이미지를 생성해냅니다. 데이터에서의 핵심이 되는 특징들을 파악하는 학습을 거친 뒤 새로운 데이터를 생성합니다. 그래서 다양한 이미지 스타일과 구조 학습을 통해 사용자의 요구에 맞춘 다양한 종류의 이미지를 생성 할 수 있습니다.

 

그렇다면 Deep Fake가 왜 Diffusion 모델의 발전에 따라 더 위협적이 되었는지 이야기 해보겠습니다.

 

Diffusion은 데이터를 통해 학습을 거치고 나면 고도의 상세하고 복잡한 이미지를 생성 할 수 있습니다. 고급이미지가 생성되는 것 입니다. 그렇기 때문에 템플릿 형태에 얼굴만 붙여내는 누가 봐도 Deep fake 같은 이미지나 영상이 아닌 정말 리얼한 Deep Fake 가 탄생합니다. 마치 트럼프 대통령이 연행되었던 사진과 같은 것이 그 예가 됩니다.

 

또한 이 Diffusion 모델은 GAN 모델에 비해 상대적으로 사용이 쉽고 접근성이 낮습니다. 꼭 AI나 이미지를 다루는 기술과 지식이 없는 일반인도 관심만 있다면 쉽게 Deep fake를 리얼하게 만들어 낼 수 있게 됩니다. 지금도 관심을 갖고 찾아보면 이 방법에 대하여 공유 되고 있음을 알 수 있습니다.

 

이런 모델의 근본적인 차이로 인해 Diffusion을 기반으로 하는 모델이 GAN을 기반으로 하는 모델보다 더 많이 사용되어 GAN을 대체 하게 될 것이라고 생각됩니다.

 

그렇기 때문에 CUBIG의 PIXAID APP (픽스에이드 어플리케이션) 내의 이미지 면역기능으로 제공되는 안티피싱은 Stable Diffusion 모델을 통한 Deep fake를 예방함을 목표로 합니다.

 

이미지 면역 기술은 랜섬웨어를 비롯한 각종 바이러스 예방을 위한 V3, McAfee 등의 안티바이러스 프로그램처럼, 적대적 AI로 부터의 백신 기능을 담당합니다. AI가 발전되면 그에 맞춰 이미지 면역도 발전을 해야 합니다. 새로운 바이러스가 나타나 종종 백신이 있음에도 감염이 되는 것처럼 완벽한 방어란 존재하기 어렵습니다. 그렇지만 엄청난 속도의 AI 발전앞에 우리가 할 수 있는 다양한 조치를 해서 우리를 지켜야 합니다.  가장 빠르고 쉬운 대안을 픽스에이드 안티피싱을 통해  얻을 수 있습니다.