Real-ESRGAN: Training Real-World Blind Super-Resolution with Pure Synthetic Data

Dev

Real-ESRGAN: Training Real-World Blind Super-Resolution with Pure Synthetic Data - Paper Research

Septentrions 2025. 12. 30. 21:29

Though many attempts have been made in blind super-resolution to restore low-resolution images with unknown and complex degradations, they are still far from addressing general real-world degraded images. In this work, we extend the powerful ESRGAN to a pr

arxiv.org

최근, HD2D 프로젝트에 대해 좀 알아보고자 관련한 논문은 없나 좀 찾아보았다.

2D Pixel To HD 하면 당연히 Super Resolution 기법부터 떠올랐는데, 게임과 관련한 논문들은 찾기가 힘든 편이라

그나마 2021년 발표된 Real-ESRGAN을 발견하게 되었다.

AI 엔지니어링 할 것도 아니고 인퍼런스 모델만 있으면 되기 떄문에, 딥하게 수식이나 기술을 보진 않고 컨셉츄얼하게 분석해보겠다.

Pure Synthetic Data 란 말이 좀 우습긴 한데, 우리 저자분들이 얼마나 고생 했을 지 뻔해보인다.

- Abstract

블라인드 이미지에 대한 Super-Resolution 기법은 형태를 알아볼 수 없거나 복잡한 low-resolution 이미지들을 복원하는 기술이다. Real-ESRGAN은 Pure Synthetic Data를 이용하여 학습한 모델로서, High-order 수준의 퇴화된 이미지에 대해서는 가장 좋은 성능을 보여준다. 해당 모델은 합성 과정에서 생기는 Ringing, Overshoot 문제도 고려하고 있다.

게다가, 이 모델은 Spectral Normalization 를 적용한 U-Net Discriminator를 구성한다.

Ringing / Overshoot ?

생성모델에서 흔히 발생하는 현상으로, 생성 이미지의 Edge 부근에서 부자연스러워보이는 Ghost 현상을 말한다.

JPEG 화 시킨 이미지에 이상한 왜곡이 생기는 것과 같은 이야기이다.