Score-Based 생성 모델의 노이즈 스케줄 설계

인공지능이 만들어내는 이미지가 날마다 발전하는 요즘, ‘어떻게 이렇게 자연스러운 이미지를 생성할 수 있을까?’ 궁금하지 않으신가요? 그 중심에는 Score-Based 생성 모델, 즉 SGM이라는 기술이 있습니다. SGM은 이미지에 노이즈를 더하는 과정과, 그 노이즈를 다시 제거하여 이미지를 생성하는 과정을 반복하며 학습합니다. 마치 흐릿한 사진을 점점 선명하게 만들어가는 것과 같죠. 이 과정에서 ‘노이즈 스케줄’이라는 중요한 개념이 등장합니다. 노이즈를 얼마나, … Read more

DDIM 샘플링 스케줄 최적화 전략

안녕하세요, 여러분! 요즘 생성형 AI, 특히 스테이블 디퓨전으로 멋진 이미지를 만들어내는 재미에 푹 빠져 계시죠? 저도 매일 새로운 프롬프트로 기발한 결과물을 뽑아내면서 감탄하고 있답니다. 그런데 가끔은 ‘와, 이거 퀄리티는 좋은데 시간이 너무 오래 걸리네?’, ‘내가 원하는 딱 그 느낌을 뽑아내려면 뭐가 부족할까?’ 하는 아쉬움이 들 때가 있어요. 바로 이 지점에서 우리가 오늘 이야기할 ‘DDIM 샘플링 … Read more

VAE 잠재 변수 디엔탱글링 기법 연구

요즘 인공지능 기술의 발전 속도가 정말 눈부시지 않나요? 특히 이미지를 생성하거나, 글을 쓰거나, 심지어 새로운 항생제까지 설계하는 생성형 AI는 우리 삶을 변화시킬 잠재력을 보여주고 있죠. 그런데 AI가 만들어낸 결과물들을 보면서 ‘이 부분만 좀 더 섬세하게 조절할 수 없을까?’, ‘내가 원하는 특성만 쏙 빼서 바꿀 수 있다면 정말 좋겠다!’ 같은 생각 해보신 적 없으세요? 마치 재료들을 … Read more

CycleGAN을 이용한 비지도 도메인 변환 실험

요즘 인공지능 기술 발전이 정말 놀랍죠? 특히 이미지를 쓱싹 변환하는 기술들을 보면 ‘와, 이게 가능하다고?’ 싶을 때가 많은데요. 그런데 말이죠, 우리가 원하는 스타일로 이미지를 바꾸고 싶은데, 변환 전후의 딱 맞는 짝꿍 이미지가 없다면 어떨까요? 이런 난감한 상황을 해결해 줄 마법 같은 기술이 바로 CycleGAN이랍니다! 심지어 짝지 없는 데이터셋만 있어도 원하는 도메인으로 뿅 하고 바꿔줄 수 … Read more

StyleGAN 잠재 공간 조작을 통한 이미지 편집

요즘 AI가 만들어내는 이미지들을 보면 정말 놀라움을 금치 못할 때가 많죠? 단순히 사람의 모습을 흉내 내는 걸 넘어, 마치 살아 숨 쉬는 듯한 결과물에 저도 매번 감탄하곤 하는데요. 특히 StyleGAN은 초고품질의 이미지를 생성하는 것만으로도 대단했지만, 진정한 혁신은 바로 ‘잠재 공간(Latent Space)’이라는 마법 같은 영역을 통해 우리가 상상하는 모든 것을 현실로 만들어주는 강력한 도구로 자리매김했다는 점입니다. … Read more

점진적 GAN 학습을 통한 고해상도 이미지 합성

안녕하세요, 여러분! 기술 블로거 ㅇㅇㅇ입니다. 요즘 AI 기술 발전 속도 정말 놀랍지 않나요? 특히, 이미지를 만들어내는 능력은 매일매일 새로운 기록을 갈아치우고 있는데요. 여러분도 혹시 AI가 만든 사진인지 실제 사진인지 헷갈렸던 경험 있으실 거예요. 이 모든 마법 같은 일의 중심에는 바로 ‘GAN(생성적 적대 신경망)’이라는 기술이 있답니다. 그런데 이 GAN도 처음부터 이렇게 멋진 고해상도 이미지를 뚝딱 만들어내지는 … Read more

NeRF 기반 3D 장면 재구성 알고리즘 최적화

요즘 디지털 세상은 눈부시게 발전하고 있죠? 특히 실제처럼 생생한 3D 콘텐츠는 이제 게임이나 영화를 넘어 일상 곳곳에서 우리를 놀라게 하고 있습니다. 이런 생동감 넘치는 3D 장면을 단 몇 장의 2D 사진만으로 구현해내는 마법 같은 기술, 바로 NeRF(Neural Radiance Fields)가 그 중심에 있는데요. 처음 NeRF를 접했을 때, 그 결과물에 정말 깜짝 놀랐던 기억이 나요. 하지만 아쉽게도 … Read more

ControlNet을 활용한 조건부 이미지 생성 파이프라인

여러분, AI 이미지 생성, 요즘 정말 핫하죠? 하지만 막상 써보면 ‘내가 원하는 디테일은 이게 아닌데…’ 하고 아쉬웠던 경험, 다들 한 번쯤 있으실 거예요. 저 역시 프롬프트만으로는 채워지지 않는 섬세한 표현 때문에 답답할 때가 많았거든요. 이제 이런 한계는 옛말! 오늘은 이미지 생성의 판도를 바꾼 혁신적인 기술, 바로 ‘ControlNet’과 이 강력한 도구를 활용해 내 상상력을 100% 현실로 … Read more

Stable Diffusion 파인튜닝을 통한 도메인 특화 이미지 생성

요즘 AI 이미지 생성, 정말 신기하고 놀랍지 않나요? 저도 처음에는 ‘와, 이런 게 가능하다고?’ 감탄사를 연발했었죠. 하지만 막상 직접 써보니, 때로는 왠지 모르게 ‘뻔한’ 느낌의 이미지가 나오거나, 제가 원하는 특정 스타일이나 디테일을 표현하기 어려울 때가 많더라고요. 특히나 특정 도메인, 예를 들어 패션, 인테리어, 또는 제 블로그만의 시그니처 이미지를 만들고 싶을 때는 더욱 그랬어요. 바로 이럴 … Read more

CLIP 모델 기반 멀티모달 검색 엔진 구현

여러분, 혹시 웹 검색하다가 이런 생각 해본 적 없으세요? ‘내가 지금 보고 있는 이 이미지, 이 영상이랑 딱 맞는 정보를 찾아줄 수는 없을까?’ 텍스트로만 검색하는 시대는 이제 정말 옛말이 되어가는 것 같아요. 요즘은 스마트폰 갤러리에 있는 사진 한 장으로도 원하는 정보를 척척 찾아내는 ‘멀티모달 검색 엔진’이 뜨거운 감자인데요. 특히, 구글이나 네이버 같은 거대 플랫폼들이 이미지와 … Read more