미드저니 이해와 실사용 정리: 이제는 알아야 할 기본 4가지!

요즘 미드저니 안 써본 사람 없을 거예요. 근데 막상 “이거 어떻게 작동하는 거야?” 물어보면 대답 못하는 분들 많죠? 저도 처음엔 그랬습니다. 그냥 프롬프트 넣으면 그림 나오는 줄 알았어요.

원리가 좀 신기함

미드저니 엔진은 확산 모델이라는 걸 씁니다. 이름이 좀 어렵게 들리는데, 실제로는 별거 아니에요.

TV 지직거리는 화면 있잖아요. 그 노이즈에서 시작합니다. 거기서 신경망이 노이즈를 조금씩 걷어내면서 그림을 만들어가는 거예요. 조각가가 돌덩이 깎아서 형상 만드는 거랑 비슷한데, 방향이 반대인 셈이죠. 돌을 깎는 게 아니라 노이즈를 깎는 거.

근데 아무렇게나 깎으면 안 되잖아요. 여기서 프롬프트가 끼어듭니다. 우리가 입력한 문장이 숫자로 바뀌어서 “이쪽 방향으로 깎아”라고 알려주는 역할을 해요. CLIP이라는 인코더가 그 변환을 담당하고요.

미드저니가 다른 것들보다 예쁜 그림 뽑아주는 이유? 사용자들이 좋아요 누른 이미지들 분석해서 그 특성을 모델한테 학습시켰대요. 그러니까 모델 자체가 “뭐가 예쁜 건지” 어느 정도 알고 있는 거죠. 그래서 프롬프트 대충 넣어도 꽤 봐줄 만한 게 나옵니다. Stable Diffusion 쓸 때처럼 카메라 기종이니 해상도니 일일이 안 넣어도 돼요.

업스케일러도 잘 만들어놨더라고요. 처음에 저해상도로 네 장 보여주고, 마음에 드는 거 고르면 고해상도로 키워주는데, 이때 그냥 확대하는 게 아니라 디테일을 보강하면서 올려요. 피부 질감이나 눈동자 같은 거 보면 확실히 티가 납니다.

버전 얘기 좀 하면

미드저니가 2022년부터 버전업을 꽤 자주 했는데, 솔직히 V4 전까지는 좀 애매했어요. 그림체가 너무 몽환적이랄까, 구체적인 묘사가 잘 안 됐거든요.

V4가 나온 게 2022년 말인데, 이때 확 달라졌습니다. 복잡한 프롬프트를 알아듣기 시작했고, 특히 인물 그릴 때 퀄리티가 장난 아니었어요. “미드저니 특유의 화풍”이라는 말이 생긴 게 이때부터예요.

V5 시리즈는 2023년에 나왔는데, 사실주의 쪽으로 확 기울었습니다. AI 그림 하면 늘 까였던 게 손가락 개수 문제잖아요. 이게 V5에서 많이 나아졌어요. 피부 질감이나 조명도 거의 사진 수준으로 올라왔고요. 줌 아웃 기능 추가된 것도 이때입니다. 그림 바깥 영역을 AI가 상상해서 채워주는 건데, 꽤 쓸 만해요.

V6는 텍스트 렌더링이 됩니다. 이게 진짜 큰 변화예요. 프롬프트에 따옴표로 “OPEN”이라고 넣으면 간판에 진짜 OPEN이라고 써져서 나와요. 전에는 글자 넣으면 외계어처럼 나왔거든요. DALL-E 3가 먼저 이거 해냈는데, 미드저니도 따라잡은 거죠.

V7은 올해 나왔고, 옴니 레퍼런스라는 게 생겼어요. 참조 이미지 주면 그 캐릭터 스타일 유지하면서 다른 장면을 그려줍니다. 웹툰 그리는 분들한테 이거 엄청 유용할 거예요. 매번 캐릭터 얼굴 달라지는 문제가 해결되니까.

아 그리고 V6부터는 “4K, 8K, masterpiece, award-winning” 이런 거 넣어봤자 별 소용없어요. 개발자가 직접 그랬습니다. 모델이 이미 좋은 퀄리티 기본으로 잡고 있어서, 저런 수식어가 오히려 노이즈래요.

실제로 어디서 쓰나

게임 쪽에서 제일 많이 쓰는 것 같아요. 컨셉 아트 뽑을 때요. 캐릭터든 배경이든 몬스터든 시안을 빠르게 여러 개 뽑아서 방향 잡는 용도로 씁니다.

Lost Lore라는 모바일 게임 스튜디오 사례가 있는데, 캐릭터 17개 디자인을 일주일 만에 끝냈대요. 원래 방식대로면 캐릭터 하나에 이틀씩 잡아야 하니까 한 달은 걸렸을 작업이거든요. 물론 AI가 뽑은 거 그대로 쓴 건 아니고, 손이랑 눈 같은 어색한 부분은 사람이 손봤다고 합니다. 그래도 80% 비용 절감에 6배 속도 향상이라니 엄청나죠.

건축이나 인테리어에서도 초기 컨셉 잡을 때 많이 쓴대요. “유기적인 곡선, 콘크리트랑 유리 조화, 숲속 배경” 이런 식으로 넣으면 시안이 쭉 나오니까 클라이언트랑 방향 잡기가 수월해진다고. V7 리텍스처 기능 쓰면 간단한 3D 모델 캡처 위에 실사 재질 입히는 것도 된다던데, 이건 저도 아직 안 써봤어요.

마케팅에서는 무드보드 만들 때 많이 쓰죠. 레퍼런스 이미지 찾느라 몇 시간씩 핀터레스트 뒤지던 게 몇 분으로 줄어드니까요. 코카콜라가 소비자들한테 AI로 브랜드 아트 만들게 해서 타임스퀘어 전광판에 띄운 적도 있습니다.

주의할 것들

요금은 Basic이 월 8달러, 제일 비싼 Mega가 96달러예요. 연 매출 100만 달러 넘는 회사는 Pro 이상 써야 한다고 합니다.

미드저니 이제 신기한 장난감은 아니에요. 어떻게 자기 작업에 녹여내느냐가 관건인 시대가 됐습니다. 법적인 부분 체크는 해야겠지만, 쓸 줄 아는 게 점점 기본기가 되어가는 분위기긴 해요.

https://www.midjourney.com/