Art, Design & Lifelog

Art, Philosophy, Design, Font, Music, Essay, Critique, Diary, Opinion, News

LOG/BLC

AI로 그리는 그림 : Midjourney, Dall.E, DreamStudio

ARTBRAIN 2022. 9. 7. 14:07

최근에 미국의 한 미술 공모전에서 우승한 그림이 AI 툴을 이용한 것이어서 화제가 됐어. (링크) 몇 개의 단어를 입력해서 원하는 결과가 나올 때까지 그림을 출력하는 방식인데, 화가의 죽음이라는 둥 창의성의 죽음이라는 둥 말들이 많아.

© Jason Allen

개인적으로는 이게 창의성의 죽음이나 화가의 죽음 등을 논할 레벨은 아니라고 생각해. 창작자의 툴은 항상 변하게 마련이고, 의도와 선택은 온전히 인간의 몫이니까. 그러려면 포토샵을 통한 제작물들도 창작물이 아니게?

정작 내가 놀랐던 건, 그림 제작과정의 간소함이었어. '인공지능'이라 하면 뭔가 전문적인 지식과 코딩 같은 게 들어갈 줄 알았는데, 실제로는 정말 몇 단어만 넣으면 알아서 출력해 주는 거더라구. 충격을 받았지. 게다가 별도의 프로그램을 쓰지 않고 (정확히는 원격으로 프로그램에 붙는 거겠지만) 웹상에서 구현된다는 게 참 대단한 것 같아. 기술이 벌써 이렇게 가까이 왔다고?

728x90


그래서, 최근에 몇 개의 툴을 써 본 것을 소개하려 해.

1. Midjourney

위 그림을 만든 바로 그 프로그램이야. Discord를 통해서 가입할 수 있고, 별도의 제약사항은 없어. 키워드를 입력만 하면 돼. 명령어 "/imagine"을 쓴 후, 뒤에 원하는 키워드들을 쭉 적으면 끝이야. 무료 회원은 25개까지만 만들어볼 수 있고, 월간 구독을 하면 200개까지 생성할 수 있대. ($10/월)

"chuseok"이라는 단어만 넣어 봤는데, 왼쪽처럼 4개의 시안을 보여주고 그 중 하나를 고도화할 것인지, 아니면 선택한 이미지를 기준으로 다시 배리에이션 할 것인지를 물어봐. 나는 4번을 선택하고 고도화를 해봤는데 오른쪽처럼 근사한 그림이 뚝딱 완성되더군. 단어를 정교히 하면 원하는 이미지에 가까운 그림을 만들어주는데, 예상하는 대로 만들어지지는 않지만, 몇 번 해보다 보면 어떤 결과가 나올지 대충 예상할 수 있어. 단어의 선택과 순서가 관건인 것 같아. 

다른 툴들이 이미지 리소스를 활용하는 느낌이라면, 미드저니는 회화적인 리소스를 많이 가져오는 것 같아. 일러스트레이터들이 모이는 포털(ex.데비안아트)에서 리소스를 끌어다 쓰는 게 아닐까 의심이 들 정도. 장점이라면, 다른 툴들보다 화면의 구도와 구성을 잘 정리해서 보여주는 것 같고, 또한 실존 인물 이미지를 사용할 수 있어서 좀 더 구체적인 방향을 잡을 수 있어. 하지만 리소스들을 너무 분절한 것인지, 자세히 보면 멀쩡한 부분이 하나도 없어. 너무 무드와 완결성에만 초점을 맞추는 것 같아. 그래도 아래 둘보다는 얘가 제일 맘에 드는 이미지를 뽑아줘. (약간... 얘네만의 '쪼'가 있어. ^^)

2. Dream studio

베타로 운영하고 있는 사이트이고, 부여받은 크레딧을 소진하는 방식이야. 다른 툴들보다 직관적이라서 곧이곧대로 단어를 해석해 주는 편인 데다, 실사 이미지를 주로 활용하고 있고, 미세 조정을 위해서 우측에 다양한 옵션을 두고 있는데, 작업에 큰 편의를 주지는 못하는 것 같아.

astronaut monkey를 입력한 결과

이 사이트의 장점은 속도가 빠르다는 것이고, 최대 9개의 배리에이션을 받아볼 수 있다는 건데... 너무 오브젝트 중심인 데다, 이미지의 원본을 크게 변형시키지 않아서 정적이고, 재미가 적은 편이야. 

미드저니가 '일러스트레이터들의 작품'을 리소스 삼는듯한 뉘앙스라면, 여기는 '모든 프리 리소스'를 활용하는 것 같은 인상인데, 그러다 보니 상당히 높은 확률로 위와 같은 단순하고 퀄리티 낮은 이미지를 보여줘서... 원하는 이미지를 '찾기' 위해서는 인내심이 필요해.

3. Dall.E

미드저니와 드림스튜디오의 장단점을 모두 합쳐놓은 듯한 사이트인데, 여기는 invitation이 필요해. 그런데 신청하고 나서 다음날 초대장이 메일로 날아오더라구. 베타이고 openAPI 제작을 목적으로 진행하고 있나 봐. 50개까지 만들어볼 수 있어.

왼쪽의 키워드는 "fur monster neon glow"로 출력한 거고, 오른쪽은 "Astronaut munchkin cat"이야.

명확한 이미지 리소스가 있으면 꽤 디테일하게 이미지를 병합해 주는데, 그래도 케바케. 퀄리티의 기복이 심한 편이야. 잘 그리는 종목이 있는 것 같아. 시간도 좀 오래 걸리는 편. 특이한 점은 실명을 사용할 수 없다는 점인데... 다른 두 툴은 연예인 이름을 써도 되거든? 그런데 여기만 정책이 좀 타이트한 것 같아. (물론 이 세 툴 모두, 미풍양속에 위배되거나 타인의 지적재산권을 침해할 만한 키워드는 입력이 금지되어 있어.)

Dall.e의 독보적인 장점은, 이미지를 등록하고 그 일부를 수정하거나 배리에이션을 받을 수 있다는 점인데, 투시나 구도, 광선까지도 얼추 비슷하게 맞춰주는 것 같아. 약간은 저작권 관련해서 문제가 생길 것 같지만, 아직까지는 문제 없으니 사용하는 거겠지? 이 방식이 더 전개되면 어도비에 팔았으면 좋겠어. ^^ 회사도 exit(?)하니까 좋고, 유저들도 하나의 툴에서 이미지 편집을 할 수 있으니 좋고.


이제 막 uncanny valley를 건너고 있는 중이지만, 몇 해 안에 우리는 창의성의 많은 부분을 인공지능에 기대게 될지도 몰라. 그다지 두렵지는 않아. 이것 역시 '몸이 좀 편해지는' 것이지, 인간을 대신한다는 느낌은 들지 않기 때문이지.

또한, 이 툴을 사용하는 것도 나름 능력이라, 키워드를 잘 설정하고 배리에이션을 진행하는 방식에 따라 인공지능이 뽑아내는 그림의 퀄리티도 달라지기 때문에 - 언젠가는 "ai based image generator"라는 직업이 생길지도 모르겠어. 아래 이미지들은 Eric Bellefeuille라는 사람이 미드저니를 통해서 몇 개의 이미지를 뽑은 건데... 이 정도면 ai를 뽑아낸 사람의 고유 스타일이 녹아 있다고 말해도 될 것 같지 않아?

© Eric Bellefeuille