Lifetime Creator

Art, Design, Essay, News

IMG

ChatGPT 이미지 샘플러 (1) - 개요

ARTBRAIN 2025. 4. 6. 00:00

챗GPT가 2025년 3월 말쯤에 이미지 생성 기능을 엄청나게 업그레이드해서 온 세상이 지브리로 뒤덮이고 있어.

나도 요즘 매일 이미지 만들기 삼매경에 빠져 있는데, 기록 및 공유용을 글을 남겨. 최근에 생긴 기능이라 모두가 초보겠지만, 그래도 내가 며칠동안 해보면서 파악한 내용은 다음과 같아.

1. 규정이 계속 바뀜

- 이게 제일 중요한 건데, 정책이 진짜 자주 바뀌어. 이건 잘 적응해야 해. 따라서 오늘 쓰는 이 글이, 네가 읽을 떄는 틀린 글일 수도 있어. (가급적 업데이트는 자주 할께)

2. 무료 계정도 가능하지만 제한이 있음, 유료도 제약이 있긴 함

- 공식적으로 수를 정해두진 않았지만, 보통 무료 사용자는 하루 25개 내외의 이미지를 생성할 수 있어. 재밌는 건 리셋 타임인데, 국제적으로 동시에 리셋하는 거라서 한국은 아침 9시에 리셋이 돼. (나도 경험해 봄) 유료 계정도 무한은 아닌데, 가끔 이미지를 엄청 뽑은 날은 '6시간 47분 이후부터 다시 생성할 수 있다'며 사실상의 제한을 걸기도 해. 분 단위의 시간 제한이 걸리는 건 흔한 일인데, 절반은 네 책임이고 절반은 서버 탓이야. 팁을 주자면 - 하나의 이미지를 완료하고 나서 바로 이어서 이미지를 요청하지 않고, 최소한 30초 정도 쉬었다가 하는 걸 권장해. 그 쉬는 시간에 프롬프트를 정돈하면 버리는 시간도 줄이고 좋더라구.

3. 머리 커짐은 어쩔 수 없음

- 실사든 만화 스타일이든, 머리가 커짐. 챗GPT는 Dall-E를 용역처럼 부리는 구조인데, Dall-E가 배운 방식이 '주제를 강조하는 방식'이라서, 머리가 커지는 걸 막는 데에는 한계가 있어. (혹시 통제하는 법을 아시는 분은 팁 좀 나눠주길.)

- 더욱 더 심각한 것은, 한 이미지를 반복해서 개선하면 머리가 계속 자라고ㅠㅠ, 머리를 줄이라고 하면 더 커지기도 함. 

4. 카메라, 구도 통제가 생각만큼 되지 않음

- 대부분 카메라가 정면을 촬영하는 형식으로 이미지를 표현하고, 내려보는 구도, 올려보든 구도 등은 만들기 어려움. 또한, 광각-망원 등의 렌즈 조절 등도 쉽지 않아. 결국 Dall-E도 빅데이터를 먹고 자란 아이라서, 특수한 구도나 렌즈 사용에는 표현력에 제약이 많아.

5. 이전 내용으로 오염되기 쉬움

- 생성형, 대화형 AI의 가장 큰 장점은 '맥락'을 파악하는 것이라서, 이전에 A라는 이미지를 만들고, 이후에 B라는 이미지를 만들 때, B에 A의 흔적이 묻기 쉽다는 거야. 맥락상으로 이어지는 거지. 이를테면 사진을 넣어서 지브리를 만들고 나서, 한참 있다가 픽사 톤을 만들면, 그냥 처음부터 픽사 톤을 만든 것보다 더 지브리같은 뉘앙스의 픽사 톤이 만들어 진다는 뜻이야. 이걸 잘 이용하는 사람도 있겠지만, 사실 조건을 명확히 하는 건 우리같은 초보들에겐 어려운 상황이니, 스타일을 바꿀 거면 새 채팅창을 여는 걸 추천해. 

6. 검열 짱 심함

- 선정성으로는 거의 이슬람 극단주의 급이야. 조금만 헐벗어도 정책상 안된다며 반려함. 노출이 있는 부분의 옷을 늘여서 덮거나, 포즈를 바꾸거나 소재를 바꾸거나... 엄마가 따로 없음. 근데 폭력이나 공포, 술, 담배 쪽은 선정성쪽 보다는 훨씬 제약이 덜해. 선정성을 벗어나는 방법을 연구 중에 있어.^^ (이것도 팁 공유 부탁.)

이게 내 한계 ㅠㅠ


나 같은 초보들이 이 강력한 이미지 생성 툴을 가지고 하는 짓이란 게 고작 : 

이 이미지를 지브리 스타일로, 픽사 스타일로, 디즈니 만화처럼... 등등으로 바꾸는 게 전부라서, 하는 김에 어떤 스타일이 있을지를 리스트화 하는 작업을 진행 중에 있어. 가급적 PC로 보기 바람. 원본이야 크지만, 하나씩 올리는 건 너무 피곤한 일이라서 6개씩 묶어 올릴 거거든.


계속 업데이트를 할 테지만 처음엔 많이 없어.
샘플이 필요하면 참고하길 바라. (가끔 광고를 눌러주면 땡큐고)
일단 알아두길 바라는 건 다음과 같아. 

1. 스타일 사이의 오염이 있을 수 있음 - 막 정교한 실험이 아니었기 때문에, 오류도 있을 수 있음. 지적해 주면 반영하겠음.
2. 게임 등은 잘 몰라 - 유명하다니까 모아두긴 하는데, 이게 아케인인지 LOL인지 잘 모름.
3. 대조를 위해서 하나의 이미지만을 사용했음 - 저작권이 걱정되어 원본 사진은 밝히지 않겠음. 근데 보면 누군지 알걸?


조사한 만큼 업데이트할 거고, 다음의 여섯 카테고리로 나눴으니, 필요한 게 있으면 아래 링크를 활용해.

o. 개요 - 전반적인 정보 (링크)
a. 3D 스타일 (링크)
b. 사진 스타일 (링크)
c. 회화, 사조 (링크)
d. 게임 또는 개성있는 작가 (링크)
e. 2D 만화류 (링크)
f. 재밌는 효과, 기타 (링크)

728x90
반응형