5가지 이미지 생성 모델

Ideogram, Stable Diffusion, Flux, Midjourney, Google Image FX

Ideogram

  • Ideogram, Inc.에서 개발한 프리미엄 텍스트-이미지 모델
  • 2024년 8월, Ideogram은 2.0 모델을 출시했으며, 텍스트 생성 기능이 매우 뛰어나다는 평가
  • 매주 무료 소량 크레딧이 추가되어 무료로 생성 가능
  • https://ideogram.ai/
  • 다른 모델에 비해 텍스트가 잘 표현됩니다.

Ideogram은 딥 러닝 신경망을 사용하여 텍스트와 이미지 간의 관계를 이해하고, 사용자가 입력한 텍스트 설명과 일치하는 이미지를 생성하는 AI 이미지 생성기입니다. Ideogram은 방대한 이미지-텍스트 쌍 데이터 세트를 학습하여 이미지의 시각적 요소와 텍스트 설명 사이의 패턴을 파악하고, 이를 기반으로 새로운 이미지를 생성합니다. Ideogram은 창의적인 표현을 보다 쉽고 재미있게 만들 수 있는 최첨단 AI 도구를 개발하는 데 중점을 두고 있으며, 특히 텍스트를 이미지에 일관되게 렌더링하는 기능을 갖추고 있습니다.

Ideogram은 무료로 사용할 수 있는 서비스이며, 무료 계정의 경우 하루에 10개의 ‘슬로우 크레딧’을 제공합니다. 슬로우 크레딧은 이미지 생성 속도가 느리지만, 무료로 Ideogram의 기능을 체험해 볼 수 있는 좋은 기회입니다. 유료 플랜을 구독하면 더 빠른 이미지 생성 속도와 더 많은 이미지 생성 크레딧, 그리고 이미지 업로드 및 개인 생성과 같은 프리미엄 기능을 이용할 수 있습니다. 또한, Ideogram은 “Describe” 기능을 통해 이미지를 텍스트로 변환할 수도 있습니다.

Ideogram은 온라인 콘텐츠 제작자가 소셜 미디어용으로 눈길을 끄는 시각 자료를 생성하거나 그래픽 디자이너가 초기 컨셉을 브레인스토밍하고 디자인 아이디어를 탐색하거나 목업을 만드는 데 사용할 수 있습니다.

Stable Diffusion

  • Stability AI에서 오픈소스 라이선스로 배포한 text-to-image 인공지능 모델
  • 오픈소스로 제공되어 개인의 PC로 실행 할 수 있음
  • 2024년 6월 13일, 매개변수 20억개 버전인 SD3 medium이 먼저 오픈소스 공개
  • 오픈소스로 새로운 모델들을 푸는 대신 상업적 이용에는 수수료를 지불하게 하는 방향으로 노선을 변경하고 있음
  • 웹사이트(https://stablediffusionweb.com/)에서 크레딧으로 이미지를 생성할 수 있음

Stable Diffusion은 텍스트 및 이미지 프롬프트에서 고유한 사실적인 이미지를 생성하는 생성 AI 모델입니다. 이미지 외에도 비디오 및 애니메이션을 만드는 데에도 사용할 수 있습니다. Stable Diffusion은 확산 기술을 기반으로 하며 잠재 공간을 사용합니다. 잠재 공간을 활용함으로써 이미지 처리에 필요한 계산량을 줄여 GPU가 장착된 데스크톱이나 노트북에서도 모델을 실행할 수 있습니다. 또한 전이 학습을 통해 최소 5개의 이미지만으로도 특정 요구 사항에 맞게 모델을 미세 조정할 수 있어 높은 유연성과 사용자 정의 옵션을 제공합니다.

Stable Diffusion은 허용 라이선스에 따라 모든 사람이 사용할 수 있는 오픈 소스 모델입니다. 오픈 소스라는 특징 덕분에 사용자는 모델을 자유롭게 수정하고 재배포할 수 있습니다. Stable Diffusion은 텍스트-이미지, 이미지-이미지, 그래픽 아트워크, 이미지 편집 및 비디오 생성을 포함한 다양한 기능을 제공합니다. Stable Diffusion으로 비디오를 제작하는 방법에는 텍스트 프롬프트를 사용하는 방법과 다른 비디오를 활용하는 방법, 두 가지가 있습니다.

Flux

  • Black Forest Labs에서 개발한 오픈 소스 이미지 생성 모델
  • https://blackforestlabs.ai/
  • FLUX 1.1 Pro Ultra, FLUX.1.1 pro (최고 품질 유료 버전), FLUX.1 dev (비상업적), FLUX.1 schnell (Apache 2.0)

Flux는 등장하자마자 엄청난 성능으로 주목을 받았으며, 매개변수 120억짜리로 SD3 를 뛰어넘고, Midjourney 보다 낫다는 평가를 받고 있습니다. Flux 모델을 직접 사용할수도 있고, Flux 모델을 제공하는 사이트가 여러 곳이 있으며, 대부분 구독이 필요합니다.

Midjourney

  • 유료 구독이 필요하며, Flux 에 밀리는 듯 했으나 최근 유용한 기능들을 업데이트 하면서 사용자를 꾸준히 확보하고 있음
  • 캐릭터 및 스타일 레퍼런스로 일관성을 확보가 가능하고, 특히 개인화 스타일 기능을 통해 보다 쉽게 고품질의 이미지 생성 가능
  • https://www.midjourney.com/

Midjourney는 구독 서비스를 통해 제공되며, 사용자는 Discord 서버에 가입하고 봇 명령을 사용하여 이미지를 생성할 수 있습니다. 최근에는 웹사이트에서도 이미지 생성이 가능해졌으며, 다양한 기능들을 쉽게 사용할 수 있도록 제공합니다.

Google Image FX

Google ImageFX는 Google에서 개발한 실험적인 AI 이미지 생성 도구입니다. 텍스트 프롬프트를 사용하여 다양한 스타일의 이미지를 생성할 수 있으며, 사용자가 이미지를 편집하고 수정할 수 있는 다양한 기능을 제공합니다. 무료로 제공하는 대신 일일 생성 한도가 있습니다. 생성된 이미지는 저장해주세요.

  • 생성형 AI의 고질적인 문제인 손가락 표현도 매우 자연스러운 편
  • 프롬프트 중 다양한 요소들을 변경하기 쉽도록 셀렉트 박스로 제공하는 UX 제공

이미지 생성 프롬프트

https://flux1.ai/image-to-prompt

영어로 프롬프트 작성해줘. 짧은 문장으로 끊어서 작성해줘. 자세하게 묘사해서 작성해줘.

기존 이미지 바탕으로 이미지 재생성하고 싶을 때:

이 이미지를 생성형 ai로 만들어줘. 영어로 프롬프트 작성해줘. 짧은 문장으로 끊어서 작성해줘. 자세하게 묘사해서 작성해줘. DALL·E에 최적화된 프롬프트 작성해줘.

다양한 예시

활용하면 좋은 화가 리스트

  • 반 고흐
  • 리 크래스너
  • 잭슨 폴록 (페인팅 액션)
  • Albert Bertelsen
리 크래스너 작가의 화풍을 적용해줘. 작가 이름도 프롬프트에 첨가해줘. 
Albert Bertelsen 작가의 화풍에 대한 이미지 생성 프롬프트를 작성해줘.

고급 그래픽:

Create an artistic image with a harmonious blend of styles. Use a balanced and modern profile with smooth transitions between details. Emphasize stylistic elements with a style weight of 500 , ensuring a vivid but not overly abstract appearance. Maintain a level of stylization at 500 to achieve a perfect balance between realism and artistic creativity. Render the image with a polished and refined approach, similar to advanced rendering techniques for modern art generation.