본문 바로가기
IT

Stable Diffusion 스테이블 디퓨전 AI가 그림을 그려준다고??

by ↔↔↔sa▒ 2022. 10. 6.
728x90
반응형

Stable Diffusion 은 2022년 스타트업 stabilityAI 에서 출시한 딥 러닝 텍스트-이미지 모델의 이름이자 사이트 입니다.

쉽게 이야기하자면 AI가 텍스트명령만 넣으면 그림을 그려주는 오픈소스 프로그램이라고 할 수 있습니다. 

 

 

기존의 AI 딥 러닝은 일론 머스크가 설립한 인공지능 연구소가 개발한 DALL-E가 선두주자 였지만 달리와의 차이점이 있다면 저와같은 문과출신도 쉽게 쓸 수 있도록 모든 코드를 공개적으로 배포했다는 것입니다. 

 

이 프로그램은 256개의 Nvdivia A100 그래픽카드를 사용해서 약 15만 gpu시간동안 연산시켰고 총 비용은 60만달러 약 9억정도 쓴 프로젝트를 무료로 푼 것입니다.

별거아니라고 생각하실 수 있겠지만 큰 기업도 10억짜리 프로젝트를 모든 사용자에게 무료배포하기는 쉽지 않겠죠

 

사용방법은 매우 간단합니다.

 

깃허브와 같은 오픈 소스를 공개하는 사이트인 허킹페이스에서 stable-diffusion 만 검색하면 끝나는데요 혹시나 어려우실 분들을 위해서 링크걸어두겠습니다

 

https://huggingface.co/CompVis/stable-diffusion-v1-4

하지만 비 전공자들은 이렇게 배포하더라도 어떻게 사용할 지 모를것이다 라는 생각으로 컴퓨터에 설치하지않고 이 프로그램은 웹상에서 이용할 수 있는 방법이 있습니다 

 

구글 코렙을 이용하는 건데요 간단합니다

 

제가 걸어드린 링크를 따라 클릭합니다

https://colab.research.google.com/drive/1LMFa6UOqGrV1sAz-EabFeLQ_MrGR6KwC

 

Google Colaboratory Notebook

Run, share, and edit Python notebooks

colab.research.google.com

그럼 이런 화면이 뜨실 텐데요 

구글 드라이브 복사로 들어갑니다

그럼 나의 구글 아이디와 연계되어 프로그램을 사용할 수 있게 됩니다

 

 

이제 모든 준비가 끝났습니다 내용만 넣어주면 되는데요

 

아직 오픈ai 소스라 불안정해서 다른곳은 건드릴것이 없고 우리가 손봐야할 곳은 2군대밖에 없습니다

 

image_upsacler와

prompt 입니다 

 

우선 image_upsacler는 우리가 어떤 방식으로 그림을 구성할 것인가 인데 옵션을 보시면 

gfpgan- 사람 얼굴을 사람같이
esrgan - 이미지의 사이즈를 확대
원하는 이미지에 사람얼굴이 있다면 (gfp-esr)
요것만 기억하지면 됩니다 

그리고 마지막으로 TEXT_Prompt에 어떤 그림을 원하는지 단어를 넣어주시면 됩니다

 

이제 원하는 단어와 형식으로 AI에게 그림을 그려달라고 명령을 내려야하죠?

 

SHIFT + ENTER를 누르시던지 아래그림과 같은 재생버튼을 누르면 이제 끝입니다

아직 좀 불안정한 단계이기도 하고 내 컴퓨터로 연산하는 것이 아니기때문에 시간은 5-10분정도 걸리는 것 같지만

 

오늘은 단어로 그림을 한번 그려보는것도 나쁘지 않을것 같습니다

 

어떤 단어로 어떤설정을 하면 멋있는 그림이 나오는지는 다음 글에서 자세하게 설명드리겠습니다 

728x90
반응형

'IT' 카테고리의 다른 글

Stable Diffusion AI가 그린그림 PROMPT 단어 고르는법  (0) 2022.10.08

댓글