Stable Diffusion 은 2022년 스타트업 stabilityAI 에서 출시한 딥 러닝 텍스트-이미지 모델의 이름이자 사이트 입니다.
쉽게 이야기하자면 AI가 텍스트명령만 넣으면 그림을 그려주는 오픈소스 프로그램이라고 할 수 있습니다.
기존의 AI 딥 러닝은 일론 머스크가 설립한 인공지능 연구소가 개발한 DALL-E가 선두주자 였지만 달리와의 차이점이 있다면 저와같은 문과출신도 쉽게 쓸 수 있도록 모든 코드를 공개적으로 배포했다는 것입니다.
이 프로그램은 256개의 Nvdivia A100 그래픽카드를 사용해서 약 15만 gpu시간동안 연산시켰고 총 비용은 60만달러 약 9억정도 쓴 프로젝트를 무료로 푼 것입니다.
별거아니라고 생각하실 수 있겠지만 큰 기업도 10억짜리 프로젝트를 모든 사용자에게 무료배포하기는 쉽지 않겠죠
사용방법은 매우 간단합니다.
깃허브와 같은 오픈 소스를 공개하는 사이트인 허킹페이스에서 stable-diffusion 만 검색하면 끝나는데요 혹시나 어려우실 분들을 위해서 링크걸어두겠습니다
https://huggingface.co/CompVis/stable-diffusion-v1-4
하지만 비 전공자들은 이렇게 배포하더라도 어떻게 사용할 지 모를것이다 라는 생각으로 컴퓨터에 설치하지않고 이 프로그램은 웹상에서 이용할 수 있는 방법이 있습니다
구글 코렙을 이용하는 건데요 간단합니다
제가 걸어드린 링크를 따라 클릭합니다
https://colab.research.google.com/drive/1LMFa6UOqGrV1sAz-EabFeLQ_MrGR6KwC
그럼 이런 화면이 뜨실 텐데요
구글 드라이브 복사로 들어갑니다
그럼 나의 구글 아이디와 연계되어 프로그램을 사용할 수 있게 됩니다
이제 모든 준비가 끝났습니다 내용만 넣어주면 되는데요
아직 오픈ai 소스라 불안정해서 다른곳은 건드릴것이 없고 우리가 손봐야할 곳은 2군대밖에 없습니다
image_upsacler와
prompt 입니다
우선 image_upsacler는 우리가 어떤 방식으로 그림을 구성할 것인가 인데 옵션을 보시면
gfpgan- 사람 얼굴을 사람같이
esrgan - 이미지의 사이즈를 확대
원하는 이미지에 사람얼굴이 있다면 (gfp-esr)
요것만 기억하지면 됩니다
그리고 마지막으로 TEXT_Prompt에 어떤 그림을 원하는지 단어를 넣어주시면 됩니다
이제 원하는 단어와 형식으로 AI에게 그림을 그려달라고 명령을 내려야하죠?
SHIFT + ENTER를 누르시던지 아래그림과 같은 재생버튼을 누르면 이제 끝입니다
아직 좀 불안정한 단계이기도 하고 내 컴퓨터로 연산하는 것이 아니기때문에 시간은 5-10분정도 걸리는 것 같지만
오늘은 단어로 그림을 한번 그려보는것도 나쁘지 않을것 같습니다
어떤 단어로 어떤설정을 하면 멋있는 그림이 나오는지는 다음 글에서 자세하게 설명드리겠습니다
'IT' 카테고리의 다른 글
Stable Diffusion AI가 그린그림 PROMPT 단어 고르는법 (0) | 2022.10.08 |
---|
댓글