본문 바로가기
AI 트렌드/생성형 인공지능

[Pika.art] 텍스트나 이미지로 AI 동영상 만드는 방법

by Patrick_WI 2024. 1. 16.
728x90

AI 동영상 제작 사이트 Pika.art

Pika는 AI 기술을 활용해 동영상을 제작하는 플랫폼으로 디스코드와 사이트에서 이용 가능합니다. 저는 Pika.art 사이트를 통해서 AI 동영상을 만드는 방법에 대하여 설명할게요. 사용자가 입력한 prompt를 토대로 간단한 AI 동영상을 만들 수 있고, 텍스트뿐 아니라 이미지나 동영상도 Parameter로 입력할 수 있어서 원하는 영상을 더 자유롭게 생성할 수 있는 게 장점이고, 무엇보다 다른 방법보다 무척 간단합니다.

 

Pika

An idea-to-video platform that brings your creativity to motion

pika.art

 

Pika.art로 AI 비디오 만들기

먼저, Pika의 메인화면입니다. 다른 사람들이 생성한 AI 비디오를 탐색할 수 있는 Explore 탭과 제가 만든 작품을 볼 수 있는 My library 탭이 존재하고 하단에 동영상 생성을 위한 prompt 입력창이 있습니다.

Pika.art main 화면

 

저는 미켈란젤로의 천지창조에 생동감을 불어 넣기로 했습니다. 뭔가 둥실둥실 떠 있는 느낌을 주고, 두 사람이 점점 더 가까워지는 느낌을 동영상으로 표현하면 좋을 것 같네요. 우선은 저작권이 자유로운 천지창조 이미지를 다운로드하고, prompt 입력 UI의 하단 첨부파일 업로드 버튼을 클릭해서 업로드해 줍니다. 

미켈란젤로의 '천지창조'

 

그리고 적당한 prompt를 입력해 동영상으로 표현하고 싶은 장면을 묘사합니다. 다른 사람들의 비디오나 후기를 봤을 때, 단어 위주보다는 문장으로 설명하는게 더 잘 작동한다고 하네요. Base image가 있으니까 외형 묘사 등은 생략하고, 간단하게 프롬프트를 입력해 줍니다. (참고로 최대 입력 가능한 prompt의 길이는 500자 정도라고 하네요)

pika의 prompt 입력창

 

약간의 시간이 걸리고 나서 My library 탭에 제가 만든 AI 동영상이 업데이트 됩니다. 바람에 흩날리는 머리와 수염이 인상적이고, 미세하게나마 점점 손가락이 가까워지는 것 같네요. 고개를 움직이는 동작이 살짝 불쾌한 골짜기 느낌도 나지만, 간단하게 만든 영상치고는 굉장히 퀄리티가 만족스럽게 느껴집니다.

Pika로 움직이게 만든 '천지창조'

 

Pika 더 잘 이용하는 방법

다른 이미지 생성 툴과 같이 pika도 동영상 결과물을 조절할 수 있는 몇 가지 기능을 더 지원합니다. 화면의 비율 조정, 카메라 무빙 제어, negative prompt 등등의 기능이죠. 이 기능들은 Prompt 입력창 우측에서 설정할 수 있습니다. 또, 이미 만든 동영상에서 4초를 더 연장할 수 있는데, 일관성을 유지하면서 영상의 길이를 늘일 수 있습니다.

 

Pika의 가격 정책은 3초의 동영상을 생성할 때마다 10credit이 차감되고, 30일마다 30 credit을 제공해 주는 형식입니다. 유료 요금제를 이용하면 더 많은 Credits 그리고 업스케일링 등 고급 기능 사용과 워터마크 제거가 가능합니다. 

Pika Pricing

 

Pika의 원리는 무엇일까? AI Video를 만드는 다양한 방법

Pika가 어떤 기술을 사용했는지 알기위해서는 NDA(비밀유지협약)에 서명해야 한다고 하네요, 즉 안 알려준다는 거죠. 설명에 따르면 공개된 기술이 아닌 독자적인 AI 비디오 만드는 기술을 보유하고 있다고 합니다. 

 

Pika 외에도 AI 이미지를 생성하는 여러 방법이 존재하고는 있습니다. Image generator와 controlnet 등을 이용해 연속동작을 한 프레임씩 생성하는 방법. 이를 응용해 원본 video에서 Image와 controlnet을 추출하는 Animatediff로 V2V 동영상을 만드는 시도도 많이 이뤄지고 있습니다. 아마 이전에 소개해드린 Anyone Animate도 이 방법을 응용한 게 아닌가 추측됩니다.

 

AI 동영상 제작의 특이점? Animate anyone 알아보기

알리바바에서 발표한 신기술 Animate anyone은 정지된 이미지로부터 캐릭터에게 모션을 적용하여 비디오를 생성하는 프레임워크입니다. 한 장에 이미지에서 복잡한 외형 일관성을 유지하고, Openpose

patrick-wi.tistory.com

 

또 다른 접근법은 "Drag Your Gan" 논문의 방법입니다. 아마 제 추측으로는 Pika.art나 메타의 Emu는 이 방향으로 접근한 게 아닐까 싶네요. Stable diffusion보다 높은 일관성을 유지하는게 특징인데 자세한 원리는 저도 잘 모르겠습니다. 한 번 관심이 있다면 여러 가지 AI Video 생성 방법에 대해 조사해 보고 사용해 보는 것도 좋을 것 같습니다.

Drag Your Gan

 

Emu Video

Factorizing Text-to-Video Generation by Explicit Image Conditioning

emu-video.metademolab.com

728x90