AI 일상활용·경험/AI 실전팁(영상)_#5

[AI실전팁 43편] 움직임을 만드는 언어 '동사(Verb)' - 멍 때리는 영상을 구출하라

@태백감자 2025. 12. 19. 15:15
반응형

📝 오늘의 핵심 요약

  • 문제: 영상 AI에게 이미지 프롬프트(형용사 위주)를 그대로 넣으면, 눈만 깜빡이는 '움직이는 사진'이 나옵니다.
  • 원리: 이미지는 형용사(Adjective)로 묘사하지만, 영상은 동사(Verb)로 지시해야 합니다.
  • 해법: "Zoom in", "Pan right", "Running", "Exploding" 등 구체적인 물리적 움직임을 명령하세요.

"가만히 서 있는 배우에게 연기상을 주진 않습니다. AI에게 '액션!'을 외치세요."

지난 Ep 42에서 우리는 가성비 좋은 영상 AI, 구글 Veo 모델을 준비했습니다. (지난 5월부터 'Flow'라는 이름으로 서비스명이 통합되었죠?)

크레딧도 빵빵하겠다, 야심 차게 첫 프롬프트를 넣어봅니다. 예전에 Ep 30에서 배웠던 고퀄리티 이미지 프롬프트를 그대로 복사해서 넣었죠.

"아름다운 사이버펑크 도시, 네온사인, 8k 해상도, 고화질..."

결과는 어땠나요? 아마 기대와 달랐을 겁니다. 건물은 가만히 있고, 네온사인만 깜빡거리거나 지나가는 사람 한두 명만 흐물거리는 영상. 이건 영상이 아니라 '살아있는 사진(Live Photo)'에 가깝습니다.

왜 이런 일이 벌어질까요? AI에게 '어떻게 움직이라'는 말을 안 해줬기 때문입니다.

•••

원리: 묘사(Description) vs 행동(Action)

이것이 이미지 생성과 영상 생성의 가장 결정적인 차이입니다.

  • 이미지 (Midjourney, DALL-E): 상태를 묘사합니다. (예: 예쁜, 웅장한, 거대한, 낡은) → 형용사(Adjective)의 영역
  • 영상 (Flow, Sora, Runway): 변화를 지시합니다. (예: 달리는, 터지는, 다가가는, 줌인하는) → 동사(Verb)의 영역

여러분이 영화감독이라고 상상해 보세요. 배우에게 "자, 넌 정말 아름답고 슬픈 표정이야. 레디 액션!"이라고만 하면 배우는 가만히 서서 표정 연기만 할 겁니다. "달려와서 카메라를 쳐다봐!"라고 동사를 줘야 움직임이 생깁니다.

실전: Flow를 깨우는 3가지 동사

영상 프롬프트에 반드시 포함되어야 할 동사는 크게 세 가지 카테고리로 나뉩니다.

1. 카메라 무빙 (Camera Movement)

피사체가 가만히 있어도 카메라가 움직이면 영상은 역동적으로 변합니다. 가장 기초적이지만 효과적인 기술입니다.

🎥 필수 카메라 명령어:
  • Zoom in: 카메라가 피사체로 다가감 (집중, 긴장감)
  • Zoom out: 카메라가 뒤로 빠짐 (배경 노출, 개방감)
  • Pan Right/Left: 고개를 돌리듯 좌우로 훑음 (풍경 묘사)
  • Drone shot / Aerial view: 하늘을 나는 듯한 시점 (광활함)

2. 피사체 행동 (Subject Action)

주인공을 움직이게 만드세요. 단순히 "A car(자동차)"라고 쓰지 말고 "A car drifting(드리프트하는 자동차)"이라고 써야 합니다.

추천 동사: Running(달리는), Dancing(춤추는), Eating(먹는), Fighting(싸우는), Melting(녹아내리는), Exploding(폭발하는)

⚠️ 주의사항:
너무 복잡한 행동(예: "달리면서 햄버거를 먹다가 뒤돌아보며 윙크함")은 AI가 꼬일 수 있습니다. 보통 생성되는 영상 길이가 4~8초 내외로 짧기 때문에, 하나의 명확한 행동(One Action)만 지시하는 것이 깔끔합니다.

3. 환경 효과 (Environment Physics)

배경도 움직여야 진짜 영상입니다. 바람, 비, 빛의 움직임을 추가하세요.

추천 표현: Wind blowing hair(머리카락이 바람에 날리는), Rain pouring(비가 쏟아지는), Clouds moving fast(구름이 빠르게 흐르는)

응용: 형용사를 동사로 바꾸기

자, 이제 프롬프트를 고쳐봅시다. 처음에 실패했던 그 프롬프트를 '동사형'으로 리모델링하는 과정입니다.

Before (이미지용):
"아름다운 사이버펑크 도시, 네온사인, 비 오는 거리"

After (영상용):
"[Drone shot] flying through a cyberpunk city. Neon signs [flickering]. Rain [pouring] heavily on the street."
(드론샷으로 도시를 관통하며 비행. 네온사인은 깜빡거리고, 비가 세차게 쏟아짐.)

어떤가요? 머릿속에 그려지는 영상의 밀도가 다릅니다. AI는 우리가 입력한 동사를 단서로, 학습했던 수많은 영상 속의 움직임 패턴을 흉내(Simulation)냅니다. 정확한 동사를 줄수록 더 그럴싸한 패턴을 만들어내죠.

Outro: 물리 법칙을 깨우세요

이제 여러분의 영상은 더 이상 멈춰 있지 않을 겁니다. 줌인하고, 달리고, 비바람이 몰아칠 것입니다. 하지만 움직임이 생겼다고 해서 끝이 아닙니다. 그 움직임이 '진짜(Real)' 같아야 합니다.

자동차가 달리긴 하는데 바퀴가 땅에 안 닿아 있거나, 물이 거꾸로 흐른다면 몰입감이 깨지겠죠? 다음 시간에는 움직임에 현실감을 불어넣는 Ep 44. 현실감을 만드는 법칙 '물리(Physics)'에 대해 알아보겠습니다. 중력과 마찰력을 프롬프트에 담는 법을 준비해 오겠습니다.

💡 Action Item:

지금 당장 Google Labs의 'Flow'에 접속해서 딱 한 단어만 바꿔보세요.
"Coffee(커피)" 대신 "Pouring Coffee(커피를 따르는)"라고 입력해 보세요.
그 한 단어가 만들어내는 역동성의 차이를 직접 눈으로 확인하세요.

반응형