AI 하나가 텍스트·이미지·영상을 동시에 만든다

AI 영상 생성 스타트업 Luma가 크리에이티브 작업 전 과정을 처리하는 AI 에이전트 플랫폼 ‘Luma Agents’를 출시했습니다. 텍스트, 이미지, 영상, 오디오를 하나의 시스템에서 기획부터 완성까지 처리한다는 점에서, 기존의 단일 기능 AI 도구들과 결이 다릅니다.

AI 크리에이티브 에이전트가 멀티모달 콘텐츠를 생성하는 컨셉, AI generated
Luma Agents는 텍스트·이미지·영상·오디오를 하나의 시스템에서 처리합니다

하나의 모델이 모든 포맷을 이해합니다

Luma Agents의 핵심은 Unified Intelligence라는 새로운 아키텍처입니다. 기존 AI 워크플로우는 텍스트 생성 모델, 이미지 생성 모델, 영상 생성 모델을 각각 호출하고 결과를 이어붙이는 방식이었습니다. Luma는 이 접근을 완전히 바꿨습니다.

Uni-1이라는 첫 번째 모델은 텍스트, 이미지, 영상, 오디오, 공간 추론을 단일 아키텍처에서 처리합니다. 별도 모델을 체이닝하는 게 아니라, 하나의 멀티모달 추론 시스템이 모든 포맷을 이해하고 생성합니다. 이 구조 덕분에 에이전트가 “30초 광고 영상을 만들어줘”라는 지시를 받으면, 스크립트 작성 → 이미지 생성 → 영상 편집 → 오디오 합성까지 스스로 계획하고 실행할 수 있습니다. 실제로 한 광고 에이전시는 1,500만 달러(약 210억 원) 규모의 1년짜리 캠페인을 40시간, 2만 달러(약 2,800만 원)에 처리했습니다.

기존에 Cursor가 코딩 에이전트 8개를 동시에 돌려 매출 2조를 찍은 것처럼, 크리에이티브 영역에서도 에이전트 기반 워크플로우가 본격화되고 있습니다.

Ray 3.14 — 네이티브 1080p에 3배 저렴해졌습니다

Luma Agents와 함께 공개된 영상 생성 모델 Ray 3.14도 주목할 만합니다. 이전 세대인 Ray 3 대비 핵심 수치가 크게 개선됐습니다.

항목 Ray 3 Ray 3.14
해상도 720p 네이티브 1080p
비용 기준가 3배 저렴
속도 기준 4배 빠름
특징 최초 추론 영상 모델 빠른 모션 + 초현실적 디테일

네이티브 1080p라는 점이 중요합니다. 720p를 업스케일하는 게 아니라 처음부터 1080p로 생성한다는 의미입니다. 유튜브나 인스타그램에 바로 올릴 수 있는 품질이 기본으로 나옵니다.

AI 크리에이티브 도구를 사용하는 여성, AI generated
Luma Agents는 기획부터 완성까지 하나의 시스템에서 처리합니다

외부 AI 모델까지 지휘합니다

Luma Agents가 단순한 영상 생성 도구가 아닌 이유가 여기 있습니다. 자사 모델(Ray 3.14)뿐 아니라 외부 AI 모델도 조율합니다. 현재 연동된 모델 목록입니다.

  • 구글 Veo 3 — 영상 생성
  • Nano Banana Pro — 이미지 생성
  • ByteDance Seedream — 이미지 생성
  • ElevenLabs — 음성 합성

에이전트가 작업 계획을 세우고, 각 단계에 가장 적합한 모델을 자동으로 선택해서 실행합니다. 예를 들어 광고 스토리보드를 짜면서 이미지는 Seedream으로, 나레이션은 ElevenLabs로, 최종 영상은 Ray 3.14로 만드는 식입니다.

이 방식은 16개 AI 에이전트가 협업해서 C 컴파일러를 만든 사례와 비슷한 구조입니다. 하나의 에이전트가 모든 걸 하는 게 아니라, 전문 모델을 조율하는 ‘지휘자’ 역할을 합니다.

아디다스, 마쓰다가 이미 쓰고 있습니다

Luma Agents는 출시와 동시에 글로벌 광고 에이전시와 브랜드에 투입됐습니다.

  • 퍼블리시스 그룹 (중동·터키) — 글로벌 4대 광고 에이전시
  • 서비스플랜 그룹 — 유럽 최대 독립 에이전시
  • 아디다스 — 브랜드 콘텐츠 제작
  • 마쓰다 — 자동차 광고
  • Humain — 사우디 AI 기업

이 기업들이 테스트가 아니라 실무에 투입했다는 점이 의미 있습니다. 광고 에이전시는 납기와 품질에 극도로 민감한 업종입니다. 그런 곳에서 AI 에이전트를 실전 배치했다는 것은, 최소한 “쓸 만한 수준”이라는 검증이 된 셈입니다.

크리에이터에게 이게 왜 중요한가

지금까지 AI 크리에이티브 도구는 분절돼 있었습니다. ChatGPT로 카피를 쓰고, Midjourney로 이미지를 만들고, Runway로 영상을 생성하고, ElevenLabs로 나레이션을 붙이고. 각 도구가 훌륭하지만, Google Flow로 이미지와 영상을 만들어봤을 때도 느꼈듯이, 도구 사이를 오가는 시간이 전체 작업의 절반 이상을 차지합니다.

Luma Agents는 이 과정을 하나로 묶으려는 시도입니다. “완성된 30초 광고를 만들어줘”라는 한 줄 지시로 끝까지 가겠다는 것입니다. 물론 현 시점에서 완전 자동화는 어렵겠지만, 방향성은 명확합니다. AI 크리에이티브 도구의 경쟁은 이제 “더 좋은 이미지”가 아니라 “더 완성된 워크플로우”에서 갈립니다.

현재 Luma는 프리미엄 구조로 운영되며, lumalabs.ai에서 접속할 수 있습니다. 무료 플랜(영상 8건, 비상업적 용도), Lite($7.99/월, 50건), Plus($23.99/월, 160건, 상업적 사용 가능)로 나뉩니다.

멀티모달 AI 영상 제작 파이프라인 컨셉, AI generated
AI 크리에이티브 도구의 경쟁은 이제 워크플로우에서 갈립니다

댓글 남기기