프리미어 열 때마다 포기했다면, Vrew부터 시작하세요

영상 편집, 나는 왜 항상 포기했을까

영상 편집을 배워야겠다고 마음먹은 게 벌써 몇 번째인지 모릅니다. 유튜브 채널 하나쯤 운영해보고 싶다는 생각은 늘 있었는데, 막상 어도비 프리미어를 열면 타임라인이 화면을 가득 채우고, 단축키 외우다가 지쳐서 결국 닫아버리는 일을 반복했습니다. Final Cut Pro도 마찬가지였어요. 직관적이라는 말은 맞는데, ‘기초’를 익히는 데만 며칠이 걸렸습니다. 컷 편집, 자막 넣기, 음악 깔기 — 이 세 가지만 할 줄 알아도 된다는데, 그 세 가지가 생각보다 쉽지 않았죠.

그러던 어느 날 지인이 한마디 던졌습니다.

“촬영도 안 했는데 영상이 만들어진다는데, 써봤어?”

솔직히 반신반의했습니다. AI로 영상 만든다는 툴이 한두 개가 아니고, 써볼 때마다 결과물이 어딘가 어색하거나 쓸 수 있는 기능이 너무 제한적이었거든요. 근데 이번엔 좀 달랐습니다. 추천받은 게 Vrew, 한국 스타트업이 만든 AI 영상 편집기였습니다.

Vrew는 보이저엑스(VoyagerX)라는 회사가 만들었습니다. 대표는 남세동 씨 — 네이버, 카카오 등을 거쳐 AI 스타트업을 창업한 분입니다. 국내에서 AI 기반 영상 편집 도구로 꽤 이름이 알려져 있었는데, 저는 이름만 들어봤지 한 번도 제대로 써본 적이 없었어요. 2026년 현재 버전은 3.8.0이고, Windows, macOS, Ubuntu는 물론 웹 브라우저에서도 사용할 수 있습니다. 설치는 5분도 걸리지 않았습니다.

“새로 만들기”를 눌렀더니

앱을 처음 실행하면 시작 화면에 “새로 만들기” 버튼이 보입니다. 눌렀더니 선택지가 다섯 가지 나왔어요.

첫 번째, 텍스트로 비디오 만들기. 이걸 보는 순간 멈췄습니다. 영상을 편집하는 툴인 줄 알았는데, 텍스트를 입력하면 영상이 된다는 건 조금 다른 이야기입니다. 촬영 없이, 편집 없이, 글만 써서 영상을 만든다는 뜻이니까요.

두 번째, 영상에서 자막 만들기. 기존에 촬영한 영상 파일을 올리면 AI가 음성을 인식해서 자막을 자동으로 달아줍니다. 자막 싱크 맞추는 작업이 얼마나 고된 일인지 해본 사람은 알 텐데, 이게 자동으로 된다는 것만으로도 진입장벽이 절반은 낮아집니다.

세 번째, 원고 불러오기. 미리 써둔 스크립트 파일을 불러오면 Vrew가 이를 기반으로 영상 구조를 잡아줍니다. 네 번째, PDF로 비디오 만들기. 강의 자료나 발표 슬라이드를 영상으로 변환해줍니다. 별도 녹화 없이요. 다섯 번째, 숏폼 템플릿. 유튜브 쇼츠, 릴스, 틱톡 같은 세로형 단편 영상을 빠르게 만들 수 있는 옵션입니다.

이게 전부 무료인 게 맞나, 싶었습니다. 아직 아무것도 해보지 않은 상태였는데, 메뉴만 훑어보는 것만으로 “이것도 되고 저것도 되네?” 하는 감탄이 절로 나왔습니다.

텍스트 한 줄로 영상이 나왔다

첫 번째로 건드린 건 ‘텍스트로 비디오 만들기’였습니다. 주제 한 줄을 입력하면 AI가 대본을 짜고, 이미지를 붙이고, 음성 나레이션까지 입혀서 영상 하나를 통째로 만들어줍니다.

반신반의하며 “스마트폰 카메라 잘 찍는 법”이라고 입력했습니다. 30초도 안 돼서 대본이 완성됐고, 각 문장에 맞는 이미지가 자동으로 붙었습니다. AI 음성이 입혀진 영상 미리보기가 떴을 때, 잠깐 멍했습니다. 촬영 0분, 편집 0분인데 영상이 나왔다.

무료 플랜 기준 회당 3,000자까지 입력할 수 있는데, 이게 실제로는 약 8~12분 분량의 영상이 됩니다. 쇼츠 한두 편이 아니라 제대로 된 중편 영상이 텍스트 몇 줄로 나오는 셈입니다. 대본이 마음에 안 들면 “다시 쓰기” 버튼을 누르면 AI가 새로운 버전을 만들어주고, 직접 수정하는 것도 자유롭습니다. 이미 써둔 원고가 있다면 붙여넣기만 하면 되니, 블로그 글을 영상으로 변환하는 용도로도 바로 쓸 수 있습니다.

이미지 스타일도 선택할 수 있습니다. 실사 사진 느낌, 애니메이션, 수채화 등 비디오 스타일을 고르면 전체 영상의 톤이 바뀝니다. 색상 톤도 자유롭게 조정되니, 채널 분위기에 맞는 영상을 처음부터 잡고 시작할 수 있어요. TTS 음성도 300가지 이상 중에서 고르는데, 한국어만 65개가 넘습니다. 여성, 남성, 어린이, 어르신 기본 분류에, 홈쇼핑 스타일이나 이북 내레이터 같은 특화 목소리까지 있습니다.

자막 지우면 영상이 잘린다

두 번째 기능에서 진짜 놀랐습니다. 기존 영상을 올리면 음성을 인식해서 자막으로 변환해주는데, 여기까지는 다른 서비스와 비슷해요.

Vrew의 핵심은 그 다음입니다. 자막 텍스트를 지우면 그 구간의 영상이 통째로 삭제됩니다. 10분짜리 인터뷰 영상을 올렸더니 2분 만에 자막이 완성됐고, “음…” “그러니까…” 같은 군더더기 부분의 자막을 드래그해서 Delete를 눌렀습니다. 영상에서 그 부분이 딱 잘려나갔습니다. 이건 좀 다르다. 컷편집을 타임라인에서 하는 게 아니라 문서에서 한다는 개념, 이게 Vrew만의 차별점입니다.

무음 구간도 자동으로 잡아냅니다. 팟캐스트 녹음이나 강의 영상에서 “어…” 하고 멈추는 구간을 AI가 감지해서, 클릭 한 번이면 전체 무음 구간을 일괄 삭제할 수 있습니다. 10분짜리 영상의 템포를 잡는 데 프리미어에서는 30분 이상 걸리던 작업이, Vrew에서는 문자 그대로 클릭 한 번입니다.

AI 이미지, 캐릭터, 내 목소리까지

이미지도 직접 구할 필요 없습니다. 자막 내용을 분석해서 AI가 장면에 맞는 이미지를 자동 생성합니다. 스타일이 15가지나 돼서 실사 사진부터 수채화, 만화, 추상화까지 고를 수 있어요. 저작권 걱정도 없습니다. 외부 스톡 사이트에서 라이선스 확인하며 하나씩 고르던 번거로움이 사라집니다. 예전에 나노바나나로 AI 이미지를 생성해본 적이 있는데, Vrew는 영상 편집 안에서 이미지 생성까지 한 번에 해결된다는 점이 다릅니다.

유튜브를 하고 싶은데 얼굴 노출이 꺼려지는 분들에게는 AI 캐릭터 기능이 솔깃할 겁니다. 캐릭터를 선택하면 텍스트 대본에 맞춰 입 모양이 자동으로 동기화되면서 말하는 영상이 만들어집니다. 사람, 동물 등 캐릭터 종류도 여럿이라 채널 콘셉트에 맞게 고를 수 있습니다. 정보성 채널이라면 이 기능만으로도 얼굴 없이 꾸준히 업로드하는 구조가 가능합니다.

가장 인상적이었던 건 ‘내 목소리 AI’입니다. 약 30문장을 읽어서 녹음하면 — 10분 남짓이면 됩니다 — 내 목소리를 학습한 AI 음성 모델이 만들어집니다. 이후엔 텍스트만 입력하면 내 목소리로 나레이션이 나와요. 매번 녹음 부스를 찾거나 목 상태를 걱정할 필요가 없습니다. 대본을 수정할 때마다 전체를 다시 녹음하던 시절이 끝나는 겁니다. 속도, 음량 조절은 물론 에코나 전화음 같은 효과까지 입힐 수 있어서, 강의용이나 브랜딩용 나레이션을 만들기에 충분합니다.

무료로 어디까지 되는가

“좋다는 건 알겠는데, 돈 내야 하는 거야?”

결론부터 말씀드리면, 무료로도 꽤 쓸 만합니다. 구체적으로 정리하면 이렇습니다.

기능	무료 (Free)	Light (9,900원)	Standard (17,900원)
AI 음성(TTS)	월 10,000자	월 100,000자	월 500,000자
AI 이미지	100크레딧	1,000크레딧	5,000크레딧
텍스트에서 영상	회당 3,000자	회당 10,000자	제한 완화
자막 생성	120분	1,200분	6,000분
번역	30,000자	300,000자	1,500,000자
워터마크	있음	없음	없음
클라우드	없음	10GB	50GB

유튜브 쇼츠나 5분짜리 영상 한두 편 만드는 데는 무료로 충분히 돌아갑니다. TTS 10,000자면 약 30분 분량의 나레이션이고, 텍스트 영상 3,000자면 약 10분짜리 완성 영상 하나가 나옵니다.

워터마크가 붙지만, ‘Made with Vrew’ 출처 표기를 신청하면 1개월 무료 제거도 가능합니다. 그리고 중요한 건 무료 플랜도 상업적 사용이 가능하다는 점입니다. 유튜브 수익 창출 채널에 올려도 문제없습니다. 무료 에셋도 이미지 10만 개, 영상 수천 개, 배경음악 200개, 효과음 1,000개, 폰트 100개가 모두 상업적 사용 가능입니다.

영상 제작 빈도가 높아지면 Light(9,900원)에서 자연스럽게 넘어가게 됩니다. AI 음성이 월 100,000자로 늘어나는 게 가장 체감이 큽니다.

CapCut, Canva, 클로바더빙과 뭐가 다른가

비슷한 도구가 여럿인데, 어떤 상황에 어떤 걸 쓰면 좋은지 정리해봤습니다.

CapCut은 트렌디한 효과와 필터가 풍부하고 모바일에서 직관적입니다. 유행하는 사운드나 인트로 효과를 자주 쓰는 숏폼 크리에이터에게 강합니다. 하지만 한국어 자막 처리나 텍스트 기반 편집에서는 Vrew가 비교가 안 될 만큼 편합니다.

Canva Video는 브랜드 키트와 팀 협업이 장점입니다. 마케팅 팀에서 브랜드 일관성을 유지하면서 여러 명이 함께 콘텐츠를 만들어야 하는 상황이라면 Canva가 낫습니다. 하지만 “내가 직접 말하는 영상을 텍스트 기반으로 빠르게 편집하고 싶다”는 상황에서는 Vrew의 방식이 훨씬 직관적입니다.

클로바더빙은 한국어 TTS 품질 자체에 집중할 때 경쟁력이 있습니다. 이전에 클로바노트와 다글로를 비교해본 적이 있는데, 음성 AI 도구는 용도에 따라 최적이 다릅니다. 강의 더빙이나 오디오북처럼 음성만 뽑아내는 용도라면 클로바더빙을 따로 쓰는 게 나을 수 있지만, Vrew는 음성 + 자막 + 영상 + 이미지까지 한 화면에서 올인원으로 처리합니다.

한마디로 정리하면, Vrew의 포지션은 “문서 편집하듯 영상을 만드는 도구”입니다. 타임라인을 다루거나 트랙을 쌓는 전통적인 편집 방식이 낯선 분들에게, 한국어 콘텐츠를 중심으로 작업하는 분들에게 특히 잘 맞습니다. 번역 기능도 100개 이상 언어를 지원하고, GPT 기반 번역과 Google 번역 두 가지 엔진을 제공하기 때문에, 한국어로 만든 영상에 영어 자막을 붙여 해외 시청자까지 노리는 것도 가능합니다.

시작 전에 알아둘 것

한 가지 미리 알아두셔야 할 게 있습니다. Vrew 모바일 앱이 2026년 7월 1일부로 서비스를 종료합니다. iOS와 Android 모두 해당됩니다. 보이저엑스 측은 데스크톱 중심 전략으로 전환한다고 밝혔는데, 실제로 주요 기능은 이미 PC에서 훨씬 잘 돌아갑니다. 스마트폰으로만 작업하시던 분들은 미리 PC 환경으로 전환하실 준비가 필요합니다. PC가 없더라도 웹 브라우저 버전으로 기본 기능을 체험할 수 있으니, 일단 설치 없이 써보는 것도 방법입니다.

그리고 프리미어 프로나 다빈치 리졸브 같은 정교한 트랜지션이나 고급 색보정을 기대하신다면, Vrew는 그 방향의 도구가 아닙니다. Vrew가 잘하는 건 콘텐츠 완성 속도이지, 영상 퀄리티의 극한이 아닙니다. 다만 Vrew에서 작업한 결과를 XML 형식으로 내보내서 Premiere Pro나 DaVinci Resolve에서 마무리하는 워크플로우도 가능합니다. 기본 구조는 Vrew에서 빠르게 잡고, 정밀 편집은 전문 도구에서 하는 방식이죠. 10만 개 이상의 무료 에셋(이미지, 영상, 배경음악, 효과음, 폰트)과 AI 기능으로 빠르게 완성하는 데 최적화된 도구라고 보시면 됩니다.

영상 편집 처음이라면, 여기서 시작하세요

영상 편집을 처음 시작하는 분, 자막 작업이 지겨운 유튜버, 강의나 설명 영상을 주기적으로 만들어야 하는 분, 아직 영상에 예산을 쓰기 부담스러운 1인 크리에이터라면 Vrew가 확실히 좋은 출발점입니다. ChatGPT를 처음 켜본 순간처럼, Vrew도 “이런 게 가능했어?” 하는 순간이 옵니다.

타임라인이 어렵고, 프리미어가 무섭고, 그냥 내 말을 영상으로 만들고 싶다면 — 지금 당장 Vrew부터 열어보세요. 설치부터 첫 영상 완성까지 30분이면 충분합니다. 무료 플랜으로도 유튜브 수익 창출이 가능하고, 10분짜리 영상을 매달 만들 수 있는 수준이니 부담 없이 시작해볼 수 있습니다.

다음 편에서는 Vrew로 실제 강의 영상을 처음부터 끝까지 만들어봅니다. 슬라이드 구성부터 TTS 음성 선택, 원하는 길이에 맞추는 법까지 — 촬영 0분으로 영상 완성하는 전 과정을 공유합니다.