아이폰으로 회의록 자동화, 갤럭시보다 오히려 편했다

갤럭시 없는 분들을 위한 회의록 AI 대안

아이폰으로 회의록 자동화, 갤럭시보다 오히려 편했다 관련 워크스페이스, AI generated

AI 도구 탐험기 시리즈로, ChatGPT를 처음 만났던 그날부터 지금까지 제가 직접 써본 AI 도구들을 순서대로 기록하고 있습니다. 오늘은 그 시절 이야기입니다.

주변에 갤럭시 쓰는 동료들 보면 정말 부럽더라고요. 회의할 때 보면 참 여유로워 보이거든요. 저는 아이폰이라서 그런 기능이 없으니까요. 갤럭시에는 회의 내용을 실시간으로 받아 적어주는 녹음 기능이 기본 탑재되어 있어서, 동료들은 그냥 폰 하나 올려두면 끝이거든요. 저는 그게 그렇게 부러울 수가 없었습니다. 매번 회의 끝나고 “아까 뭐라고 하셨죠?” 하고 되묻는 게 너무 귀찮고 민망해서, 저도 어떻게든 회의록을 자동으로 남겨보려고 별의별 방법을 다 시도해봤습니다. 원래 호기심은 많고 성격은 게으른 편이라 자동화에 목숨을 거는 타입인데, 회의록만큼은 제 마음대로 잘 안 되더라고요. 디자이너 출신이다 보니 회의 중에는 시각적인 부분에 집중해야 하고, 머릿속으로는 디자인 시안을 그리느라 바쁜데 텍스트로 대화 내용까지 꼼꼼하게 기록하려니 뇌가 과부하에 걸리는 기분이었습니다. 특히 클라이언트가 참석하는 회의라면 더욱 그러워요. 상대방 표정을 읽고 분위기를 파악하면서 동시에 내용을 받아 적는다는 건, 솔직히 저한테는 너무 무리한 멀티태스킹이었거든요. 그래서 코딩 모르는 저도 쓸 수 있는 현실적인 대안을 찾아 나서게 됐습니다.

GPT 음성 모드로 떼쓰다 실패한 기록

가장 먼저 시도한 건 ChatGPT의 음성 모드였어요. 유료 결제해 둔 게 있으니 이거라도 제대로 써먹어야 하지 않겠습니까. 회의 시작하기 전에 GPT 앱을 켜서 “지금부터 회의 중이야”라고 프롬프트를 적어놓고, 당당하게 음성 모드를 켜서 스피커폰으로 회의를 진행했습니다. 속으로는 ‘드디어 나도 회의록 지옥에서 해방이구나’ 하면서 쾌재를 불렀죠.

처음엔 진짜 신세계였거든요. 제가 말하는 걸 GPT가 알아듣고 반응하는 게 보이니까 “와, 이거 되네?” 싶었어요. 마치 저만의 개인 비서가 생긴 것 같은 든든함마저 들었습니다. 회의에 참석한 다른 분들의 목소리도 척척 받아들이는 것 같아서, 회의가 끝나면 완벽하게 정리된 텍스트를 복사해서 붙여넣기만 하면 끝날 줄 알았습니다. 내심 이걸 팀원들한테도 소개해줄 생각까지 하고 있었으니까요.

근데 문제는 회의가 진행될수록 뭔가 단단히 꼬이기 시작하더라고요. 회의가 길어지니까 어느 순간부터 내용이 뚝뚝 잘리기 시작했습니다. 음성 인식의 한계인지, 아니면 제가 모르는 기술적인 장벽이 있는 건지 모르겠는데, 중간중간에 튕기기도 하고, 가장 중요한 결론 부분이 통째로 누락되기도 했어요. 여러 명이 동시에 말하거나 말이 겹치면 누구의 의견인지 구분도 제대로 못 하고, 회의에서 전혀 나오지 않은 엉뚱한 내용을 지어내서 적어놓기도 하더라고요. 이른바 AI 환각 현상인데, 회의록에서 이게 일어나면 단순한 불편함을 넘어서 실제로 업무상 오해나 실수로 이어질 수 있거든요. 회의가 끝나고 결과물을 확인했을 때의 그 당혹감이란 이루 말할 수 없었습니다. 완벽한 자동화를 꿈꾸는데, 오히려 제가 그 엉망진창인 결과물을 다시 수정하고 팩트 체크를 하느라 시간을 더 낭비하게 생겼으니까요. 게다가 회의 참석자들 앞에서 스피커폰으로 GPT를 켜두고 있자니 괜히 민망하기도 하더라고요. 상대방 입장에서는 자기 말이 어디로 흘러가는지 알 수가 없으니까요.

실패를 인정하고 나서는 다른 방법이 있을 거라는 생각에 여기저기 뒤지기 시작했습니다. 유튜브에서 “아이폰 회의록 자동화”를 검색하니 클로바노트, 오터AI(Otter.ai), 파이어플라이즈 같은 전용 앱들이 쏟아지더라고요. X(트위터)에서도 비슷한 고민을 하는 분들이 꽤 있었는데, 반응은 크게 두 갈래였어요. 클로바노트 쓰면 된다는 쪽이랑, 어차피 한국어 특화 아니면 쓰기 불편하다는 쪽. 저는 클라이언트 미팅에 외국어 대화가 섞이는 경우도 있어서 어중간하게 국내용만 되는 건 한계가 있겠다 싶었고, 오터AI는 무료 플랜 제한이 생각보다 빡빡해서 실제 업무에 쓰기엔 애매했습니다. 파이어플라이즈는 Zoom 연동이 강점이라는데 저는 Zoom보다 팀즈를 더 많이 쓰는 상황이라 또 맞지 않더라고요. 결국 딱 맞는 걸 못 찾고, 현실적인 타협안으로 넘어가게 됐습니다.

결국 수동 입력으로 타협한 현실

결국엔 이대로는 안 되겠다 싶어서 방법을 바꿨습니다. 중간중간에 GPT에 직접 글로 입력해서 회의록을 정리시키는 방식으로 전환한 거죠. 야심 차게 시작했던 음성 모드는 완전히 포기하고, 키보드로 방금 나온 회의 내용을 짧게 짧게 요약해서 입력한 다음 회의록 형식으로 정리해 달라고 시키는 방식을 택했습니다. 예를 들면 “디자인 수정 방향은 A안으로 확정, 일정은 다음 주 금요일까지” 이런 식으로 단문으로 입력하면 GPT가 그걸 항목별로 보기 좋게 정리해 주는 방식이었어요.

아이폰으로 회의록 자동화, 갤럭시보다 오히려 편했다 사용하는 모습, AI generated

코딩 모르는 제가 할 수 있는 최선의 자동화였는데, 솔직히 이건 자동화라고 부르기도 민망했습니다. 중간중간 계속 타이핑을 해야 하니까 오히려 손이 더 많이 가는 느낌이었거든요. 회의 흐름을 따라가면서 동시에 키보드를 두드리고 있어야 하니 집중력도 분산되고, 대화에 온전히 참여하지 못하는 느낌도 들었어요. 그렇다고 완전히 포기할 수도 없었던 게, GPT가 정리해주는 포맷 자체는 꽤 쓸 만했거든요. 결정 사항, 액션 아이템, 담당자 이런 식으로 구조화해주니까 나중에 팀원들과 공유할 때는 확실히 편하긴 했어요. 그래서 한동안은 이 방식으로 버텼는데, 매번 회의마다 이 과정을 반복하다 보니 슬슬 지치기 시작하더라고요. 더 나은 방법이 분명히 있을 것 같다는 생각에, 저는 결국 다른 도구들을 찾아보기 시작했습니다. 그 이야기는 다음 편에서 이어가도록 할게요.

실제 클라이언트 미팅 때는 이런 식으로 썼어요. 미팅 전에 GPT 창을 미리 열어두고, 프롬프트로 “지금부터 클라이언트 미팅이야. 내가 단문으로 입력하는 내용을 회의록 형식으로 정리해줘. 결정사항 / 액션아이템 / 담당자 / 기한 형식으로 구조화해줘” 라고 세팅해 두는 거예요. 그리고 미팅 중에 틈틈이 핵심 포인트만 짧게 입력하는 식이었습니다. 예를 들면 클라이언트가 “메인 색상 블루 계열로 바꿔주세요” 하면 테이블 밑에서 슬쩍 “색상 블루로 변경” 딱 네 글자만 입력하는 식으로요. 미팅이 끝나고 나서 “지금까지 입력한 내용을 팀 공유용 회의록으로 최종 정리해줘” 한 마디 더 하면 GPT가 항목별로 깔끔하게 뽑아줬어요. 팀 슬랙에 올리면 팀원들 반응도 나쁘지 않았습니다. “회의록 이렇게 정리되는 거야?” 하고 의아해하는 분도 있었지만, 중요한 건 내용이 빠지지 않고 구조적으로 전달된다는 거였으니까요.

그래서 지금 이 방법이 맞는 건가?

솔직하게 진단하자면, 지금 방식이 완전한 정답은 아닙니다. 음성 자동 인식도 아니고, 완전한 핸즈프리도 아니에요. 그래도 이 방식을 유지하는 이유가 있어요. 일단 따로 앱을 깔거나 유료 구독을 추가할 필요 없이, 이미 쓰고 있는 GPT 하나로 해결이 된다는 점이 가장 큰 장점입니다. 회의록 퀄리티도 제가 핵심만 입력하기 때문에 오히려 불필요한 내용이 빠지고 깔끔하게 나오는 편이고요.

한계도 솔직히 인정합니다. 회의 도중에 타이핑하는 게 여전히 부담스럽고, 내가 입력을 놓치면 그 부분은 회의록에서 사라져요. 빠르게 오가는 논의를 실시간으로 잡아내는 건 이 방식으론 구조적으로 한계가 있습니다. 갤럭시 동료들처럼 폰 하나 올려두고 끝내는 그 여유는, 솔직히 아직도 부럽습니다.

다음 편에서는 이 한계를 느끼고 나서 발견한 다른 도구들 이야기를 해볼게요. 클로바노트를 진짜로 써봤을 때 어땠는지, 그리고 아이폰 유저한테 현실적으로 맞는 조합이 뭔지 — 그 탐색기를 이어가겠습니다.

댓글 남기기