디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

통화 내용, 문자로 정리해주는 AI 앱 '비토' 이용해보니

IT동아갤로그로 이동합니다. 2022.09.02 19:17:19
조회 176 추천 0 댓글 0
[IT동아 권택경 기자] 기자는 업무 때문에 통화 내용을 수시로 메모해야 하는 일이 많다. 물론 손이 못 따라가는 일도 흔하다. 그래서 요즘은 아예 스마트폰 통화 녹음 기능을 활용하는 경우가 대부분이다.

기자 말고도 전화 통화로 중요한 업무를 처리하는 사람들은 대부분 통화 녹음을 널리 활용하고 있다. 내용을 놓치거나 잊어버려도 언제든지 다시 들을 수 있으니 안심이다. 하지만 메모와 달리 눈으로 볼 수가 없으니 필요한 부분을 빠르게 확인하기는 어다. 이럴 때 도움이 되는 게 인공지능을 활용해 음성을 문자로 변환해주는 STT(Speech To Text) 기반 서비스들이다.



‘눈으로 보는 통화’를 표방하는 비토(VITO)는 녹음된 통화 내용을 글로 정리해 보여주는 앱이다. 마치 채팅이나 문자 메시지를 보듯 화자를 말풍선으로 구분해놓은 게 특징이다. 긴 음성 파일을 다시 들을 필요 없이 원하는 구간, 내용을 바로 확인할 수 있다.

사용법은 간단하다. 스마트폰에 비토를 설치한 후 간단한 회원가입만 하면 바로 사용할 수 있다. 앱이 요구하는 접근 권한 요청을 허용하는 것 외 별다른 설정은 필요 없다. 스마트폰 기본 통화 앱에 자동 녹음이 설정되어 있다면, 비토 앱에서 녹음된 파일을 자동으로 인식해서 문자로 변환해준다. 다만 처리되는 시간 동안 잠시 기다려야 한다. 통화 길이에 따라 다르겠지만 1분 내외 짧은 통화는 수십 초 정도면 충분했다.


녹음된 통화 내용은 자동으로 문자 변환된다



정확도는 어떨까. 첫 사용 시에는 아직 이용자 음성 데이터가 부족한 탓인지 정확도가 다소 떨어지는 모습을 보였다. 이용자 말과 상대방 말의 말풍선이 반대로 기록되기도 했다. 다만 어느 정도 사용 후에는 점점 인공지능이 학습하면서 개선되는 모습을 보였다. 토씨 하나 틀리지 않는 수준은 물론 아니지만 통화 내용을 복기하는 용도로 활용하기에는 충분한 수준이다. 내용이 이상하다 싶을 때는 말풍선을 눌러 해당 부분 음성을 확인할 수 있다. 직접 내용을 편집해서 바로잡을 수도 있다.

당연한 말이겠지만 정확도는 발음과 발성이 또렷할수록 올라간다. 사투리 화자의 음성 인식률은 아직 좀 아쉬운 듯한 모습이었다. 이외에도 두 사람이 동시에 말하는 상황에선 화자 구분이 잘 안되거나 외래어, 고유명사 등 일상적으로 흔히 쓰지 않는 단어는 잘 인식하지 못하는 현상도 있었다. 다만 기자가 경험해본 바로는 이는 비토만의 한계라기보다는 대부분의 STT 서비스들이 지니고 있는 한계라고 할 수 있다.


문자나 채팅을 주고받은 것처럼 말풍선으로 정리해 보여준다



비토를 운영하는 리턴제로 측은 “비토는 회의, 강의 등 상황에서 발생하는 오디오와 달리, 정제되지 않은 자유로운 대화가 오가는 통화 오디오에 특화된 모델”이라며 “여타 서비스와 달리 자유 발화 문자 변환에서는 가장 성능이 좋다”고 강조했다.

통화 녹음에 특화된 서비스인만큼 관련된 편의 기능도 제공한다. 대표적으로 AI 교정 기능을 들 수 있다. 감탄사나 추임새, 중복해서 말한 단어나 구절은 알아서 제거해준다. 비속어를 제거하는 기능도 있다. 해당 기능은 켜고 끄는 필터 형태라서 혹시나 원본을 확인하고 싶다면 설정에서 끌 수도 있다. 다른 STT 서비스와 달리 통화 녹음 파일을 별도로 등록하는 과정이 필요 없다는 점도 장점이다.


AI 교정 기능을 활용하면 불필요한 감탄사, 추임새, 비속어를 제외할 수 있다



이외에도 중요한 부분에 북마크를 설정해두는 기능, 대화 내용을 다른 사람과 공유하는 기능도 제공한다. 공유 기능은 보안이 중요한 만큼 링크와 비밀번호가 있는 이용자만 볼 수 있게 돼 있고, 최소 7일에서 최대 90일까지 열람 기간을 설정할 수 있다.

비토 서비스 이용은 기본적으로 무료지만 좀 더 사용량이 많은 이용자를 위한 유료 멤버십도 있다. 유료 멤버십에 가입하면 통화 내용이 백업되는 클라우드 저장 공간을 기본 1GB에서 300GB로 늘려준다. 이외에도 문자 변환 처리 속도를 올려주는 이점도 제공한다. 가격은 1개월에 4900원, 12개월에 5만 3900원이다.


대화 내용을 공유할 수도 있다



비토는 현재 안드로이드 스마트폰 모바일 앱과 PC에서 이용할 수 있다. PC 웹에서도 모바일 앱과 똑같이 통화 내용을 확인, 편집하거나 음성을 다시 들을 수 있다. 북마크, 공유 기능도 똑같이 제공한다.

수동으로 녹음 파일을 추가하는 기능은 제공하지 않는다. 자동으로 통화 녹음 파일을 인식해주기 때문에 굳이 필요가 없기 때문이겠지만 개인적으로는 아쉬운 부분으로 느껴졌다. 기종에 따라서는 통화 녹음 파일이 인식이 안 되는 경우도 종종 있었기 때문이다.

삼성전자나 LG전자에서 나온 국산 스마트폰에서는 전혀 문제가 없었지만, 샤오미 같은 일부 외국산 스마트폰이 문제였다. 이러한 외국산 스마트폰들은 관련 법안 문제로 통화 녹음 기능을 막아두거나, 상대방에게 녹음 여부를 알리는 수동 통화 녹음 기능만 제공한다. 샤오미 레드미10으로 테스트해본 결과, 수동 통화 녹음을 하더라도 녹음된 파일이 인식이 안 됐다.

이렇게 녹음 파일이 자동으로도 인식이 안 되더라도 수동으로 녹음 파일을 추가하는 기능이 있었다면 앱을 이용이라도 할 수 있었겠지만, 인식이 안 되니 이용 자체가 불가능했다. 또한 통화 녹음 외 다른 녹음 파일을 변환하는 용도로 활용하고 싶어도 활용할 수가 없다. 통화 녹음 자체가 불가능한 아이폰에서도 물론 비토를 이용할 수가 없다.


비토 PC 웹 버전. 수동으로 음성 파일을 추가하는 기능은 연내 출시 예정이라고 한다



다행히 리턴제로 측에서도 이같은 한계를 인식하고 있는지 연내 수동으로 녹음 파일을 추가하는 기능을 추가할 예정이라고 밝혔다. iOS 버전도 수동으로 녹음 파일을 추가하는 형태로 출시된다. 또한 운영체제 단위에서 통화 녹음을 제한하고 있는 경우를 제외하고는 지원 운영체제와 단말도 계속 확대할 예정이라고 밝혔다.

비토는 지난해 4월 정식 서비스 시작 후 출시 1년여 만인 올해 기준 4월 누적 다운로드 50만 돌파 건을 돌파하고, 누적 처리 통화 건수 1억 3000만 건을 돌파하는 등 주요 지표가 전년 대비 2배 이상 성장했다. 국내는 통화 녹음을 활용하는 사례가 워낙 많아 비토 또한 좋은 반응을 얻은 것으로 보인다. 그러나 최근 불거진 이른바 ‘통화녹음 금지법’ 논란에서도 알 수 있듯 통화 녹음은 나라에 따라서는 불법인 경우도 많으며, 국내에서도 언제든 다시 법적 논란에 휘말릴 수 있다는 점은 우려로 남는다.

이와 관련해 리턴제로 측은 “앞으로 비토도 통화 오디오 외 회의, 강의 등 다른 오디오로 AI 모델과 서비스 범위를 확장할 계획”이라며 “특히 활용되지 못하고 사라지는 오디오 파일 활용 가치를 높일 수 있는 B2B 시장을 눈여겨보고 있다”고 밝혔다.

글 / IT동아 권택경 (tk@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ [리뷰] 인터뷰·회의 내용을 빠르고 정확하게 텍스트로 변환한다... AI속기사 '클로바노트'▶ 동의 없이 녹음하면 징역 10년? '통화녹음 금지법' 논란 일파만파▶ 논란의 통화녹음... 최신 안드로이드에선 어떻게 바뀌나?



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 가족과 완벽하게 손절해야 할 것 같은 스타는? 운영자 24/06/24 - -
3952 [르포] ‘페라리’ 전동화 전초 기지 ‘e-빌딩’ 현장 살펴보니 IT동아갤로그로 이동합니다. 06.21 67 0
3951 AWS 지용호 총괄 “클라우드 강자 AWS, 생성형 AI 혁신도 주도” IT동아갤로그로 이동합니다. 06.21 74 0
3950 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 16 IT동아갤로그로 이동합니다. 06.21 76 0
3949 [생성 AI 길라잡이] 대화형 생성AI도 골라서 쓰자, GPT와 클로드, 제미나이 IT동아갤로그로 이동합니다. 06.21 4346 5
3948 [농업이 IT(잇)다] 마늘 분류에 비전인식 AI 접목한 '젠틀파머스' IT동아갤로그로 이동합니다. 06.21 75 0
3947 “NFT가 가상자산?” NFT 법적 성격 판단 기준 나왔다 IT동아갤로그로 이동합니다. 06.20 691 0
3946 삼성전자, 빌트인 가전 브랜드 '데이코' 전시·판매 확대로 B2C 시장 공략 [2] IT동아갤로그로 이동합니다. 06.19 2393 0
3945 KIAT, 광주 가전산업 위기 극복 위해 기업과 머리 맞대 IT동아갤로그로 이동합니다. 06.19 97 0
3944 [스케일업] 두디스 [1] BM분석 - "유튜브 영상 분석 플랫폼, 첨예한 접근 필요" IT동아갤로그로 이동합니다. 06.19 96 0
3943 브이디컴퍼니 x 향촌흑염소 "서빙로봇, 대형 요식업 매장에 어울려” IT동아갤로그로 이동합니다. 06.19 116 0
3942 [월간자동차] 24년 5월, 국산 ‘기아 카니발’·수입 ‘테슬라 모델 3’ 판매 1위 IT동아갤로그로 이동합니다. 06.19 656 0
3941 초기 스타트업에 대한 전문적·객관적 평가, '상품성 진단' 들여다보니 IT동아갤로그로 이동합니다. 06.19 93 2
3940 AKG, 라이프스타일에 맞춘 새로운 N 시리즈 ‘N5·N9 하이브리드’ [1] IT동아갤로그로 이동합니다. 06.18 2002 0
3939 세일즈포스, 월드투어 코리아서 AI CRM의 현주소·영향력 입증 IT동아갤로그로 이동합니다. 06.18 86 0
3938 뜨거운 미국 증시 시장, 투자 전 확인해야 될 것들 IT동아갤로그로 이동합니다. 06.18 87 0
3937 [신차공개] ‘캐스퍼 일렉트릭’ 티저 공개·’뉴 레인지로버 벨라’ 사전계약 실시 IT동아갤로그로 이동합니다. 06.17 105 0
3936 ‘인공지능’ 처리하는 AI PC 시대 개막, PC 시장이 움직인다 IT동아갤로그로 이동합니다. 06.17 92 0
3935 [정구태의 디지털 자산 리터러시] 디지털자산 갈라파고스 탈출을 위한 제언 1. 법인참여 허용 IT동아갤로그로 이동합니다. 06.17 94 0
3934 [스케일업] 스크램블러 [1] BM 분석 “뷰티? 스토리테크? 선택과 집중이 필요” IT동아갤로그로 이동합니다. 06.17 94 0
3933 [리뷰] 과감한 디자인 속 탄탄한 기본기, 에이수스 터프 게이밍 F16 IT동아갤로그로 이동합니다. 06.17 926 2
3932 [주간투자동향] 고피자, 1000만 달러 규모 투자 유치 IT동아갤로그로 이동합니다. 06.17 89 0
3931 음향기기, 물에 빠졌다면 이렇게![이럴땐 이렇게!] [1] IT동아갤로그로 이동합니다. 06.17 1112 3
3930 [생성 AI 길라잡이] 갤럭시 AI 활용하기 - '서클 투 서치' IT동아갤로그로 이동합니다. 06.14 191 0
3929 [시승기] 원형 OLED 탑재·차체 키워 7년 만에 돌아온 ‘뉴 미니 컨트리맨’ IT동아갤로그로 이동합니다. 06.14 169 0
3928 루나레이크·애로우레이크로 이원화된 인텔 CPU, 라인업 구분은? IT동아갤로그로 이동합니다. 06.14 175 0
3927 금융위원회 “가상자산 사업자 영업 종료 규제 강화한다” IT동아갤로그로 이동합니다. 06.14 805 0
3926 서울 중구-동국대 캠퍼스타운, 대학과 지역이 함께 고민하는 자원순환 문제 IT동아갤로그로 이동합니다. 06.14 122 0
3925 [SBA x IT동아] ‘마이크로바이옴’으로 보다 나은 삶 만들 것, 윤여민 메가랩 대표 IT동아갤로그로 이동합니다. 06.14 114 0
3924 [스타트업리뷰] 건설인력 노무관리 원 클릭 시스템, 웍스메이트 ‘가다오피스’ IT동아갤로그로 이동합니다. 06.14 117 0
3923 [농업이 IT(잇)다] 네오프로틴 “노인 건강의 핵심은 근력 개선, 해법은 마육 단백질에 있습니다” IT동아갤로그로 이동합니다. 06.14 110 0
3922 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 15 IT동아갤로그로 이동합니다. 06.13 118 0
3921 [시승기] 세단의 승차감 구현한 캐딜락 첫 전기 SUV ‘리릭’ IT동아갤로그로 이동합니다. 06.13 112 0
3920 [SBA x IT동아] 아트랩 “피부 좋아지는 법, AI가 찾아드립니다” IT동아갤로그로 이동합니다. 06.13 116 0
3919 [스타트업 첫걸음] 창업 아이디어 검증을 위한 고려사항 IT동아갤로그로 이동합니다. 06.13 791 0
3918 [기술영업人] AI 확산의 시작과 끝을 함께하는 'AMD코리아'의 영업 전선 IT동아갤로그로 이동합니다. 06.13 411 1
3917 토요타 등 日 5개 자동차 제조사 ‘품질 인증 조작’ 파문 [2] IT동아갤로그로 이동합니다. 06.12 524 3
3916 [리뷰] 넷기어 MS108TUP, 2.5G 이더넷에 60W PoE까지 품은 특별한 스위치 IT동아갤로그로 이동합니다. 06.12 115 0
3915 "먹통 사태 교훈 삼아 안정성 극대화"…카카오 첫 자체 데이터센터 살펴보니 [3] IT동아갤로그로 이동합니다. 06.12 597 0
3914 장대익 가천대 스타트업칼리지 학장 “N번째 인생 전환 이끌 기업가 정신 전파” IT동아갤로그로 이동합니다. 06.12 120 0
3913 철저한 인텔 제품 관리의 산실, 대만 인텔 OEM 연구소 가보니 [6] IT동아갤로그로 이동합니다. 06.12 1717 0
3912 [SBA x IT동아] 세컨드팀 “검증된 해외 개발자, 슈퍼코더에 있습니다” IT동아갤로그로 이동합니다. 06.12 118 0
3911 [자동차와 法] 자동차와 무단횡단자의 과실 비율에 대하여 [1] IT동아갤로그로 이동합니다. 06.11 988 0
3910 애플, 오픈AI와 밀월 시각에 선긋기··· '제 길 가는 애플 인텔리전스' [1] IT동아갤로그로 이동합니다. 06.11 726 0
3909 [뉴스줌인] 부쩍 커진 이동식 에어컨 시장, ‘AI’와 ‘듀얼호스’로 방점 찍은 LG전자 IT동아갤로그로 이동합니다. 06.10 584 0
3908 [정구태의 디지털자산 리터러시] 2. 자산 규제와 진흥의 균형이 필요한 시점 IT동아갤로그로 이동합니다. 06.10 150 0
3907 JC? SA? 헷갈리는 도로 표지판 숙지하기! [이럴땐 이렇게!] IT동아갤로그로 이동합니다. 06.10 842 3
3906 컴퓨텍스 2024에서 눈에 띈 강소기업들 “한국시장 기대 커” [1] IT동아갤로그로 이동합니다. 06.07 452 0
3905 [생성 AI 길라잡이] 생성 AI 학습 과정에서 발생하는 빈번한 분쟁 IT동아갤로그로 이동합니다. 06.07 217 0
3904 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 14 IT동아갤로그로 이동합니다. 06.07 210 0
3903 글로벌 기업도, 유망 스타트업도…“어도비 서브스턴스 3D로 디지털 혁신 가능해” IT동아갤로그로 이동합니다. 06.07 1100 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2