디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

메타, 실시간 음성 번역의 새로운 표준 설정

GPTMAGAZINE갤로그로 이동합니다. 2023.12.05 14:59:32
조회 999 추천 1 댓글 2





🔼 사용자 표현 완벽 반영, SeamlessExpressive
🔼 화자의 맥락을 이해하는 SeamlessStreaming
🔼 실시간통역, RealTimeTranslation










메타(Meta)는 최신 AI 스위트를 통해 음성 번역을 더욱 자연스럽고 표현력 있게 만들었다. 지난 8월, 메타는 거의 100개 언어에 대한 텍스트 및 36개 언어에 대한 음성을 지원하는 다중 모달 AI 번역 모델인 SeamlessM4T를 공개했다. 이번에는 업데이트된 "v2" 아키텍처를 통해 대화식 번역을 더 spontaneous(자발적)하고 표현력 있게 만들기 위한 두 가지 새로운 기능을 도입했다.



첫 번째 새로운 기능은 "SeamlessExpressive"로, 사용자의 표현을 번역된 음성에 반영한다. 이는 음성의 음조, 음량, 감정 톤(흥분, 슬픔 또는 속삭임), 발화 속도 및 일시정지 등을 포함한다. 이전까지 번역된 음성은 항상 로봇 같았는데, 이번 개발로 인해 이는 현저히 개선될 것으로 예상되며, 일상 생활 뿐만 아니라 콘텐츠 제작에서도 혁신을 가져올 수 있다. 현재는 영어, 스페인어, 독일어, 프랑스어, 이탈리아어 및 중국어가 지원되며, 이 기사 작성 시점에서 이탈리아어와 중국어는 빠져있다.



두 번째 기능은 "SeamlessStreaming"으로, 화자가 계속 말하는 동안 번역을 시작하여 다른 사람이 더 빨리 번역을 듣게 한다. 약 2초 미만의 짧은 지연이 여전히 있지만, 누군가가 문장을 완료할 때까지 기다릴 필요가 없다. 메타에 따르면, 다양한 언어는 다양한 문장 구조를 가지고 있어서 일부 오디오 입력을 공부하기 위한 알고리즘을 개발해야 했으며, 번역된 출력을 생성할 만한 맥락이 있는지 여부를 결정하거나 계속 듣기를 유지해야 했다.



메타의 "Seamless Communication" 스위트에 대한 최신 개발은 구글 및 삼성과 같은 기업들이 제공하는 모바일 통역 도구보다 훨씬 인상적인 것으로 보인다. 이러한 새로운 기능을 일반인이 언제 사용할 수 있게 될지에 대한 정보는 아직 나오지 않았지만, 메타가 언젠가는 이러한 기능을 스마트 글래스에 통합하여 더욱 실용적으로 만들 것으로 예상된다.













◎GPT매거진 (https://www.gptmagazine.net)
지피티 기자 : gptmagazinebiz@gmail.com



추천 비추천

1

고정닉 0

1

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 2025년 가장 기억에 남는 인터넷 이슈는? 운영자 25/12/22 - -
224 애플, 생성형 AI 경쟁 가세 - 새로운 개발 툴 'MLX' 공개 GPTMAGAZINE갤로그로 이동합니다. 23.12.12 1002 0
223 ChatGPT, 게으른 태도 논란에 휩싸여 [54] GPTMAGAZINE갤로그로 이동합니다. 23.12.11 7956 15
222 일론 머스크의 AI 스타트업, '그록' 챗봇 론칭 [12] GPTMAGAZINE갤로그로 이동합니다. 23.12.08 6081 13
221 아마존, AI물류창고 로봇 '디짓', 인간의 일자리를 뺏기 시작했다. [3] GPTMAGAZINE갤로그로 이동합니다. 23.12.08 621 1
220 마이크로소프트, 코파일럿에 GPT-4 Turbo 적용 GPTMAGAZINE갤로그로 이동합니다. 23.12.08 1972 1
219 메타, '이매진 위드 메타' 공개 GPTMAGAZINE갤로그로 이동합니다. 23.12.08 638 1
218 미쳤다! 구글 Gemini AI모델 상호작용 예시 영상 [5] GPTMAGAZINE갤로그로 이동합니다. 23.12.07 1749 1
217 오픈AI의 대항마! 인공지능 끝판왕 '구글 제미니' 출시 [5] GPTMAGAZINE갤로그로 이동합니다. 23.12.07 1024 2
216 [AI 뉴스] GPT-5, 딥마인드 작곡 AI, MS 딥페이크, 메타 영상 AI, 오픈 소스 발전 등 [8] GPTMAGAZINE갤로그로 이동합니다. 23.12.06 4527 3
215 오픈AI 경고, Q* 알고리즘은 대체 어떤 알고리즘일까요? GPTMAGAZINE갤로그로 이동합니다. 23.12.05 368 2
메타, 실시간 음성 번역의 새로운 표준 설정 [2] GPTMAGAZINE갤로그로 이동합니다. 23.12.05 999 1
213 AI와 챗GPT가 이끄는 세상ㅣ카이스트 김대식 교수ㅣ2024 글로벌 비즈니스 트렌드 [3] GPTMAGAZINE갤로그로 이동합니다. 23.12.05 1200 2
212 인공지능 모델의 개발 속도와 안전 문제 [11] GPTMAGAZINE갤로그로 이동합니다. 23.12.04 1091 0
211 OpenAI의 GPT 보이스: 영어 회화를 무료로 제공하는 기능 [7] GPTMAGAZINE갤로그로 이동합니다. 23.12.04 3198 4
210 샘알트만 해고 후 복귀 인터뷰 [5] GPTMAGAZINE갤로그로 이동합니다. 23.12.03 2354 2
209 오픈AI 연구원 경고, 샘알트먼 해임 전 AI 폭발적 발전 예고 [1] GPTMAGAZINE갤로그로 이동합니다. 23.11.27 562 0
208 빌 게이츠 "인간 노동, 주 3일이면 충분" [189] GPTMAGAZINE갤로그로 이동합니다. 23.11.27 9990 79
207 오픈AI, GPT-4 터보 공개로 AI 업계 혁신 GPTMAGAZINE갤로그로 이동합니다. 23.11.10 415 0
206 마이크로소프트, 윈도우 10에 AI 코파일럿 도입 [6] GPTMAGAZINE갤로그로 이동합니다. 23.11.09 2437 17
205 구글의 새로운 AI 검색, 한국어 지원 [1] GPTMAGAZINE갤로그로 이동합니다. 23.11.09 591 1
204 오픈AI, 주간 사용자 1억 명 돌파! [7] GPTMAGAZINE갤로그로 이동합니다. 23.11.07 615 1
203 오픈AI, 핵 위협 등 AI 위험에 대응할 준비 팀 구성 발표 [1] GPTMAGAZINE갤로그로 이동합니다. 23.10.30 2229 0
202 10년 내 AI, 인간 일자리 80% 대체 가능? [7] GPTMAGAZINE갤로그로 이동합니다. 23.10.26 1593 2
201 AI 이미지 생성 프로그램 끝판왕 등장 - ChatGPT를 품은.. [5] GPTMAGAZINE갤로그로 이동합니다. 23.10.18 2908 0
200 오픈AI, GPT-4V 공개 [4] GPTMAGAZINE갤로그로 이동합니다. 23.10.17 847 0
199 구글, 대화식 검색에 AI 이미지 생성 기능 도입 GPTMAGAZINE갤로그로 이동합니다. 23.10.16 254 0
198 AI 크리에이터 시대, 유튜브가 선도한다. [5] GPTMAGAZINE갤로그로 이동합니다. 23.10.16 1767 0
197 어도비 포토샵 웹 버전, AI 도구로 강화되어 출시 GPTMAGAZINE갤로그로 이동합니다. 23.10.04 314 0
196 빙챗 AI, '할머니 이야기'에 속아 [35] GPTMAGAZINE갤로그로 이동합니다. 23.10.04 4817 17
195 美 젊은 남성, 실제 여성 대신 AI 선택 [108] GPTMAGAZINE갤로그로 이동합니다. 23.10.04 4592 35
194 게티이미지, AI 이미지 생성 도구 출시 [4] GPTMAGAZINE갤로그로 이동합니다. 23.09.26 2316 2
193 챗GPT가 보고 듣고 대화한다. [7] GPTMAGAZINE갤로그로 이동합니다. 23.09.26 3891 4
192 구글 AI 코딩 '스튜디오 봇', 전 세계로 확장 [12] GPTMAGAZINE갤로그로 이동합니다. 23.09.22 2393 4
191 마이크로소프트365, 코파일럿 AI 11월 드디어 출시 [3] GPTMAGAZINE갤로그로 이동합니다. 23.09.22 502 3
190 깃허브, '코파일럿 챗' 일반 개인 사용자 확장 GPTMAGAZINE갤로그로 이동합니다. 23.09.21 275 0
189 오픈AI, DALL-E 3 버전 발표 [2] GPTMAGAZINE갤로그로 이동합니다. 23.09.21 590 0
188 구글과 오픈AI 멀티모달 AI 기술로 차세대 경쟁 [1] GPTMAGAZINE갤로그로 이동합니다. 23.09.20 414 1
187 틱톡 공식 발표, AI 콘텐츠 라벨링 기능 도입 [1] GPTMAGAZINE갤로그로 이동합니다. 23.09.20 1198 3
186 구글 바드 익스텐션스, 지메일과 드라이브, 문서 등에서도 사용 된다. GPTMAGAZINE갤로그로 이동합니다. 23.09.20 980 0
185 구글, GPT-4와 경쟁할 '제미니' 언어 모델 출시 임박 [6] GPTMAGAZINE갤로그로 이동합니다. 23.09.19 1120 3
184 어도비, 크리에이티브 AI '파이어플라이' 상용화 발표 [2] GPTMAGAZINE갤로그로 이동합니다. 23.09.19 1105 3
183 스테이블 디퓨젼, AI 오디오 플랫폼 '스테이블 오디오' 출시 [9] GPTMAGAZINE갤로그로 이동합니다. 23.09.15 2930 10
182 메타, GPT-4와 경쟁하기 위한 AI 모델 개발에 전력 투구 [27] GPTMAGAZINE갤로그로 이동합니다. 23.09.11 2883 3
181 미국 국세청, AI로 연체된 세금 받아낸다. GPTMAGAZINE갤로그로 이동합니다. 23.09.11 281 0
180 엔씨소프트, AI 기술로 게임 제작 속도 향상 [1] GPTMAGAZINE갤로그로 이동합니다. 23.09.11 460 1
179 마이크로소프트, 세계 최대 규모의 암 탐지 AI 기술 구축 GPTMAGAZINE갤로그로 이동합니다. 23.09.11 211 1
178 챗GPT, 월평균 접속시간 7분 기록 [44] GPTMAGAZINE갤로그로 이동합니다. 23.09.08 4010 5
177 텐센트의 '훈위안', GPT-4와의 경쟁 [1] GPTMAGAZINE갤로그로 이동합니다. 23.09.08 333 0
176 AI가 냄새도 '느낄' 수 있을까? GPTMAGAZINE갤로그로 이동합니다. 23.09.08 266 1
174 텍스트를 영상으로 만들어주는 AI가 있다?! RUNWAY GEN2 사용법 [4] GPTMAGAZINE갤로그로 이동합니다. 23.09.07 2543 2
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2