디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

구글 “음성 인공지능 USM으로 세계 언어 장벽 허문다”

IT동아갤로그로 이동합니다. 2023.03.08 09:00:57
조회 1088 추천 5 댓글 9
[IT동아 차주경 기자] 구글이 100개 이상의 언어를 자동으로 인식하고, 이를 번역하거나 자막으로 만드는 음성 인공지능 ‘USM(Universal Speech Model)’의 발전 현황을 공개했다. 구글은 USM의 개발 상황과 성과, 학습 구조와 개선 계획을 함께 소개하면서 연구자들에게 API(Application Programming Interface, 앱 개발 도구) 접근 권한도 준다고 밝혔다.


구글 1,000개 언어 이니셔티브 프로그램 소개 사진. 출처 = 구글 블로그



USM은 구글이 2022년 11월 공개한 ‘1,000개 언어 이니셔티브’를 현실로 이끌 첫 기술이다. 1,000개 언어 이니셔티브는 세계 각국의 언어 1,000개를 지원하는 인공지능 모델이다. 당시 구글은 USM의 개념을 함께 설명했는데, 이번에는 USM이 어떤 방식으로 얼마나 많이 공부했고 어느 정도의 능력을 발휘했는지 밝혔다.

구글 USM은 지금까지 300개 이상의 언어로 말한 목소리를 1,200만 시간 분량, 문장을 280억 개 이상 분석해 공부했다. 구글은 영어와 중국어 등 세계 주요 언어는 물론, 세계에서 2,000만 명 미만이 쓰는 소수 언어에 이르기까지 다양한 종류의 목소리와 문장을 가르쳤다고 강조했다.

각기 다른 언어 300여 개를 인공지능에게 가르치는 것은 여간 어려운 일이 아니다. 쓰는 사람이 적은 소수 언어는 목소리와 문장 데이터 자체를 구하기 어렵다. 이 데이터를 구했다고 해도, 이것을 인공지능에게 가르칠 때 필요한 레이블(분류 기록)의 지정 작업이 또 하나의 난관이다. 데이터가 많을수록, 분석하기 까다로울수록 레이블 지정에 수고와 비용이 많이 든다.


구글 USM이 배운 세계 각국의 언어들. 출처 = 구글 블로그



수많은 언어 데이터를 알맞게, 그리고 효율 좋게 분석해서 인공지능에게 가르칠 알고리듬(명령을 수행하는 절차)도 찾아내야 한다. 이 알고리듬은 수많은 데이터를 원활하게 받아들여야 하며 수시로 개선해도 교육에 영향을 주지 않아야 한다. 새로운 언어(데이터)의 목소리와 문장을 접해도 혼동하지 않고, 이전과 같은 방식으로 받아들이는 유연성도 발휘해야 한다.

구글은 먼저 300여 개 언어의 목소리 데이터 1,000만 시간 분량을 레이블 지정 작업 없이 USM에게 가르쳤다. 여기에 가장 많은 자원을 할당했다. 이어 두 번째로 300여 개 언어의 문장 데이터 280억 개를 가르치면서 이를 분석하는 인코더(데이터를 신호로 바꾸는 기능), 목소리 인코더와 문장 인코더를 합치는 알고리듬을 새로 적용했다. 동시에 레이블 지정 작업을 하지 않은 목소리 데이터, 레이블 지정 작업을 한 목소리 데이터(200만 시간 분량)와 문장 데이터 모두를 USM에게 가르쳤다. 세 번째로 USM을 미세 조정(기존 데이터로 인공지능을 다시 훈련시키는 절차)하면서 알고리듬이 얼마나 모델링(인공지능이 데이터를 분석해 알고리듬을 만드는 과정)을 잘 하는지 검증했다.


구글이 USM을 가르친 과정. 출처 = 구글 블로그



구글은 USM의 능력을 파악하려고 유튜브의 다국어 목소리 데이터를 제시했다. 이 다국어 목소리 데이터는 73개 언어로 구성됐는데, 각 언어당 3,000시간 미만의 분량만 있을 정도로 규모가 작았다. 그럼에도 구글 USM은 다국어 목소리 데이터를 듣고 평균 30% 미만의 단어 오류율(WER, Word Error Rate, 음성 인식이나 기계 번역의 성능을 측정하는 기준)을 기록했다. 이는 지금까지 나온 음성 인공지능 가운데 가장 우수한 수치다. 구글 USM은 음성 번역도 잘했다. BLEU(BiLingual Evaluation Understudy, 언어간 기계 번역의 품질을 평가하는 기준)실험 결과, 여기에서도 지금까지 나온 음성 인공지능 가운데 가장 우수한 성적을 냈다.

세계에는 7,000개 이상의 언어가 있다고 알려졌다. 구글 USM은 극소수 사람만 쓰는 언어라 해도, 인공지능이 원활하고 정확하게 다룬다는 것을 증명했다. 사어(사라진 언어)를 다룰 가능성도 있다. 구글 USM이 고도화를 거쳐 언어의 장벽을 허물면, 세계인 누구나 편리하게 소통하는 시대가 열릴 것으로 기대한다.

구글은 “USM은 세계의 정보를 체계화해서 누구나 쉽게 접근하도록 돕는 중요한 기술이다. 이번 성과는 1,000개 언어 이니셔티브를 구축할 토대가 될 것이다.”라고 밝혔다.

글 / IT동아 차주경(racingcar@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 해외여행에서 외국어 소통, 번역앱으로 이렇게![이럴땐 이렇게!]▶ 디지털 취약 해소할 배리어 프리·인공지능 키오스크 나온다▶ 인공지능, 위성 통신 시대 오나…MWC 2023에서 확인한 미래 키워드



추천 비추천

5

고정닉 0

2

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 연예인 안됐으면 어쩔 뻔, 누가 봐도 천상 연예인은? 운영자 24/06/17 - -
2592 [메타버스에 올라타자] 4. 메타버스 기술 트렌드 [14] IT동아갤로그로 이동합니다. 23.04.26 2872 0
2591 AWS코리아, 직접 체험하는 모의 훈련 ‘스타트업 게임데이’ 개최 IT동아갤로그로 이동합니다. 23.04.26 114 0
2590 [IT신상공개] 세 개의 눈 가진 접이식 드론, DJI 매빅 3 프로 [2] IT동아갤로그로 이동합니다. 23.04.25 1227 0
2589 [동국대학교 캠퍼스타운] 퍼플피치 “캐릭터 상품을 ‘잘’ 만들도록 도와드려요” IT동아갤로그로 이동합니다. 23.04.25 104 0
2588 엑스플로인베스트먼트 이종훈 대표 “스타트업다운 아이템으로 승부하라” IT동아갤로그로 이동합니다. 23.04.25 2606 3
2587 미드저니 “사진 인공지능, 예술 도용 안해…소송 기각돼야” IT동아갤로그로 이동합니다. 23.04.24 125 1
2586 [고려대 초창패 2022] 호라이존테크놀로지 “퀀트랙, 성공 투자 파트너로” [1] IT동아갤로그로 이동합니다. 23.04.24 2521 0
2585 에이수스, OLED 품은 슬림형 노트북 제품군 다수 출시 IT동아갤로그로 이동합니다. 23.04.21 123 0
2584 [농업이 IT(잇)다] 핀치그린 “고압 에어로포닉스·기능성 식물소재 전파” [1] IT동아갤로그로 이동합니다. 23.04.21 170 0
2583 중앙대 인간로봇융합연구센터, 육상선수와 함께 로봇슈트 검증 나선다 [1] IT동아갤로그로 이동합니다. 23.04.21 168 0
2582 이륙 4분 만에 폭발한 스페이스X '스타십'··· 터졌는데도 '성공'인 이유는? [15] IT동아갤로그로 이동합니다. 23.04.21 2313 14
2581 외국인용 지마켓, 11번가도 있어? ‘역직구’ 사업 이모저모[K비즈니스 가이드] [1] IT동아갤로그로 이동합니다. 23.04.20 1056 0
2580 오라클 “의사결정에 어려움 겪는 기업들, ‘데이터 폭격’이 원인” [1] IT동아갤로그로 이동합니다. 23.04.19 164 0
2579 [WIS 2023] 일상을 바꾸는 최신 ICT 트렌드와 기술, 스타트업까지 모였다 [1] IT동아갤로그로 이동합니다. 23.04.19 318 0
2578 누누티비 사태, OTT 업계 “범죄 대응체계와 처벌 강화해야” [28] IT동아갤로그로 이동합니다. 23.04.19 4693 17
2577 [고려대 초창패 2022] 반암주식회사 “박막형 반도체 시장 주도” [1] IT동아갤로그로 이동합니다. 23.04.19 156 0
2576 [IT신상공개] 디카만큼 화질 좋은 스마트폰, 샤오미 13 울트라 [10] IT동아갤로그로 이동합니다. 23.04.19 660 2
2575 효율성 겸비 친환경 포장재가 대세, 제17회 대한민국 패키징 대전 [1] IT동아갤로그로 이동합니다. 23.04.18 140 0
2574 [농업+IT=스마트팜] 5. 환경 데이터 수집용 센서 구축하기 (2) [1] IT동아갤로그로 이동합니다. 23.04.18 148 0
2573 [디지털 취약 극복] 리보 “세계 시각장애인 위한 스마트폰 도우미” IT동아갤로그로 이동합니다. 23.04.18 841 1
2572 중앙대학교 인간로봇융합연구센터 김우석 사무국장 “연구센터 운영에도 융합이 중요” IT동아갤로그로 이동합니다. 23.04.17 90 0
2571 [IT애정남] 재개된 해외여행, 배터리 기내 반입 알려주세요! IT동아갤로그로 이동합니다. 23.04.17 1051 0
2570 카카오톡 사용으로 저장공간이 부족할 땐 이렇게![이럴땐 이렇게!] [5] IT동아갤로그로 이동합니다. 23.04.17 2651 7
2569 [주간투자동향] 넛지헬스케어, 300억 원 규모 투자 유치 IT동아갤로그로 이동합니다. 23.04.17 101 0
2568 [IT강의실] 흑백 사진만 찍는 ‘모노크롬’ 카메라, 무엇이 특별한가? [2] IT동아갤로그로 이동합니다. 23.04.17 1883 6
2567 [농업이 IT(잇)다] 뉴로팩 “업사이클링 친환경·기능성 포장재 세계로” IT동아갤로그로 이동합니다. 23.04.14 93 0
2566 [IT신상공개] 35mm 8K 영상 담는 드론, DJI 인스파이어 3 [12] IT동아갤로그로 이동합니다. 23.04.14 1215 2
2565 IT운영전문가가 본 인포플라의 ‘웹장애 모니터링’[스타트업 리뷰] IT동아갤로그로 이동합니다. 23.04.13 105 0
2564 [앱으리띵] 내 마음대로 고르는 건설 일자리, 웍스메이트 가다 [1] IT동아갤로그로 이동합니다. 23.04.13 218 1
2563 엔비디아, 지포스 RTX 4070 출시… '10GB 아닌 12GB 메모리 탑재' [16] IT동아갤로그로 이동합니다. 23.04.13 2107 2
2562 상상력을 현실로 바꾸는 ‘딥테크’, 정부도 인재 양성에 팔 걷어 IT동아갤로그로 이동합니다. 23.04.12 151 0
2561 직접 체험할 수 있는 프로 오디오 장비, 기어라운지 쇼룸 [1] IT동아갤로그로 이동합니다. 23.04.12 1140 0
2560 유튜브 프리미엄 구독자, 다섯 가지 혜택 받는다 [8] IT동아갤로그로 이동합니다. 23.04.12 1577 3
2559 [리뷰] USB에 꽂아 쓰는 와이파이6E 어댑터, 넷기어 나이트호크 A8000 IT동아갤로그로 이동합니다. 23.04.11 153 0
2558 마드라스체크, SaaS 페스타 'Flower 2023' 개최… '디지털 전환의 현주소 만난다' IT동아갤로그로 이동합니다. 23.04.11 162 0
2557 이통 3사, 새로운 중간요금제 나온다 … 걸림돌은 가격 [6] IT동아갤로그로 이동합니다. 23.04.11 1452 0
2556 [IT신상공개] ‘미키 마우스’ 옷 입은 955만원짜리 라이카 Q2 한정판, 발표하자마자 매진? [3] IT동아갤로그로 이동합니다. 23.04.10 1485 0
2555 [IT애정남] 내비게이션의 스쿨존 우회 기능에 대해 알려주세요 IT동아갤로그로 이동합니다. 23.04.10 207 0
2554 [마인드테크 시대가 온다] 4. 상담테크, 치유의 동반자 IT동아갤로그로 이동합니다. 23.04.10 131 0
2553 스마트폰 저장공간이 부족할 땐 이렇게![이럴땐 이렇게!] [4] IT동아갤로그로 이동합니다. 23.04.10 2182 3
2552 물류의 변화, 도심 속으로 들어 온 물류거점 IT동아갤로그로 이동합니다. 23.04.10 1567 1
2551 [뉴스줌인] DDR5 지원하는 기가바이트의 H610 메인보드 출시, 쓸 만할까? IT동아갤로그로 이동합니다. 23.04.08 127 0
2550 AI로 악플잡는 네이버·카카오, 남은 과제는? [55] IT동아갤로그로 이동합니다. 23.04.07 4332 5
2549 KISA, 실생활 서비스로 블록체인 대중화 노린다 IT동아갤로그로 이동합니다. 23.04.07 101 0
2548 [농업이 IT(잇)다] 신성랩메디컬 “소재가 힘, 나노콜라겐을 세계로” IT동아갤로그로 이동합니다. 23.04.07 87 0
2547 강화하는 스마트폰-PC 연결성, 왜 기업들은 지금 '연결성' 기능을 내는가? [5] IT동아갤로그로 이동합니다. 23.04.07 1712 2
2546 AMD 자일링스, ASIC 기반 알베오 미디어 가속기 'MA35D' 공개 IT동아갤로그로 이동합니다. 23.04.06 88 0
2545 [리뷰] ‘진짜’ 미국 선생님들 수업이 한가득, ‘아웃스쿨’ IT동아갤로그로 이동합니다. 23.04.06 129 0
2544 지금 지원할 수 있는 예비 창업자 프로그램 IT동아갤로그로 이동합니다. 23.04.06 357 0
2543 공공배달앱 대부분이 외면받아… 업계 “홍보·수익방안 마련해야” [24] IT동아갤로그로 이동합니다. 23.04.06 1782 5
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2