디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[뉴스줌인] 카카오브레인의 초거대 이미지생성 AI 'RQ-Transformer'란?

IT동아갤로그로 이동합니다. 2022.04.20 16:20:26
조회 56 추천 0 댓글 0
[IT동아 정연호 기자] IT동아 편집부에는 하루에만 수십 건을 넘는 보도자료가 온다. 대부분 새로운 제품, 혹은 서비스 출시 관련 소식이다. IT동아는 이 중에 독자들에게 도움이 될 만한 것 몇 개를 추려 기사화한다. 다만, 기업에서 보내준 보도자료 원문에는 전문 용어, 혹은 해당 기업에서만 쓰는 독자적인 용어가 다수 포함되기 마련이다. 이런 용어에 익숙하지 않은 독자를 위해 IT동아는 보도자료를 해설하는 기획 기사인 '뉴스줌인'을 준비했다.

출처: 카카오브레인 (2022년 4월 19일)

제목: 카카오브레인, 이미지 생성 모델 ‘RQ-Transformer’ 공개


출처=카카오브레인



요약: 카카오브레인에서 자사의 초거대 멀티모달 AI ‘minDALL-E’를 업그레이드한 버전인 이미지 생성 모델 ‘RQ-Transformer’를 오픈소스 커뮤니티 깃허브(GitHub)에 공개했다. 39억개의 매개변수로 구성된 ‘RQ-Transformer’는 3000만 쌍의 텍스트-이미지를 학습한 text-to-image(텍스트-이미지) AI 모델로, 계산 비용을 줄이고 이미지 생성 속도를 높이면서 이미지 품질을 크게 향상시킨 모델이다. 대규모 데이터 세트를 학습한 ‘RQ-Transformer’는 처음 보는 텍스트의 조합을 이해하고, 이에 대응하는 이미지를 생성한다.

해석: 카카오브레인이 공개한 ‘RQ-Transformer’은 이용자가 텍스트를 입력하면, 텍스트를 분석해 그에 맞는 이미지를 생성하는 멀티모달 인공지능(이하 AI) 이미지 생성 모델이다. 멀티모달(Multimodal)이란 글, 이미지, 음성 등 다양한 데이터를 이해할 수 있는 AI 모델을 말한다. 메시지(텍스트)를 분석해 이미지를 만들려면, 결과물로 어떤 이미지가 나와야 하는지를 AI가 이해해야 한다. 그래서 다양한 형식의 데이터를 인식할 수 있어야 하는 것이다. 현재 단계에선 영어로 된 명령어(메시지)로만 이미지를 생성할 수 있다.


RQ-Transformer를 통해 만든



위 사진은 ‘사막에 있는 에펠타워’를 그려 달라는 메시지를 분석해 만든 이미지다. 프랑스 파리에 있는 에펠탑을 사막을 배경으로 해서 새로운 사진을 만든 것이다. 이미지 생성 모델은 일반적인 사진뿐 아니라 현실의 사실, 법칙과 무관한 사진도 생성할 수 있다. RQ-Transformer는 스페인의 초현실주의 화가인 살바도르 달리의 ‘기억의 지속’이란 작품처럼 녹아내리는 시계가 의자에 걸쳐져 있는 비현실적인 사진도 만들 수 있다.

카카오브레인에서 공개한 RQ-Transformer는 매개변수(파라미터)가 39억개에 달한다. 파라미터란 AI가 학습하는 데이터의 양을 말한다. 이 파라미터가 많아질수록 AI 성능이 좋아진다. 현재 언론에서 보도되는 수천 억 단위의 파라미터를 가진 AI는 보통 언어를 이해하고 생성하는 언어 모델이라고 한다. 카카오브레인의 RQ-Transformer는 국내에선 가장 많은 파라미터를 가진 이미지 생성 모델이다. 이는 세계적인 이미지 생성 모델과 견주어도 높은 수치다.

RQ-Transformer의 특이점은 모두 카카오브레인의 독자적인 기술로 개발된 AI라는 것이다. 이전 버전인 minDALL-E(민달리)는 오픈 소스(누구나 이용할 수 있도록 공개된 프로그램 소스 코드)를 기반으로 개발됐다. RQ-Transformer는 민달리 대비 모델 크기가 3배, 이미지 생성 속도와 학습 데이터 세트 크기는 2배 늘어났다. 기존의 이미지 생성 모델이 2차원 코드맵으로 표현됐다면, RQ-Transformer는 3차원 코드맵으로 이미지를 생성하도록 설계됐다. 사진은 3차원(3D)인 현실을 2차원(2D)으로 표현하기 때문에 입체감이 떨어진다. 카카오브레인의 AI는 사진 속 대상을 쪼개서 실제 현실과 같이 3D로 인식해 학습한다. 덕분에 RQ-Transformer는 이미지를 생성할 때 사진 속 대상들을 입체적으로 구현할 수 있게 된다.

카카오브레인 관계자는 “소상공인들이 언어 모델 AI를 리뷰에 답변이 자동으로 달리게 하거나, 상품 소개 글을 생성하는 데 사용하는 것처럼 이미지 생성 모델 AI도 고도화와 상용화가 된다면 널리 쓰일 수 있을 것”이라고 말했다. RQ-Transformer도 추후엔 소상공인이 메뉴판에 맞는 사진을 만들거나, 그림 실력이 없는 사람이 원하는 바를 그림으로 표현하는 것 등에 활용될 수 있을 것으로 보인다.

글 / IT동아 정연호 (hoho@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ AI 산업 트렌드와 발전상 한눈에…제5회 국제인공지능대전▶ 요즘 2030세대는 AI로 투자한다.. 다만, 전문가는 "고수익 좇긴 어렵다" 당부▶ 인공지능의 진화, 설명·목소리만 듣고 사진 한 장 뚝딱



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
3841 SEC, 이더리움 현물 ETF 승인 “증권거래법 요건 충족” IT동아갤로그로 이동합니다. 12:53 12 0
3840 벤처 투자 80%가 수도권 편중··· '투자 해결사'로 나선 부산창경 IT동아갤로그로 이동합니다. 12:29 11 0
3839 국내 통신3사 모두 "이제 우리는 AI 기업" [8] IT동아갤로그로 이동합니다. 05.23 1256 1
3838 [IT애정남] 갤럭시 '생성형 편집', 어떻게 해야 잘 될까요? IT동아갤로그로 이동합니다. 05.23 55 0
3837 즉석 카메라로 이런 ‘손맛’이? ‘인스탁스 미니 99’ 출시 IT동아갤로그로 이동합니다. 05.23 42 0
3836 스타트업 해외 진출 시 알아야 할 정보 공유 ‘라이징 스타트업 콘서트4’ IT동아갤로그로 이동합니다. 05.23 56 0
3835 [IT애정남] 해외 구매폰에 국내 유심 쓰는데 음성 통화 안되면? [1] IT동아갤로그로 이동합니다. 05.23 809 2
3834 퀄컴, 코파일럿+ PC 등장에 'AI 허브 및 개발 도구'로 지원 사격 IT동아갤로그로 이동합니다. 05.23 80 0
3833 네카오, 글로벌 공략 갈 길 바쁜데…일단 멈춤 IT동아갤로그로 이동합니다. 05.23 51 0
3832 2025년 상반기 탄생할 주식 대체거래소(ATS), 이렇게 달라진다 IT동아갤로그로 이동합니다. 05.23 70 0
3831 AMD, 에픽·MI300X 투트랙으로 AI 산업 주도권 확보 나서 IT동아갤로그로 이동합니다. 05.22 70 0
3830 '직장인 3명 중 1명, 데이터 도출 어려워'··· AI 기반 자동화가 해답될까? IT동아갤로그로 이동합니다. 05.22 88 0
3829 산행 보조부터 산불 진화까지...'입는 로봇' 활용처 확대 [1] IT동아갤로그로 이동합니다. 05.22 4874 1
3828 대거 출시 예고한 Arm CPU 기반 윈도우 PC, 뭐가 다를까? IT동아갤로그로 이동합니다. 05.22 145 0
3827 비트코인 피자데이, 업비트·빗썸 “피자 2024판 쏜다” [17] IT동아갤로그로 이동합니다. 05.22 6996 4
3826 [생성 AI 길라잡이] 음성과 이미지만 있으면 영상을 만든다 ‘런웨이ML’ IT동아갤로그로 이동합니다. 05.21 1750 0
3825 가속 페달 밟은 검색광고 시장 경쟁, 보라웨어 ‘AI 검색광고 관리 솔루션에 주목해야 되는 이유 IT동아갤로그로 이동합니다. 05.21 84 0
3824 부르면 달려오는 '이동형 전기차 충전기' 시장 기지개 [14] IT동아갤로그로 이동합니다. 05.21 1895 0
3823 MS, '코파일럿 플러스 PC' 발표…AI 시대의 새로운 PC 제시 IT동아갤로그로 이동합니다. 05.21 151 0
3822 업비트·빗썸, 1분기 실적 개선···투자자 보호·서비스 개선에 주력한다 IT동아갤로그로 이동합니다. 05.21 80 0
3821 GPT4o와 GPT4 비교해 보니··· '사람 대 AI의 근본적인 접근 방식 바꿔' [6] IT동아갤로그로 이동합니다. 05.21 1289 3
3820 삼성전자, '비스포크 AI 콤보' 에센셜 화이트 색상 출시…색상 라인업 강화 IT동아갤로그로 이동합니다. 05.20 141 0
3819 채팅창 넘어 일상으로…'만능 AI 비서' 시대 온다 IT동아갤로그로 이동합니다. 05.20 515 0
3818 오늘부터 시끄러운 불법 튜닝 오토바이 집중 단속 [6] IT동아갤로그로 이동합니다. 05.20 591 6
3817 AWS 서밋 행사장에서 펼쳐진 훈훈한 ‘프리킥’ IT동아갤로그로 이동합니다. 05.20 131 0
3816 [주간투자동향] 라피치, 60억 원 규모 투자 유치 IT동아갤로그로 이동합니다. 05.20 92 0
3815 키보드의 윈도 키, 최대한 활용하려면 이렇게![이럴땐 이렇게!] [5] IT동아갤로그로 이동합니다. 05.20 1345 16
3814 인포플라 “대답만 하던 기존 AI의 한계, VLM 기반 자동화로 극복” [4] IT동아갤로그로 이동합니다. 05.18 6927 3
3813 6월 인공지능ㆍ반도체 시장 엔비디아 손에 달렸다 IT동아갤로그로 이동합니다. 05.17 192 0
3812 [시승기] 시대를 초월한 디자인 DNA…’포르쉐 911 카레라 쿠페’ IT동아갤로그로 이동합니다. 05.17 185 0
3811 [IT신상공개] 입맛대로 고르는 저음, 소니 얼트 파워 사운드 IT동아갤로그로 이동합니다. 05.17 197 0
3810 "코바코의 대국민 AI 광고 제작 서비스, 네이버가 함께합니다" IT동아갤로그로 이동합니다. 05.17 181 0
3809 [생성 AI 길라잡이] 더 사람 같아진 AI, 'GPT-4o'는 어떻게 다를까? [2] IT동아갤로그로 이동합니다. 05.17 1266 1
3808 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 11 IT동아갤로그로 이동합니다. 05.16 199 0
3807 [뉴스줌인] PC 2대 연결해 하나처럼? 인텔 ‘썬더볼트 쉐어’ 기술 이모저모 [5] IT동아갤로그로 이동합니다. 05.16 2173 0
3806 스틸시리즈 코리아 “편의성 강화한 ‘아크티스 노바5’로 가파른 성장세 이어갈 것” IT동아갤로그로 이동합니다. 05.16 211 0
3805 [스타트업 첫걸음] 기고를 시작하며 IT동아갤로그로 이동합니다. 05.16 170 0
3804 [월간자동차] 24년 4월, 신차 등록 감소…기아 ’쏘렌토’ 4개월 연속 판매 1위 [1] IT동아갤로그로 이동합니다. 05.16 890 0
3803 10년 차 맞은 AWS 서밋 서울··· '국내 최대 IT·클라우드 행사로 자리매김' IT동아갤로그로 이동합니다. 05.16 232 0
3802 [자동차와 法] 딜레마존 구간에서 운전자 주의의무에 대하여 IT동아갤로그로 이동합니다. 05.14 229 0
3801 대기업부터 스타트업까지, K-우주산업 ‘성큼’ IT동아갤로그로 이동합니다. 05.14 247 0
3800 벤츠, 소비자가 외면한 전기차 디자인 손본다 [47] IT동아갤로그로 이동합니다. 05.14 8107 2
3799 우주방사선 차폐로 초소형위성 수명 늘린다 IT동아갤로그로 이동합니다. 05.14 236 0
3798 국내 기업 열에 일곱은 "이제 AI 활용 못 하는 직원은 고용 안 해" [37] IT동아갤로그로 이동합니다. 05.14 7431 9
3797 NHN두레이 기반의 협업 환경, KDI 국제정책대학원의 ‘저력’ 높인다 IT동아갤로그로 이동합니다. 05.14 198 0
3796 [IT강의실] 가상자산 맡기고 추가 수익 실현 ‘스테이킹’ IT동아갤로그로 이동합니다. 05.14 211 0
3795 화제의 K-패스 카드, 발급부터 활용까지 이렇게! [이럴땐 이렇게!] [1] IT동아갤로그로 이동합니다. 05.14 1994 2
3794 도로 위 시한폭탄 ‘맨홀 단차’ 빠르게 보수할 제품 실증 [4] IT동아갤로그로 이동합니다. 05.13 766 1
3793 와탭랩스, "옵저버빌리티 기업 정체성 확립··· 美·日·동남아 시장 성과낼 것" IT동아갤로그로 이동합니다. 05.13 200 0
3792 빗썸 “대학생 서포터즈 썸즈업이 제안한 개선안 적극 검토할 것” [3] IT동아갤로그로 이동합니다. 05.13 1055 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2