디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

사진 찍으면 AI가 문제 풀어주는 클로바엑스

GPTMAGAZINE갤로그로 이동합니다. 2024.08.23 12:11:26
조회 7838 추천 1 댓글 6




🔼 클로바 엑스에 이미지 인식 탑재
🔼 멀티모달 LLM으로 AI 진화 가속화
🔼 텍스트·이미지·음성 모두 처리 가능








네이버가 자사의 AI 비서 '클로바 엑스(CLOVA X)'에 이미지 인식 기능을 탑재하며 인공지능 기술 경쟁력 강화를 본격화했다. 이로 인해 사용자는 사진 속 상황을 설명하거나 표와 그래프를 분석하며, 수학 문제까지 해결할 수 있는 다재다능한 AI와 상호작용할 수 있게 됐다. 네이버는 이번 업데이트를 통해 텍스트뿐만 아니라 이미지와 음성까지 동시에 처리할 수 있는 멀티모달 AI로 클로바 엑스를 진화시키며, 생성형 AI 분야에서 경쟁력을 확보하려 하고 있다.


네이버는 오는 27일 클로바 엑스 서비스 업데이트를 통해 새로운 시각 정보 처리 기능을 추가한다고 22일 발표했다. 이번 업데이트의 핵심은 이미지 이해 기능으로, 사용자가 클로바 엑스 채팅창에 업로드한 이미지와 입력된 질의에 기반해 AI와 소통할 수 있도록 지원한다.


클로바 엑스는 사진 속 현상을 설명하거나 상황을 추론하는 등 다양한 지시를 수행할 수 있다. 예를 들어, 표와 그래프를 이미지 형태로 입력하면 이를 이해하고 분석하는 능력을 보여준다. 네이버는 자사의 우수한 문서 처리 및 문자 인식 기술과 다양한 분야의 지식을 가진 대규모 언어 모델(HyperclovaX)을 결합해 보다 정확하고 신뢰할 수 있는 서비스를 제공한다고 밝혔다.


네이버는 실제로 국내 초·중·고등학교 검정고시 문제 1,480개를 AI 모델에 이미지로 입력해 문제를 해결해보는 실험을 진행했다. 그 결과, 클로바 엑스가 학생들의 학습을 지원할 수 있는 가능성을 확인했다고 전했다.


또한, 네이버는 20일 '클로바' 공식 기술 블로그를 통해 HyperClovaX 기반의 음성 AI 기술도 공개했다. 이 모델은 기존 음성 인식 및 음성 합성 기술보다 더욱 발전된 형태로, 대규모 언어 모델의 우수한 맥락 이해와 명령 해석 능력을 활용해 언어 구조와 발음 정확도를 개선했으며, 감정 표현이 가능한 자연스러운 대화를 제공할 수 있게 됐다.


네이버는 AI 음성 녹음 '클로바 노트', AI 인사 전화 '클로바 케어 콜', AI 음성 합성 '클로바 더빙' 등 다양한 음성 AI 서비스를 이미 선보였으며, 이번 음성 멀티모달 LLM 기술을 통해 실시간 음성 번역, 언어 학습, 상담 등 다양한 서비스에 활용할 가능성을 제시했다.


네이버 클라우드의 하이퍼스케일 AI 기술 총괄인 성낙호는 “HyperClovaX를 멀티모달 LLM으로 발전시켜 AI 안전성을 강화할 계획”이라며, “네이버 AI 안전 프레임워크(ASF)를 활용해 AI 시스템의 잠재적 위험을 평가하고, 음성 AI 기술이 보다 안전한 서비스를 제공할 수 있도록 지속적으로 검토할 것”이라고 밝혔다.


네이버는 HyperclovaX를 멀티모달 LLM으로 발전시키는 과정에서 AI 안전성을 강화하기 위해 지속적으로 노력할 계획이다. 지난 6월 발표된 네이버 AI 안전 프레임워크(ASF)를 통해 AI 시스템의 잠재적 위험성을 평가하고, 다양한 측면을 검토하여 보다 안전한 AI 서비스를 제공할 방침이다.










◎GPT매거진 (https://www.gptmagazine.net)
지피티 기자 : gptmagazinebiz@gmail.com
카카오 오픈채팅방 : https://open.kakao.com/o/gLI8Wetf
페이스북 그룹 : https://www.facebook.com/groups/392367786704067

추천 비추천

1

고정닉 0

14

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 2025년 가장 기억에 남는 인터넷 이슈는? 운영자 25/12/22 - -
378 OpenAI, AI 모델 'Strawberry' 출시 임박 [11] GPTMAGAZINE갤로그로 이동합니다. 24.09.11 3822 2
377 IBC 2024, 생성형 AI로 미디어와 엔터테인먼트 산업 혁신 이끌다 [1] GPTMAGAZINE갤로그로 이동합니다. 24.09.10 6521 2
376 SKT, 퍼플렉시티 프로, SKT 고객에게 1년 무료 제공 [2] GPTMAGAZINE갤로그로 이동합니다. 24.09.06 8405 0
375 구글 제미나이, 이제 크롬에서 바로 사용 [5] GPTMAGAZINE갤로그로 이동합니다. 24.09.06 4202 2
374 테드 창, AI는 예술가인가? 아니면 기계일 뿐인가? [76] GPTMAGAZINE갤로그로 이동합니다. 24.09.04 9794 14
373 오픈AI, 주간 사용자 2억 명 돌파 [5] GPTMAGAZINE갤로그로 이동합니다. 24.09.02 3732 6
372 구글, AI 기반 둠 게임 엔진 시뮬레이션 개발에 성공 [18] GPTMAGAZINE갤로그로 이동합니다. 24.08.30 9941 7
371 오픈AI, 서치GPT 개발로 인한 추가 투자 유치 인가? [2] GPTMAGAZINE갤로그로 이동합니다. 24.08.29 6538 0
370 오픈AI, 딥페이크 방지 위해 워터마크 법안 지지 [15] GPTMAGAZINE갤로그로 이동합니다. 24.08.28 4801 5
369 SK텔레콤 '에이닷', 지피티, 클로드 등 최신 언어 모델 7종 도입 GPTMAGAZINE갤로그로 이동합니다. 24.08.27 6132 4
368 구글 AI 스튜디오, 프롬프트 갤러리로 개발자 지원 [1] GPTMAGAZINE갤로그로 이동합니다. 24.08.26 3950 2
사진 찍으면 AI가 문제 풀어주는 클로바엑스 [6] GPTMAGAZINE갤로그로 이동합니다. 24.08.23 7838 1
366 NVIDIA, AI 기술로 게임 캐릭터 대화 능력 대폭 향상 [21] GPTMAGAZINE갤로그로 이동합니다. 24.08.22 7844 11
365 GPT-4o, 개발자 위한 파인튜닝 서비스 공식 출시 [5] GPTMAGAZINE갤로그로 이동합니다. 24.08.21 7602 3
364 런웨이ML, '젠-3 알파 터보' 출시 [4] GPTMAGAZINE갤로그로 이동합니다. 24.08.19 1860 0
363 일론머스크의 xAI, 'Grok2' 출시 [5] GPTMAGAZINE갤로그로 이동합니다. 24.08.16 6692 0
362 구글, AI 음성 비서 ‘Gemini Live’ 공식 출시 [13] GPTMAGAZINE갤로그로 이동합니다. 24.08.14 8874 1
361 오픈AI, 'GPT-5' 공개 임박? [6] GPTMAGAZINE갤로그로 이동합니다. 24.08.13 3576 4
360 미드저니 위협하는 Flux.1, 얼마나 강력한가? [2] GPTMAGAZINE갤로그로 이동합니다. 24.08.12 2822 0
359 LLM은 가고, LAM이 온다...AI의 한계 [12] GPTMAGAZINE갤로그로 이동합니다. 24.08.09 5436 9
358 LG, 차세대 AI 모델 ‘EXAONE 3.0’ 오픈 소스로 공개 [6] GPTMAGAZINE갤로그로 이동합니다. 24.08.08 3850 0
357 일론머스크, 오픈AI 설립 초기 약속 배신당해 [1] GPTMAGAZINE갤로그로 이동합니다. 24.08.07 4051 2
356 ChatGPT 표절 방지 기술, 왜 비공개? [7] GPTMAGAZINE갤로그로 이동합니다. 24.08.05 4303 1
355 오픈AI, 'GPT-5' 모델 미국 정부에 첫 공개 [17] GPTMAGAZINE갤로그로 이동합니다. 24.08.05 4034 5
354 EU, 세계 최초 AI 규제법 발효 [35] GPTMAGAZINE갤로그로 이동합니다. 24.08.02 8037 17
353 엔비디아와 메타, 구글과 애플의 동맹 [3] GPTMAGAZINE갤로그로 이동합니다. 24.07.31 7537 3
352 오픈AI, 챗GPT 운영비 부담으로 인한 재정 위기 [51] GPTMAGAZINE갤로그로 이동합니다. 24.07.30 10364 9
351 Meta, 최신 AI 모델 'Rama 3.1' 출시 [8] GPTMAGAZINE갤로그로 이동합니다. 24.07.25 3287 1
350 애플, 2.5조 개 토큰으로 훈련된 7B 오픈소스 언어 모델 공개 GPTMAGAZINE갤로그로 이동합니다. 24.07.23 3299 2
349 네이버 거대AI 하이퍼클로바, 파라미터 숫자 공개 [11] GPTMAGAZINE갤로그로 이동합니다. 24.07.22 4042 1
348 오픈AI, 자사 최강 모델의 미니 버전 'GPT-4o mini' 출시 [13] GPTMAGAZINE갤로그로 이동합니다. 24.07.19 3221 1
347 엔비디아-미스트랄AI, 신규 AI 모델 '미스트랄 네모' 출시 GPTMAGAZINE갤로그로 이동합니다. 24.07.19 857 1
346 글로벌 건설 AI 시장, 2조원 돌파 [3] GPTMAGAZINE갤로그로 이동합니다. 24.07.18 2438 1
345 엔비디아와 메타 CEO, SIGGRAPH에서 AI와 그래픽스의 미래 논의 [1] GPTMAGAZINE갤로그로 이동합니다. 24.07.17 2228 1
344 AI, 알츠하이머 예측 정확도 78.5% 달성 [11] GPTMAGAZINE갤로그로 이동합니다. 24.07.16 4121 6
343 (주) 엑스알엑스, 마이크로소프트 런처 프로그램 선정 GPTMAGAZINE갤로그로 이동합니다. 24.07.15 963 0
342 오픈AI, AGI 5단계 중 2단계 발표 GPTMAGAZINE갤로그로 이동합니다. 24.07.15 1102 1
341 오픈AI 서비스 중단! 중국 기업 '멘붕' [47] GPTMAGAZINE갤로그로 이동합니다. 24.07.10 9198 17
340 AI 기술, 군사 분야서 활약 중…보안 문제 해결 시급 [3] GPTMAGAZINE갤로그로 이동합니다. 24.07.08 3312 2
339 애플, 오픈AI 이사회 참관 "MS와 동등한 위치 확보" [5] GPTMAGAZINE갤로그로 이동합니다. 24.07.05 3437 0
338 (주)엑스알엑스, 2024년 인천공항 스타트업 육성사업 선정 GPTMAGAZINE갤로그로 이동합니다. 24.07.02 5546 0
337 챗GPT, 인간을 능가한 재무제표 분석 능력 [4] GPTMAGAZINE갤로그로 이동합니다. 24.07.01 8132 8
336 챗GPT-4, 실제 학생보다 높은 점수 받아 [33] GPTMAGAZINE갤로그로 이동합니다. 24.06.27 9398 13
335 오픈AI 창업자 일리야 수츠케버, 새로운 AI 스타트업 설립 [2] GPTMAGAZINE갤로그로 이동합니다. 24.06.24 4006 1
334 AI 미인대회, 1500명 참가 [32] GPTMAGAZINE갤로그로 이동합니다. 24.06.17 14036 22
333 애플 AI 리더, 삼성에 전격 이직! [22] GPTMAGAZINE갤로그로 이동합니다. 24.06.13 4541 5
331 스태빌리티 AI, 음악 창작의 혁명! [5] GPTMAGAZINE갤로그로 이동합니다. 24.06.10 7109 2
330 챗GPT 해킹 사건, 필로폰 제조법까지 노출 [7] GPTMAGAZINE갤로그로 이동합니다. 24.06.04 5674 3
329 애플, 오픈AI와 AI 탑재 계약 체결 [16] GPTMAGAZINE갤로그로 이동합니다. 24.06.03 8196 2
328 오픈AI, GPT-4o 무료 개방, 고급 AI 기능 체험 가능케 하다 [11] GPTMAGAZINE갤로그로 이동합니다. 24.05.31 10205 10
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2