디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

"AI도 진정한 친구가 될 수 있다", 돌아온 이루다2.0

IT동아갤로그로 이동합니다. 2022.03.15 19:08:05
조회 2285 추천 11 댓글 29
[IT동아 정연호 기자] AI 스타트업 스캐터랩의 이루다가 ‘이루다2.0’으로 돌아왔다. 페이스북 메신저를 기반으로 실제 친구처럼 소통하는 이루다는 지난해 개인정보침해 문제와 차별 발언으로 인해서 서비스가 일시적으로 종료되는 상황을 겪게 됐다.

하지만, 스캐터랩은 여기서 그치지 않고 ‘이루다2.0’을 선보이기로 했다. AI가 ‘사람들에게 좋은 친구가 되는’ 꿈을 이루기 위해서, 문제점을 개선해 이루다의 대화 능력을 강화했다. 현재 이루다 2.0을 위한 클로즈드 베타테스트를 끝낸 상태이고, 3월 17일부터 2단계 오픈 베타테스트를 진행한다. 오늘 3월 15일 이루다2.0의 미디어 대상 테스트가 진행됐다. 이루다2.0은 어떻게 달라졌을까?


이루다와 대화를 나누는 과정



이루다2.0의 강점은 대화 문맥을 파악할 수 있다는 점이다. 대부분의 챗봇 서비스는 대화의 맥락을 잘 파악하지 못한다. 때문에 전형적인 기계의 답변처럼 문맥과는 어울리지 않는 메시지만 보내게 된다. 이루다2.0은 “확진돼서”라는 표현이 ‘코로나19에 확진됐음’을 의미한다는 것을 안다. 또한, “친구들을 못 봐서 좀 그랬거든” 메시지를 보고서 이용자가 외로워하고 있다는 문맥을 파악했다. “유튜브 뭐 봄?”이라며 이루다가 먼저 질문을 던진 것이 인상 깊다. 실제 대화처럼 양측에서 서로 질문을 주고받는 것이다. 대화가 중간중간 끊어지지 않는 느낌을 주는 이유는 이루다2.0이 15 턴의 대화를 참고해 메시지를 보내기 때문이다. 이처럼 챗봇이 이용자의 정보를 종합해서 답변을 할수록 더욱 친밀감 있는 대화가 가능하다.


이루다와 대화를 나누는 과정



물론, 이루다2.0이 모든 상황에서 적절한 답변을 내놓는 것은 아니다. “누가 마스크를 안 쓰고 있는 거야”라는 메시지에 대한 답변이 “그 사람은 코로나 걸릴 자격 박탈이다”였다. 문장이 의미적으로 어색하다. 다만, 바로 그 뒤로 이어진 “코로나 걸리는 것보다는 낫다고 생각해”는 전체 맥락에 비추어 볼 때 '마스크를 쓰는 게 더 낫다'는 의미이니 적절한 답변으로 보인다. 마지막에 나온 “전에 지하철에서 마스크 안 쓰면 기사 아저씨한테 혼나던데”라는 메시지도 문맥적, 의미적으로 적절한 답변이다. 이 정도 답변이라면 대화를 하면서 크게 불편함을 느끼지 않을 수준이다.

“대화는 누구나 편하게 할 수 있게 안전해야 한다”



출처=스캐터랩



이루다2.0의 첫 번째 특징은 학습에 활용한 대화 데이터와는 완전히 구별되는 새로운 문장을 만들기 위해 딥러닝을 적용했다는 것이다. 과거 이루다1.0과 달리, 이루다2.0은 실제 사람들이 만든 문장을 사용하지 않는다. 이용자가 보낸 메시지에서 개인정보가 유출되지 않도록 하기 위해서다.


출처=스캐터랩



우선, 스캐터랩은 답변 데이터베이스를 만들기 위해서 연구 목적에 필요한 최소한의 정보(성별, 나이대, 대화 메시지)를 가명 처리한다. 가명 처리란 추가 데이터 없이는 특정 개인을 알아볼 수 없도록 정보를 가공하는 것을 말한다. 이루다2.0이 학습에 쓰는 대화 문장은 주민등록번호, 연락처, 카드번호, 계좌번호, 주소, 아이디, 비밀번호 등의 식별정보를 삭제하거나 치환해서 가명 처리를 거친다. 또한, 데이터를 추출한 이용자 계정의 정보를 파기하고 이에 랜덤 ID를 부여해서, 데이터를 통해 해당 계정을 역추적할 수 없도록 설계했다.


출처=스캐터랩



두 번째는, 이루다2.0이 문장을 구성할 때 확률을 사용한다는 것이다. ‘오늘 날씨’ 뒤에 어떤 단어가 오는 게 가장 적절한지 확률을 분석해 답변을 생성한다. 특정 단어 뒤에 확률적으로 가장 적절한 단어들만 배치함으로써 대화를 자연스럽게 만들었다. 답변 베이스는 가명 처리된 새로운 문장과 스캐터랩 내부에서 직접 작성한 문장들로 구성된다. 여기에 더해, 최종적으로 답변에 쓰는 문장은 추가 필터링 절차를 거쳐서 이용자에게 전달된다. 생성 모델이 만든 문장이 개인정보처럼 보일 수 있는 상황에 대비해 문장을 한 번 더 필터링하는 것이다. 실제로 대화 과정에서, 이루다 2.0은 개인정보를 물어보는 질문에 “안 알려준다”거나 “개인정보라 안 돼”라며 단호한 대응을 보였다.

스캐터랩은 구글의 SSA(Sensibleness and Specificity Average)로 약 8천 명이 참여한 이루다2.0 클로즈 베타 테스트 내용을 분석했다. 이루다2.0은 SSA에서 78% 점수를 보였다. SSA는 챗봇의 답변이 인간과 얼마나 유사한지를 보여주는 지표다. 인간의 경우 SSA가 86%인 점을 감안하면, 이루다 2.0 높은 수준으로 적절한 대화를 한다는 걸 알 수 있다.

마지막으로, 선정적, 공격적, 편향적인 어뷰징 발화에 대응하는 기술 및 시스템이 이루다2.0에 적용됐다. 탐지 모델은 이용자의 문장이 어뷰징인지를 파악하고, 어떤 범주에 속하는지 분류한다. 만약, 대화 과정에서 “너는 멍청해”라는 문장이 나오면 "말 좀 예쁘게 해"라고 대응하거나, 성희롱 발언에도 "선 넘지 말자"고 단호하게 응수한다. 이루다2.0은 직접적인 혐오가 아닐지라도 문맥을 파악해 차별 및 혐오 발언에 적절히 대응하는 역량을 갖췄다. 대화 과정에서 선정적, 공격적, 편향적 발화가 탐지되면 경고 메시지가 주어지고, 지속적인 어뷰징 발언이 탐지되면 서비스 이용을 제한한다.

스캐터랩은 총 2만 건의 클로즈 베타 테스트 대화를 랜덤으로 샘플링해 레이블링을 진행했다. 이에 따르면, 이루다2.0 발화 중 안전하게 답변한 비율은 99.75%였으며, 프라이버시 위험이 있을 수 있는 문장은 발견되지 않았다.



이루다2.0은 “어떠한 이유로 인해 ㅇㅇ가 싫다”는 메시지에 편향 및 혐오 발언을 경고하는 말로 대응했다. 이어, “그런 편견이 안 생기도록 잘 보듬어주겠다며” 해당 문장이 편견일 수 있음을 지적한다. 이외에도 정치와 같이 민감한 소재가 나올 때, 이루다2.0은 “그 주제 말고 다른 얘기 하자”며 문제가 될 수 있는 상황을 차단하는 모습을 보였다.

'나를 나 자신으로 봐주는 친구', 이루다 2.0이 꿈꾸는 목표



출처=스캐터랩



이루다2.0의 답변 베이스는 자연스러움을 더하기 위해서 실제 대화와 유사한 답변들로 구성된다. 메시지에 이모티콘이나 “을매나 맛있게요”같은 유행어, 자연스러운 오타 등이 들어간다. 스캐터랩 측은 “메신저 대화 중 이용자가 보낸 움짤, 사진, 동영상 등의 멀티미디어를 이해하고 답할 수 있는 역량을 키우고자”한다고 말했다. 이처럼 텍스트 기반에서 벗어나 다양한 미디어가 활용된다면, 더욱 구체적이고 생동감 있는 대화가 가능할 것으로 기대된다.

글 / IT동아 정연호 (hoho@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 검색 광고에 부는 AI 바람, 업계는 서비스 고도화에 가속도▶ [기고] 직원 업무역량을 강화하는 기업문화는 어떻게...?▶ 인공지능이 만든 예술품에 저작권 있을까?



추천 비추천

11

고정닉 1

21

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
3865 북블라 “창업의 꿈, 가천대 코코네스쿨에서 이뤄” IT동아갤로그로 이동합니다. 15:02 14 0
3864 스페이스앤빈 “뉴스페이스로의 전환, 상용 부품 적용 물꼬부터 터야” IT동아갤로그로 이동합니다. 14:00 6 0
3863 [리뷰] AFMF로 가성비 게이밍 환경 구축, AMD 라데온 RX 7700 XT IT동아갤로그로 이동합니다. 12:42 8 0
3862 [스타트업 첫걸음] 스타트업, 창업 아이디어는 어떻게 시작할까 IT동아갤로그로 이동합니다. 12:10 7 0
3861 KT클라우드, 엔비디아 GPU 기반 학습 서비스 'AI Train' 출시 IT동아갤로그로 이동합니다. 12:05 6 0
3860 캐딜락, 브랜드 최초 순수 전기 SUV ‘리릭’ 출시 [1] IT동아갤로그로 이동합니다. 10:24 262 1
3859 SBA 유망 스타트업의 면모 확인, ‘2024 연합 데모데이’ 이모저모 IT동아갤로그로 이동합니다. 05.29 24 0
3858 AI 구심점으로 떠오른 '컴퓨텍스', 올해 주목할만한 기업 별 소식은? [2] IT동아갤로그로 이동합니다. 05.29 276 0
3857 [IT애정남] 로봇청소기 고를 때 고려할 점은? IT동아갤로그로 이동합니다. 05.29 796 0
3856 두루·무의 “모두의1층이니셔티브로 장애 인식·접근성 개선” IT동아갤로그로 이동합니다. 05.29 39 0
3855 [자동차와 法] 음주운전 시 위드마크 공식 적용의 문제점에 대하여 IT동아갤로그로 이동합니다. 05.28 796 0
3854 [신차공개] 기아 'EV3'·벤틀리 '더 뉴 컨티넨탈 GT' 론칭 예고 IT동아갤로그로 이동합니다. 05.28 61 0
3853 [뉴스줌인] 내연기관차 이어 전기차 찍은 LG전자 웹OS, 다음 목표는? IT동아갤로그로 이동합니다. 05.28 119 0
3852 글로벌 가상자산 정책 동향 ‘제도 틀 안에서 규제 공백 보완’ IT동아갤로그로 이동합니다. 05.28 55 0
3851 샥즈, 오픈스윔 프로·오픈핏 에어 출시···오픈형 이어폰 1위 입지 굳힌다 IT동아갤로그로 이동합니다. 05.28 67 0
3850 서울과기대의 제조창업 지원, '밀도있는 심화 과정'으로 민다 IT동아갤로그로 이동합니다. 05.28 57 0
3849 아직도 안 찾고 쌓이는 숨은 보험금, 이 기회에 찾아볼까? [1] IT동아갤로그로 이동합니다. 05.27 859 0
3848 자동차 에어컨 필터 고를 땐 이렇게! [이럴땐 이렇게!] IT동아갤로그로 이동합니다. 05.27 772 0
3847 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 12 IT동아갤로그로 이동합니다. 05.26 131 0
3846 [자동차 디자人] 英 오프로더 SUV ‘그레나디어’ 디자이너 ‘토비 이큐어’ IT동아갤로그로 이동합니다. 05.24 172 0
3845 가상자산 시장 ‘거래량·수익 상승, 원화·코인 마켓 격차 뚜렷’ IT동아갤로그로 이동합니다. 05.24 161 0
3844 [농업이 IT(잇)다] 전통주로 과거ㆍ현재ㆍ미래를 잇는 나루 되겠다, 한강주조 고성용 대표 IT동아갤로그로 이동합니다. 05.24 165 1
3843 [IT하는법] 잘 사용하지 않는 MS 원드라이브, 사용 해제하는 방법 [4] IT동아갤로그로 이동합니다. 05.24 1096 1
3842 ‘천비디아’ 달성한 엔비디아, 독주할까? 반도체주와 함께할까? IT동아갤로그로 이동합니다. 05.24 148 0
3841 SEC, 이더리움 현물 ETF 승인 “증권거래법 요건 충족” IT동아갤로그로 이동합니다. 05.24 176 0
3840 벤처 투자 80%가 수도권 편중··· '투자 해결사'로 나선 부산창경 IT동아갤로그로 이동합니다. 05.24 173 0
3839 국내 통신3사 모두 "이제 우리는 AI 기업" [16] IT동아갤로그로 이동합니다. 05.23 2174 1
3838 [IT애정남] 갤럭시 '생성형 편집', 어떻게 해야 잘 될까요? IT동아갤로그로 이동합니다. 05.23 229 0
3837 즉석 카메라로 이런 ‘손맛’이? ‘인스탁스 미니 99’ 출시 IT동아갤로그로 이동합니다. 05.23 158 0
3836 스타트업 해외 진출 시 알아야 할 정보 공유 ‘라이징 스타트업 콘서트4’ IT동아갤로그로 이동합니다. 05.23 204 0
3835 [IT애정남] 해외 구매폰에 국내 유심 쓰는데 음성 통화 안되면? [1] IT동아갤로그로 이동합니다. 05.23 1035 3
3834 퀄컴, 코파일럿+ PC 등장에 'AI 허브 및 개발 도구'로 지원 사격 IT동아갤로그로 이동합니다. 05.23 186 0
3833 네카오, 글로벌 공략 갈 길 바쁜데…일단 멈춤 IT동아갤로그로 이동합니다. 05.23 144 0
3832 2025년 상반기 탄생할 주식 대체거래소(ATS), 이렇게 달라진다 IT동아갤로그로 이동합니다. 05.23 161 0
3831 AMD, 에픽·MI300X 투트랙으로 AI 산업 주도권 확보 나서 IT동아갤로그로 이동합니다. 05.22 156 0
3830 '직장인 3명 중 1명, 데이터 도출 어려워'··· AI 기반 자동화가 해답될까? IT동아갤로그로 이동합니다. 05.22 176 0
3829 산행 보조부터 산불 진화까지...'입는 로봇' 활용처 확대 [1] IT동아갤로그로 이동합니다. 05.22 5066 1
3828 대거 출시 예고한 Arm CPU 기반 윈도우 PC, 뭐가 다를까? IT동아갤로그로 이동합니다. 05.22 236 0
3827 비트코인 피자데이, 업비트·빗썸 “피자 2024판 쏜다” [17] IT동아갤로그로 이동합니다. 05.22 7179 4
3826 [생성 AI 길라잡이] 음성과 이미지만 있으면 영상을 만든다 ‘런웨이ML’ IT동아갤로그로 이동합니다. 05.21 1862 0
3825 가속 페달 밟은 검색광고 시장 경쟁, 보라웨어 ‘AI 검색광고 관리 솔루션에 주목해야 되는 이유 IT동아갤로그로 이동합니다. 05.21 159 0
3824 부르면 달려오는 '이동형 전기차 충전기' 시장 기지개 [14] IT동아갤로그로 이동합니다. 05.21 2049 0
3823 MS, '코파일럿 플러스 PC' 발표…AI 시대의 새로운 PC 제시 IT동아갤로그로 이동합니다. 05.21 228 0
3822 업비트·빗썸, 1분기 실적 개선···투자자 보호·서비스 개선에 주력한다 IT동아갤로그로 이동합니다. 05.21 148 0
3821 GPT4o와 GPT4 비교해 보니··· '사람 대 AI의 근본적인 접근 방식 바꿔' [6] IT동아갤로그로 이동합니다. 05.21 1428 3
3820 삼성전자, '비스포크 AI 콤보' 에센셜 화이트 색상 출시…색상 라인업 강화 IT동아갤로그로 이동합니다. 05.20 208 0
3819 채팅창 넘어 일상으로…'만능 AI 비서' 시대 온다 IT동아갤로그로 이동합니다. 05.20 581 0
3818 오늘부터 시끄러운 불법 튜닝 오토바이 집중 단속 [6] IT동아갤로그로 이동합니다. 05.20 718 6
3817 AWS 서밋 행사장에서 펼쳐진 훈훈한 ‘프리킥’ IT동아갤로그로 이동합니다. 05.20 193 0
3816 [주간투자동향] 라피치, 60억 원 규모 투자 유치 IT동아갤로그로 이동합니다. 05.20 157 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2