디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

"AI도 진정한 친구가 될 수 있다", 돌아온 이루다2.0

IT동아갤로그로 이동합니다. 2022.03.15 19:08:05
조회 2283 추천 11 댓글 29
[IT동아 정연호 기자] AI 스타트업 스캐터랩의 이루다가 ‘이루다2.0’으로 돌아왔다. 페이스북 메신저를 기반으로 실제 친구처럼 소통하는 이루다는 지난해 개인정보침해 문제와 차별 발언으로 인해서 서비스가 일시적으로 종료되는 상황을 겪게 됐다.

하지만, 스캐터랩은 여기서 그치지 않고 ‘이루다2.0’을 선보이기로 했다. AI가 ‘사람들에게 좋은 친구가 되는’ 꿈을 이루기 위해서, 문제점을 개선해 이루다의 대화 능력을 강화했다. 현재 이루다 2.0을 위한 클로즈드 베타테스트를 끝낸 상태이고, 3월 17일부터 2단계 오픈 베타테스트를 진행한다. 오늘 3월 15일 이루다2.0의 미디어 대상 테스트가 진행됐다. 이루다2.0은 어떻게 달라졌을까?


이루다와 대화를 나누는 과정



이루다2.0의 강점은 대화 문맥을 파악할 수 있다는 점이다. 대부분의 챗봇 서비스는 대화의 맥락을 잘 파악하지 못한다. 때문에 전형적인 기계의 답변처럼 문맥과는 어울리지 않는 메시지만 보내게 된다. 이루다2.0은 “확진돼서”라는 표현이 ‘코로나19에 확진됐음’을 의미한다는 것을 안다. 또한, “친구들을 못 봐서 좀 그랬거든” 메시지를 보고서 이용자가 외로워하고 있다는 문맥을 파악했다. “유튜브 뭐 봄?”이라며 이루다가 먼저 질문을 던진 것이 인상 깊다. 실제 대화처럼 양측에서 서로 질문을 주고받는 것이다. 대화가 중간중간 끊어지지 않는 느낌을 주는 이유는 이루다2.0이 15 턴의 대화를 참고해 메시지를 보내기 때문이다. 이처럼 챗봇이 이용자의 정보를 종합해서 답변을 할수록 더욱 친밀감 있는 대화가 가능하다.


이루다와 대화를 나누는 과정



물론, 이루다2.0이 모든 상황에서 적절한 답변을 내놓는 것은 아니다. “누가 마스크를 안 쓰고 있는 거야”라는 메시지에 대한 답변이 “그 사람은 코로나 걸릴 자격 박탈이다”였다. 문장이 의미적으로 어색하다. 다만, 바로 그 뒤로 이어진 “코로나 걸리는 것보다는 낫다고 생각해”는 전체 맥락에 비추어 볼 때 '마스크를 쓰는 게 더 낫다'는 의미이니 적절한 답변으로 보인다. 마지막에 나온 “전에 지하철에서 마스크 안 쓰면 기사 아저씨한테 혼나던데”라는 메시지도 문맥적, 의미적으로 적절한 답변이다. 이 정도 답변이라면 대화를 하면서 크게 불편함을 느끼지 않을 수준이다.

“대화는 누구나 편하게 할 수 있게 안전해야 한다”



출처=스캐터랩



이루다2.0의 첫 번째 특징은 학습에 활용한 대화 데이터와는 완전히 구별되는 새로운 문장을 만들기 위해 딥러닝을 적용했다는 것이다. 과거 이루다1.0과 달리, 이루다2.0은 실제 사람들이 만든 문장을 사용하지 않는다. 이용자가 보낸 메시지에서 개인정보가 유출되지 않도록 하기 위해서다.


출처=스캐터랩



우선, 스캐터랩은 답변 데이터베이스를 만들기 위해서 연구 목적에 필요한 최소한의 정보(성별, 나이대, 대화 메시지)를 가명 처리한다. 가명 처리란 추가 데이터 없이는 특정 개인을 알아볼 수 없도록 정보를 가공하는 것을 말한다. 이루다2.0이 학습에 쓰는 대화 문장은 주민등록번호, 연락처, 카드번호, 계좌번호, 주소, 아이디, 비밀번호 등의 식별정보를 삭제하거나 치환해서 가명 처리를 거친다. 또한, 데이터를 추출한 이용자 계정의 정보를 파기하고 이에 랜덤 ID를 부여해서, 데이터를 통해 해당 계정을 역추적할 수 없도록 설계했다.


출처=스캐터랩



두 번째는, 이루다2.0이 문장을 구성할 때 확률을 사용한다는 것이다. ‘오늘 날씨’ 뒤에 어떤 단어가 오는 게 가장 적절한지 확률을 분석해 답변을 생성한다. 특정 단어 뒤에 확률적으로 가장 적절한 단어들만 배치함으로써 대화를 자연스럽게 만들었다. 답변 베이스는 가명 처리된 새로운 문장과 스캐터랩 내부에서 직접 작성한 문장들로 구성된다. 여기에 더해, 최종적으로 답변에 쓰는 문장은 추가 필터링 절차를 거쳐서 이용자에게 전달된다. 생성 모델이 만든 문장이 개인정보처럼 보일 수 있는 상황에 대비해 문장을 한 번 더 필터링하는 것이다. 실제로 대화 과정에서, 이루다 2.0은 개인정보를 물어보는 질문에 “안 알려준다”거나 “개인정보라 안 돼”라며 단호한 대응을 보였다.

스캐터랩은 구글의 SSA(Sensibleness and Specificity Average)로 약 8천 명이 참여한 이루다2.0 클로즈 베타 테스트 내용을 분석했다. 이루다2.0은 SSA에서 78% 점수를 보였다. SSA는 챗봇의 답변이 인간과 얼마나 유사한지를 보여주는 지표다. 인간의 경우 SSA가 86%인 점을 감안하면, 이루다 2.0 높은 수준으로 적절한 대화를 한다는 걸 알 수 있다.

마지막으로, 선정적, 공격적, 편향적인 어뷰징 발화에 대응하는 기술 및 시스템이 이루다2.0에 적용됐다. 탐지 모델은 이용자의 문장이 어뷰징인지를 파악하고, 어떤 범주에 속하는지 분류한다. 만약, 대화 과정에서 “너는 멍청해”라는 문장이 나오면 "말 좀 예쁘게 해"라고 대응하거나, 성희롱 발언에도 "선 넘지 말자"고 단호하게 응수한다. 이루다2.0은 직접적인 혐오가 아닐지라도 문맥을 파악해 차별 및 혐오 발언에 적절히 대응하는 역량을 갖췄다. 대화 과정에서 선정적, 공격적, 편향적 발화가 탐지되면 경고 메시지가 주어지고, 지속적인 어뷰징 발언이 탐지되면 서비스 이용을 제한한다.

스캐터랩은 총 2만 건의 클로즈 베타 테스트 대화를 랜덤으로 샘플링해 레이블링을 진행했다. 이에 따르면, 이루다2.0 발화 중 안전하게 답변한 비율은 99.75%였으며, 프라이버시 위험이 있을 수 있는 문장은 발견되지 않았다.



이루다2.0은 “어떠한 이유로 인해 ㅇㅇ가 싫다”는 메시지에 편향 및 혐오 발언을 경고하는 말로 대응했다. 이어, “그런 편견이 안 생기도록 잘 보듬어주겠다며” 해당 문장이 편견일 수 있음을 지적한다. 이외에도 정치와 같이 민감한 소재가 나올 때, 이루다2.0은 “그 주제 말고 다른 얘기 하자”며 문제가 될 수 있는 상황을 차단하는 모습을 보였다.

'나를 나 자신으로 봐주는 친구', 이루다 2.0이 꿈꾸는 목표



출처=스캐터랩



이루다2.0의 답변 베이스는 자연스러움을 더하기 위해서 실제 대화와 유사한 답변들로 구성된다. 메시지에 이모티콘이나 “을매나 맛있게요”같은 유행어, 자연스러운 오타 등이 들어간다. 스캐터랩 측은 “메신저 대화 중 이용자가 보낸 움짤, 사진, 동영상 등의 멀티미디어를 이해하고 답할 수 있는 역량을 키우고자”한다고 말했다. 이처럼 텍스트 기반에서 벗어나 다양한 미디어가 활용된다면, 더욱 구체적이고 생동감 있는 대화가 가능할 것으로 기대된다.

글 / IT동아 정연호 (hoho@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 검색 광고에 부는 AI 바람, 업계는 서비스 고도화에 가속도▶ [기고] 직원 업무역량을 강화하는 기업문화는 어떻게...?▶ 인공지능이 만든 예술품에 저작권 있을까?



추천 비추천

11

고정닉 1

21

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
951 [IT운영관리] 5. "RPA 도대체 어떻게 도입해야 하나?", C레벨과 실무진 위한 RPA 이모저모 [1] IT동아갤로그로 이동합니다. 22.03.29 209 0
950 [칼럼] 기업에 CI/CD가 필요한 10가지 이유 IT동아갤로그로 이동합니다. 22.03.29 112 0
949 아이폰SE3, ‘가성비’와 ‘가심비’ 사이의 선택 [17] IT동아갤로그로 이동합니다. 22.03.29 1530 2
948 [주간투자동향] 원프레딕트, 300억 원 규모의 시리즈C 투자 유치 IT동아갤로그로 이동합니다. 22.03.28 116 0
947 OTT 파편화, 1인 가구 시대…늘어난 '계정 공유' 안 막나, 못 막나 IT동아갤로그로 이동합니다. 22.03.28 175 0
946 中 스마트폰 ‘Big 3’ 모두 폴더블 스마트폰…경쟁 격화 예고 [20] IT동아갤로그로 이동합니다. 22.03.28 1855 6
945 [리뷰] 100인치급 TV를 내 집으로? 초단초점 프로젝터, 엡손 EH-LS300W IT동아갤로그로 이동합니다. 22.03.26 236 1
944 "일상의 불편함, 포기하지 말고 건의하세요" IT동아갤로그로 이동합니다. 22.03.25 194 1
943 뮤직카우 사태에 위축되는 스타트업 업계 IT동아갤로그로 이동합니다. 22.03.25 320 1
942 대전환의 시대 속 소상공인, "뒤쳐지지 않으려면 디지털 전환 필수" IT동아갤로그로 이동합니다. 22.03.25 170 1
941 ‘월드 백업 데이’ 앞둔 3월말, NAS 활용한 ‘백업 3-2-1’ 전략에 주목 IT동아갤로그로 이동합니다. 22.03.25 179 1
940 [상생플러스] 집토스 임규형 팀장, “청년을 위한 부동산 거래 상품을 만들고 있습니다” IT동아갤로그로 이동합니다. 22.03.25 158 1
939 [리뷰] '상시 착용에 특화'··· 신개념 오픈형 이어폰, 소니 링크버즈 IT동아갤로그로 이동합니다. 22.03.25 218 1
938 페북, 인스타 등 ‘SNS 로그인’ 경보…해킹 앱 발견 [3] IT동아갤로그로 이동합니다. 22.03.25 2297 3
937 외국계 IT기업에서 일한다는 것은? – 한국레드햇 하시연 이사 IT동아갤로그로 이동합니다. 22.03.24 208 1
936 [IT강의실] NFT 입문 4부.."일상의 많은 것들이 NFT가 될 것" IT동아갤로그로 이동합니다. 22.03.24 185 1
935 [리뷰] 애플워치도 고속 충전, 벨킨 부스트업 프로 맥세이프 3 in 1 충전 패드 IT동아갤로그로 이동합니다. 22.03.24 1385 1
934 [김 소장의 ‘핏(FIT)’] 하늘을 뒤덮는 위성, 6G를 위한 고민과 갈등 IT동아갤로그로 이동합니다. 22.03.24 163 1
933 다중 작업이 많은 컴퓨팅 환경, '가성비보다 CPU 구성 확인해야' IT동아갤로그로 이동합니다. 22.03.24 286 1
932 마이크로닉스 “게이밍 기어 자체 개발팀 보유, 우리가 국내 유일” IT동아갤로그로 이동합니다. 22.03.24 202 1
931 인공지능이 바꾼 사진 문화, 거세지는 찬반 양론 IT동아갤로그로 이동합니다. 22.03.24 246 1
930 [모빌리티 인사이트] “전기 배달이요!” 전기차, 어디서든 충전 받으세요 IT동아갤로그로 이동합니다. 22.03.24 551 1
929 틱톡 "청소년 보호 정책 및 기능 강화, 플랫폼의 사회적 의무" [4] IT동아갤로그로 이동합니다. 22.03.24 751 1
928 한국보건산업진흥원이 예비창업패키지 통해 지원한 스타트업 9곳 IT동아갤로그로 이동합니다. 22.03.23 145 1
927 5월 구글 I/O 2022 엿보기, 안드로이드13·스마트워치 기대 IT동아갤로그로 이동합니다. 22.03.23 179 1
926 인스타360, 모듈형 액션 캠 'ONE RS'로 고프로에 도전장 IT동아갤로그로 이동합니다. 22.03.23 163 1
925 '군침이 싹 도는 로봇 청소기?'··· 이색 콜라보에 지갑 여는 MZ세대 [37] IT동아갤로그로 이동합니다. 22.03.23 3347 4
924 유니콘 기업 무신사 "독보적 성장의 비결은 콘텐츠다" IT동아갤로그로 이동합니다. 22.03.22 160 1
923 프리미엄 로봇청소기 선보인 에코백스, 국내 시장 공략 본격화한다 IT동아갤로그로 이동합니다. 22.03.22 187 1
922 [IT강의실] 똑같이 생긴 썬더볼트 4와 USB 4, 어떤 점이 다른가 IT동아갤로그로 이동합니다. 22.03.22 335 1
921 1000만대 벽 넘은 폴더블 스마트폰, 2026년 6000만대 시대 온다 [6] IT동아갤로그로 이동합니다. 22.03.22 1250 1
920 DJI, 내구성·성능 높인 차세대 산업용 드론 ‘M30’ 공개 [2] IT동아갤로그로 이동합니다. 22.03.22 1511 1
919 [리뷰] 게이밍 PC의 효용성 극대화, 씨게이트 파이어쿠다 HDD IT동아갤로그로 이동합니다. 22.03.21 166 1
918 '같은 가격대, 정반대 콘셉트' 아이폰 SE와 갤럭시 A53, 어느 걸 고를까? [1] IT동아갤로그로 이동합니다. 22.03.21 320 1
917 불황 속 마케팅은 어떻게 달라져야 하나?.."신중한 계획, 신속한 디지털전환 필요" IT동아갤로그로 이동합니다. 22.03.21 106 1
916 LG전자, 외장 그래픽 탑재한 신형 그램 출시··· 'RTX 2050은 어떤 제품?' IT동아갤로그로 이동합니다. 22.03.21 352 1
915 올 들어 그래픽 카드 가격 20~30% ↓··· '고성능 제품 하락폭 커' [1] IT동아갤로그로 이동합니다. 22.03.21 313 1
914 신형 아이맥스 카메라 제작에 영화계 거장 힘 싣는다 IT동아갤로그로 이동합니다. 22.03.21 122 1
913 [주간투자동향] 한화시스템, 카이메타에 1,100만 달러 추가 투자 IT동아갤로그로 이동합니다. 22.03.21 950 1
912 DDR4? DDR5? 새 PC 구매자의 메모리 선택은? [18] IT동아갤로그로 이동합니다. 22.03.21 2825 2
911 먼지도 다 같은 먼지가 아니다, 무선 청소기에 '기술력'이 중요한 이유는? [6] IT동아갤로그로 이동합니다. 22.03.21 1488 2
910 삼성전자 갤럭시 A53 5G와 A33 5G에 숨겨진 세 가지 의미 IT동아갤로그로 이동합니다. 22.03.19 451 1
909 "4인팟 때문에 작품에 투자할 돈도 줄어" 넷플릭스, 계정 공유에 추가 요금 받는다 IT동아갤로그로 이동합니다. 22.03.18 198 1
908 [스타트업 in 과기대] 가지당 "가치소비, 경쟁력 좌우하는 '퍼플카우'될 것" IT동아갤로그로 이동합니다. 22.03.18 87 1
907 [IT애정남] 스마트폰 보호 필름, 필수가 아니라 상술인가요? [1] IT동아갤로그로 이동합니다. 22.03.18 172 1
906 20조 중고차 시장에 대기업 진출, 현대차의 행보는? IT동아갤로그로 이동합니다. 22.03.18 161 1
905 [BIT 인사이트저널] K-팝, 대중음악의 새로운 유니버스 등장 IT동아갤로그로 이동합니다. 22.03.18 83 1
904 [스타트업 in 과기대] 노이즈엑스, "재활용 흡음재로 생활 소음 해결할 것" [4] IT동아갤로그로 이동합니다. 22.03.18 897 2
903 7부 능선 넘은 제임스 웹 우주 망원경, 심우주 탐사 계획은? [6] IT동아갤로그로 이동합니다. 22.03.18 1546 9
902 와이파이6 지원 넷기어 무선 AP 3종(WAX214, WAX218, WAX620) 이모저모 IT동아갤로그로 이동합니다. 22.03.18 85 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2