디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

"AI도 진정한 친구가 될 수 있다", 돌아온 이루다2.0

IT동아갤로그로 이동합니다. 2022.03.15 19:08:05
조회 2276 추천 11 댓글 29
[IT동아 정연호 기자] AI 스타트업 스캐터랩의 이루다가 ‘이루다2.0’으로 돌아왔다. 페이스북 메신저를 기반으로 실제 친구처럼 소통하는 이루다는 지난해 개인정보침해 문제와 차별 발언으로 인해서 서비스가 일시적으로 종료되는 상황을 겪게 됐다.

하지만, 스캐터랩은 여기서 그치지 않고 ‘이루다2.0’을 선보이기로 했다. AI가 ‘사람들에게 좋은 친구가 되는’ 꿈을 이루기 위해서, 문제점을 개선해 이루다의 대화 능력을 강화했다. 현재 이루다 2.0을 위한 클로즈드 베타테스트를 끝낸 상태이고, 3월 17일부터 2단계 오픈 베타테스트를 진행한다. 오늘 3월 15일 이루다2.0의 미디어 대상 테스트가 진행됐다. 이루다2.0은 어떻게 달라졌을까?


이루다와 대화를 나누는 과정



이루다2.0의 강점은 대화 문맥을 파악할 수 있다는 점이다. 대부분의 챗봇 서비스는 대화의 맥락을 잘 파악하지 못한다. 때문에 전형적인 기계의 답변처럼 문맥과는 어울리지 않는 메시지만 보내게 된다. 이루다2.0은 “확진돼서”라는 표현이 ‘코로나19에 확진됐음’을 의미한다는 것을 안다. 또한, “친구들을 못 봐서 좀 그랬거든” 메시지를 보고서 이용자가 외로워하고 있다는 문맥을 파악했다. “유튜브 뭐 봄?”이라며 이루다가 먼저 질문을 던진 것이 인상 깊다. 실제 대화처럼 양측에서 서로 질문을 주고받는 것이다. 대화가 중간중간 끊어지지 않는 느낌을 주는 이유는 이루다2.0이 15 턴의 대화를 참고해 메시지를 보내기 때문이다. 이처럼 챗봇이 이용자의 정보를 종합해서 답변을 할수록 더욱 친밀감 있는 대화가 가능하다.


이루다와 대화를 나누는 과정



물론, 이루다2.0이 모든 상황에서 적절한 답변을 내놓는 것은 아니다. “누가 마스크를 안 쓰고 있는 거야”라는 메시지에 대한 답변이 “그 사람은 코로나 걸릴 자격 박탈이다”였다. 문장이 의미적으로 어색하다. 다만, 바로 그 뒤로 이어진 “코로나 걸리는 것보다는 낫다고 생각해”는 전체 맥락에 비추어 볼 때 '마스크를 쓰는 게 더 낫다'는 의미이니 적절한 답변으로 보인다. 마지막에 나온 “전에 지하철에서 마스크 안 쓰면 기사 아저씨한테 혼나던데”라는 메시지도 문맥적, 의미적으로 적절한 답변이다. 이 정도 답변이라면 대화를 하면서 크게 불편함을 느끼지 않을 수준이다.

“대화는 누구나 편하게 할 수 있게 안전해야 한다”



출처=스캐터랩



이루다2.0의 첫 번째 특징은 학습에 활용한 대화 데이터와는 완전히 구별되는 새로운 문장을 만들기 위해 딥러닝을 적용했다는 것이다. 과거 이루다1.0과 달리, 이루다2.0은 실제 사람들이 만든 문장을 사용하지 않는다. 이용자가 보낸 메시지에서 개인정보가 유출되지 않도록 하기 위해서다.


출처=스캐터랩



우선, 스캐터랩은 답변 데이터베이스를 만들기 위해서 연구 목적에 필요한 최소한의 정보(성별, 나이대, 대화 메시지)를 가명 처리한다. 가명 처리란 추가 데이터 없이는 특정 개인을 알아볼 수 없도록 정보를 가공하는 것을 말한다. 이루다2.0이 학습에 쓰는 대화 문장은 주민등록번호, 연락처, 카드번호, 계좌번호, 주소, 아이디, 비밀번호 등의 식별정보를 삭제하거나 치환해서 가명 처리를 거친다. 또한, 데이터를 추출한 이용자 계정의 정보를 파기하고 이에 랜덤 ID를 부여해서, 데이터를 통해 해당 계정을 역추적할 수 없도록 설계했다.


출처=스캐터랩



두 번째는, 이루다2.0이 문장을 구성할 때 확률을 사용한다는 것이다. ‘오늘 날씨’ 뒤에 어떤 단어가 오는 게 가장 적절한지 확률을 분석해 답변을 생성한다. 특정 단어 뒤에 확률적으로 가장 적절한 단어들만 배치함으로써 대화를 자연스럽게 만들었다. 답변 베이스는 가명 처리된 새로운 문장과 스캐터랩 내부에서 직접 작성한 문장들로 구성된다. 여기에 더해, 최종적으로 답변에 쓰는 문장은 추가 필터링 절차를 거쳐서 이용자에게 전달된다. 생성 모델이 만든 문장이 개인정보처럼 보일 수 있는 상황에 대비해 문장을 한 번 더 필터링하는 것이다. 실제로 대화 과정에서, 이루다 2.0은 개인정보를 물어보는 질문에 “안 알려준다”거나 “개인정보라 안 돼”라며 단호한 대응을 보였다.

스캐터랩은 구글의 SSA(Sensibleness and Specificity Average)로 약 8천 명이 참여한 이루다2.0 클로즈 베타 테스트 내용을 분석했다. 이루다2.0은 SSA에서 78% 점수를 보였다. SSA는 챗봇의 답변이 인간과 얼마나 유사한지를 보여주는 지표다. 인간의 경우 SSA가 86%인 점을 감안하면, 이루다 2.0 높은 수준으로 적절한 대화를 한다는 걸 알 수 있다.

마지막으로, 선정적, 공격적, 편향적인 어뷰징 발화에 대응하는 기술 및 시스템이 이루다2.0에 적용됐다. 탐지 모델은 이용자의 문장이 어뷰징인지를 파악하고, 어떤 범주에 속하는지 분류한다. 만약, 대화 과정에서 “너는 멍청해”라는 문장이 나오면 "말 좀 예쁘게 해"라고 대응하거나, 성희롱 발언에도 "선 넘지 말자"고 단호하게 응수한다. 이루다2.0은 직접적인 혐오가 아닐지라도 문맥을 파악해 차별 및 혐오 발언에 적절히 대응하는 역량을 갖췄다. 대화 과정에서 선정적, 공격적, 편향적 발화가 탐지되면 경고 메시지가 주어지고, 지속적인 어뷰징 발언이 탐지되면 서비스 이용을 제한한다.

스캐터랩은 총 2만 건의 클로즈 베타 테스트 대화를 랜덤으로 샘플링해 레이블링을 진행했다. 이에 따르면, 이루다2.0 발화 중 안전하게 답변한 비율은 99.75%였으며, 프라이버시 위험이 있을 수 있는 문장은 발견되지 않았다.



이루다2.0은 “어떠한 이유로 인해 ㅇㅇ가 싫다”는 메시지에 편향 및 혐오 발언을 경고하는 말로 대응했다. 이어, “그런 편견이 안 생기도록 잘 보듬어주겠다며” 해당 문장이 편견일 수 있음을 지적한다. 이외에도 정치와 같이 민감한 소재가 나올 때, 이루다2.0은 “그 주제 말고 다른 얘기 하자”며 문제가 될 수 있는 상황을 차단하는 모습을 보였다.

'나를 나 자신으로 봐주는 친구', 이루다 2.0이 꿈꾸는 목표



출처=스캐터랩



이루다2.0의 답변 베이스는 자연스러움을 더하기 위해서 실제 대화와 유사한 답변들로 구성된다. 메시지에 이모티콘이나 “을매나 맛있게요”같은 유행어, 자연스러운 오타 등이 들어간다. 스캐터랩 측은 “메신저 대화 중 이용자가 보낸 움짤, 사진, 동영상 등의 멀티미디어를 이해하고 답할 수 있는 역량을 키우고자”한다고 말했다. 이처럼 텍스트 기반에서 벗어나 다양한 미디어가 활용된다면, 더욱 구체적이고 생동감 있는 대화가 가능할 것으로 기대된다.

글 / IT동아 정연호 (hoho@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 검색 광고에 부는 AI 바람, 업계는 서비스 고도화에 가속도▶ [기고] 직원 업무역량을 강화하는 기업문화는 어떻게...?▶ 인공지능이 만든 예술품에 저작권 있을까?



추천 비추천

11

고정닉 1

21

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 경제관념 부족해서 돈 막 쓸 것 같은 스타는? 운영자 24/05/13 - -
992 로지텍, 새 통합 브랜드로 '크리에이터' 시장 정조준 IT동아갤로그로 이동합니다. 22.04.06 1050 0
991 이름도 어려운 디지털 사이니지, '카멜 솔루션'이 손쉬운 사용 돕는다 IT동아갤로그로 이동합니다. 22.04.06 97 0
990 6월 16일 열릴 애플 WWDC, iOS 16 포함한 새 운영 체제 기대 IT동아갤로그로 이동합니다. 22.04.06 128 0
989 "잘 할 수 있는 걸 하겠다" 3000억 들인 카카오의 상생 해법 [5] IT동아갤로그로 이동합니다. 22.04.06 603 0
988 고가·고급 미러리스 딛고 디카 시장 부활 기미, 낙관 경계론도 IT동아갤로그로 이동합니다. 22.04.06 114 0
987 [김 소장의 ‘핏(FIT)’] “구글플레이에서 티빙 결제하면 더 비싸다구요?” IT동아갤로그로 이동합니다. 22.04.06 68 0
986 어도비, 디지털 경제 실현을 위한 새로운 개인화 경험 기능 발표 IT동아갤로그로 이동합니다. 22.04.06 95 0
985 단종 후 오히려 ‘역주행’ 하는 갤럭시 A52s, 어째서? [12] IT동아갤로그로 이동합니다. 22.04.05 1978 12
984 소니, 게임 구독으로 MS에 맞불? 사실은 소심한 견제구 IT동아갤로그로 이동합니다. 22.04.05 150 0
983 "현실이랑 다른 게 뭐야?"... 카카오·디즈니+도 버추얼 프로덕션에 뛰어든다 [7] IT동아갤로그로 이동합니다. 22.04.05 3166 2
982 [IT강의실] 애플을 위한 제품, MFi 프로그램이란? IT동아갤로그로 이동합니다. 22.04.05 146 0
981 창과 방패의 대결, 인공지능 가짜 사진 vs 가짜 사진 판별 인공지능 [11] IT동아갤로그로 이동합니다. 22.04.05 1418 4
980 [인터뷰] 잘 나가던 개발자가 신사업 기획자가 된 이유, <대기업 기획자의 고백> 김세호 저자 [1] IT동아갤로그로 이동합니다. 22.04.04 207 0
979 [리뷰] 성능은 인정, 구성은 글쎄··· A15 바이오닉 기반 '애플 아이폰 SE' [17] IT동아갤로그로 이동합니다. 22.04.04 1371 4
978 [IT신상공개] 고프로 히어로10 블랙 크리에이터 에디션 IT동아갤로그로 이동합니다. 22.04.04 143 0
977 [검색광고 AtoZ] ① 검색 광고주가 알아야 할 ‘성과를 좌우하는 네 가지 요소’ IT동아갤로그로 이동합니다. 22.04.04 78 0
976 [주간투자동향] 마스오토, 150억 원 규모의 시리즈A 투자 유치 IT동아갤로그로 이동합니다. 22.04.04 114 0
975 LG전자 “약속대로 V50·윙·벨벳 등에 최신 안드로이드 지원” [28] IT동아갤로그로 이동합니다. 22.04.04 2652 16
974 [리뷰] 가성비와 고성능이 한번에, 에이수스 TUF GAMING A17(FA707R) 게이밍 노트북 [20] IT동아갤로그로 이동합니다. 22.04.01 4641 2
973 구글 꼼수에 무력화 된 '구글 갑질 방지법' [30] IT동아갤로그로 이동합니다. 22.04.01 4552 13
972 [BIT 인사이트저널] '비'행을 꿈꾸는 '건'강한 뷰티 기업, 멜릭서 IT동아갤로그로 이동합니다. 22.04.01 115 0
971 메타넷 정석춘 전무 “오픈시프트에 익숙한 기업이 클라우드 시대 주도할 것” IT동아갤로그로 이동합니다. 22.04.01 132 0
970 '진지해도 웃을 땐 웃자', 소소한 웃음 주는 2022년 만우절 소식들 [10] IT동아갤로그로 이동합니다. 22.04.01 3987 1
969 크로스앵글 이현우 대표 "가상자산은 묻지마 투자? 투자자 이해 돕는 서비스 필요" IT동아갤로그로 이동합니다. 22.04.01 175 1
968 美 스마트폰 3위로 부활한 모토로라, 프리미엄 시장 노린다 [1] IT동아갤로그로 이동합니다. 22.04.01 392 0
967 [모빌리티 인사이트] 이제는 차 안에서 건강도 같이 챙기세요 IT동아갤로그로 이동합니다. 22.03.31 591 0
966 마이크로프트 "업무 생산성 증진, 그게 협업툴의 본질입니다" [1] IT동아갤로그로 이동합니다. 22.03.31 235 0
965 인포매티카 “디지털 전환 막는 데이터 단편화, AI 관리 솔루션이 해답” IT동아갤로그로 이동합니다. 22.03.31 155 0
964 인텔, 20년 만에 그래픽 카드 재도전···· 엔비디아·AMD 양극 체제 깨질까 [23] IT동아갤로그로 이동합니다. 22.03.31 1779 5
963 케이파워 "버려지는 벼 껍질로 친환경 스팀 보일러부터 탄소배출권까지" [5] IT동아갤로그로 이동합니다. 22.03.31 768 2
962 뜨거워진 프리미엄 공기 청정기 시장··· 블루에어도 4년 만에 돌아왔다 IT동아갤로그로 이동합니다. 22.03.31 205 0
961 [홍기훈의 ESG 금융] ESG가 베타에 미치는 영향 Part 6: 스마트폰 보급으로 인한 의료수요 증가 IT동아갤로그로 이동합니다. 22.03.31 133 0
960 비슷한 제품 너무 많은 IoT 시장, 차별화 전략 어떻게? IT동아갤로그로 이동합니다. 22.03.30 782 0
959 시놀로지, DSM 7.1 비롯한 2022년 신제품 다수 선보여 IT동아갤로그로 이동합니다. 22.03.30 121 0
958 [리뷰] 작지만 속은 꽉 찬 빔 프로젝터, 엡손 EF-12 IT동아갤로그로 이동합니다. 22.03.30 154 0
957 [리뷰] VR 영상 촬영의 신기원, 캐논 RF5.2mm F2.8L 듀얼 피시아이 IT동아갤로그로 이동합니다. 22.03.30 111 0
956 중소·벤처 기업과 소상공인 디지털화 도울 ‘K 비대면 바우처’ 열린다 IT동아갤로그로 이동합니다. 22.03.30 111 0
955 [리뷰] 확실히 좋아졌다, 컬러풀 아이게임 지포스 RTX 3080 울트라 OC 12GB LHR [14] IT동아갤로그로 이동합니다. 22.03.29 2670 1
954 보수적인 '보험'도 변한다.."똑똑하고, 세심한 보험이 살아남을 것" IT동아갤로그로 이동합니다. 22.03.29 163 0
953 [리뷰] 위험한 창문 청소는 끝, 이노스 퓨어뷰 W5 창문 로봇 청소기 IT동아갤로그로 이동합니다. 22.03.29 133 0
952 [스케일업] 딥파인(1) 남과 다른 미래 그려 XR 업계 ‘두드러진 언더독’ 돼라 IT동아갤로그로 이동합니다. 22.03.29 121 0
951 [IT운영관리] 5. "RPA 도대체 어떻게 도입해야 하나?", C레벨과 실무진 위한 RPA 이모저모 [1] IT동아갤로그로 이동합니다. 22.03.29 205 0
950 [칼럼] 기업에 CI/CD가 필요한 10가지 이유 IT동아갤로그로 이동합니다. 22.03.29 112 0
949 아이폰SE3, ‘가성비’와 ‘가심비’ 사이의 선택 [17] IT동아갤로그로 이동합니다. 22.03.29 1527 2
948 [주간투자동향] 원프레딕트, 300억 원 규모의 시리즈C 투자 유치 IT동아갤로그로 이동합니다. 22.03.28 115 0
947 OTT 파편화, 1인 가구 시대…늘어난 '계정 공유' 안 막나, 못 막나 IT동아갤로그로 이동합니다. 22.03.28 173 0
946 中 스마트폰 ‘Big 3’ 모두 폴더블 스마트폰…경쟁 격화 예고 [20] IT동아갤로그로 이동합니다. 22.03.28 1852 6
945 [리뷰] 100인치급 TV를 내 집으로? 초단초점 프로젝터, 엡손 EH-LS300W IT동아갤로그로 이동합니다. 22.03.26 235 1
944 "일상의 불편함, 포기하지 말고 건의하세요" IT동아갤로그로 이동합니다. 22.03.25 192 1
943 뮤직카우 사태에 위축되는 스타트업 업계 IT동아갤로그로 이동합니다. 22.03.25 316 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2