디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

라인의 경쟁력과 안정성, '함께 회고하는 개발 문화가 토대'

IT동아갤로그로 이동합니다. 2021.12.14 14:27:31
조회 50 추천 0 댓글 0
[IT동아 남시현 기자] “IT(정보 기술) 서비스에서의 장애는 기술의 문제며, 근본적인 문제의 원인을 파악하는 게 중요하다. 추정하거나 경험만 갖고 판단하는 게 아니라, 사실 관계와 로그(Log, 기록), 데이터를 기반으로 분석한 것을 토대로 논의해야 한다. 이것이 기본이자 핵심이다”


라인 플랫폼 엔지니어링 3팀 이수안 개발 리드. 출처=IT동아



라인플러스 사무실에서 만난 라인 플랫폼 엔지니어링 3팀 이수안 개발 리드에게 서비스 장애에 대한 근본적인 대처 방안을 묻자 돌아온 대답이다. 오늘날 서비스 장애는 모든 개발자들에게 주어진 숙제이자 성장책이다. 서비스 장애라는 어감이 부정적이기는 하지만, 의외로 장애는 서비스를 개선하는 과정에서 필연적으로 발생하는 현상이며 이를 극복하는 방법이나 과정이 더욱 중시되고 있다. 만약 서비스 장애가 발생하지 않는 사례가 있다면, 오히려 개발이 정체되어 있다고 보는 시각도 있을 정도다. 그렇다면 글로벌 기술 기업에서는 서비스 장애를 어떻게 받아들이고, 또 어떻게 극복해나가고 있을까?

장애에 대한 대처, 라인에게 듣다


라인(LINE)은 전 세계 2억 명의 이용자를 보유하고 있는 글로벌 서비스로, 설립 이후부터 지금까지 끊임없이 서비스 장애를 해결하기 위한 절차와 방안을 모색해왔다. 이날 인터뷰에 응한 이수안 개발 리드는 2005년 네이버에 합류해 사용자용 서비스를 개발해오다가, 2011년 라인 초창기부터 라인에 합류해 라인 플랫폼 서버를 개발하는 등 오늘날 라인의 중추를 만든 핵심 개발자 중 한 명이다. 이수안 개발 리드에게 라인의 서비스 장애 대처 방법부터 이를 극복해나갈 수 있는 원동력인 개발 문화에 대해 들어보았다.


Life on LINE은 라인의 슬로건이다. 출처=라인



이수안 개발 리드가 이끌고 있는 라인 플랫폼 엔지니어링 3팀은 한국과 일본 개발자들이 한 팀처럼 조직되어 있으며, 라인 앱 전체 트래픽을 다루는 ‘라인 플랫폼 서버’를 개발 및 관리한다. 라인 플랫폼 서버는 라인 내 메시징 플랫폼과 라인 서비스를 통해 로그인하는 계정 서버, 라인 스토어 및 라인 공식 계정, 개발자 플랫폼, 오픈 채팅 등 주요 서비스의 기반이 되는 서버다.

가장 먼저 라인의 장애 대책과 관련된 전반적인 흐름에 대한 설명을 부탁했다. 이수안 개발 리드는 “초창기에는 라인의 서버 전체가 내려가는 등의 문제도 있었지만, 지금은 그런 문제보다는 국소적인 장애들이 많이 발생한다. 특히 작은 문제 여러 개가 겹쳐서 큰 문제로 커지는 경우가 있기 때문에 장애의 수준과 관계없이 동일한 위기로 보고 해결하고 있다”라고 대답했고, 장애 처리 과정은 크게 세 단계로 구분했다. 일단 문제가 있으면 이를 인지한 다음, 장애에 대응해 복구에 돌입하고, 그다음 결과 보고서를 작성하는 게 큰 틀이다.


라인 플랫폼 엔지니어링 3팀 이수안 개발 리드. 출처=IT동아



문제를 인지하는 과정은 개발자가 직접 알람을 개발해 스스로 인지하기도 하지만, 누구든지 장애를 발견하면 서로 연락할 수 있는 전용 채널이나 협업 툴을 통해 소통하는 게 문화로 정착해있다. 또 내부에 모니터링 시스템이 있어서 모니터링 전문가가 개발자에게 연락을 주기도 한다. 이렇게 인지된 장애는 개발 리더들이 기틀을 잡고, 개발자들이 라인과 슬랙을 통해 실시간으로 내용을 공유해 문제를 해결한다. 마지막으로 해결 과정을 결과 보고서로 작성해 전파한다. 결과 보고서는 최소 1 근무일 이내 1차 보고가 원칙이며, 클라이언트의 동작 상태나 영향을 받은 숫자들, 실패 건수 등이 모두 분석된 문제 상황을 작성하고, 어떻게 대응했으며 어떤 과정을 도입했는지 등을 상세하게 적어 제출한다.

전 세계 사용자 2억 여명, 안정성 확보가 최우선



2019년 1월 1일 0시 0분 발생한 트래픽 스파이크에 대한 그래프. 출처=라인



라인이 철저한 문제 해결 과정을 수립한 이유는 서버 안정성(Reliability) 때문이다. 메신저 기능에서는 메시지가 제때 전송되고, 문제없이 동작하는 것이 서버 안정성의 의미다. 문제가 생기면 곧 서비스 자체의 신뢰성에 문제가 생기는데, 재작년에 이런 일이 있었다. 매년 1월 1일 0시 0분은 연간 트래픽의 최고치를 달성하는 시점이다. 그래서 개발자들은 3~4개월 전부터 이를 대비하지만, 2019년에는 평소 트래픽의 최대 3배에 달하는 초당 41만 건의 메시지가 쏟아져 메시지 도착 알림 일부가 유실되는 문제가 발생했다. 이후 문제점을 확인하고 6개월 이상 작업을 진행한 결과, 2020년과 올해에는 문제가 발생하지 않았다. 문제 해결의 배경에는 개발자들이 허심탄회하게 의견을 나누는 ‘장애 회고 미팅’이 있었다.

장애 회고 미팅은 결과 보고서를 놓고 사후에 문제점을 논의하는 과정으로, 직급 여하와 관계없이 누구나 참석해 의견을 낸다. 이수안 개발 리드는 “장애 회고 미팅은 실수나 책임을 묻는 자리가 아니라, 왜 문제가 발생했는지에 대한 사실 관계를 찾아가는 과정이다. 문제가 발생한 원인부터 확인된 배경, 문제가 된 설정을 반영한 이유 등에 대해 논의하고, 추후에 개선점까지 발굴한다”라고 말했다. 이 과정은 각국의 라인 개발자들이 참석하며, 전문 통역사가 배석해 영어로 작성된 장애 보고서를 토대로 질의 응답을 주고 받는다”라고 말했다.


라인의 개발 문화는 주인의식 갖기, 열린 자세, 신뢰와 존중으로 축약할 수 있다. 출처=라인



장애 회고 미팅이 자리 잡은 배경에는 라인의 개발자 문화가 있다고 말했다. 이수안 개발 리드는 “장애 회고 미팅은 라인의 세 가지 덕목인 주인의식 갖기(Take Ownership), 열린 자세(Be Open), 그리고 신뢰와 존중(Trust and Respect)을 모두 담은 과정이다. 문제에 대한 주인 의식과 해결을 위한 열린 자세, 그리고 개발자 간의 신뢰와 존중이 모두 녹아있다”라면서, “엔지니어가 성장하는 과정은 실수를 통해 배우고, 이를 놓치지 않는 것에서부터 시작한다. 문제가 생겨도 모두가 함께 있음을 믿고 도전할 수 있도록 하는 게 장애 회고 미팅의 의의”라고 답했다.

문제를 되짚는 문화가 곧 기업의 경쟁력



이수안 개발 리드는 ‘라인 데브 데이 2021’에서 장애 회고 미팅과 처리 과정 등을 소개한 바 있다. 출처=IT동아



이수안 개발 리드는 지난 11월 10일에서 11일 양일간 진행된 ‘라인 데브 데이 2021’에서 ‘라인 플랫폼 서버의 장애 대응 프로세스와 문화’라는 이름으로 서버 안정성에 대한 절차와 과정, 문화를 소개한 바 있다. 이날 인터뷰로 소개한 내용이 단순한 내부 절차에 그치지 않고, 개발자 생태계에 보탬이 되길 바라서다. 이수안 개발 리드는 “우리의 문화는 문제를 인정하는 것을 넘어서 무엇을 배웠는가를 논한다. 이런 문화 덕분에 문제가 발생해도 개인이 아닌 팀으로 움직이며, 개선의 대상이 시스템 오류로 끝나지 않고 팀의 문화와 절차, 더 나아가 시스템 자체가 된다”라고 말했다.

라인이 글로벌 기업으로 성장할 수 있었던 배경은 문제의 규모를 막론하고 놓치지 않는 섬세함, 그리고 작은 문제도 국경을 넘어서 의견을 나눌 정도의 열린 사고방식 덕분이다. 실제로 장애 회고 미팅을 진행하다 보면 한국과 일본, 대만 등 각국의 개발자들마다 문제를 바라보는 시선이나 성향이 달라서 서로 배우는 계기가 된다고 한다. 이러한 노력이 쌓일수록 개인은 발전을 거듭하며, 기업은 곧 경쟁력을 확보한다. 라인의 개발 문화가 그 어떤 기업보다도 회자되는 이유다.

글 / IT동아 남시현 (sh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 카카오톡VS라인, 검색 기능은 어떻게 다를까?▶ 라인에 줄 선 신입 IT 개발자들, '네카라쿠배'가 뭐길래?▶ 라인 AI CEO와의 대담, '라인은 세상을 발전시키기 위해 인공지능을 연구'



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
588 [스케일업] 넥스트페이먼츠(3) AWS “스마트 상점 기업 해외 진출, 충분한 준비와 기술 필요 ” IT동아갤로그로 이동합니다. 21.12.29 57 0
587 [IT애정남] 집에서 전화가 잘 안 터지면? 실내 중계기로 해결 [1] IT동아갤로그로 이동합니다. 21.12.28 1004 0
586 [리뷰] NAS를 더 민첩하게, 씨게이트 아이언울프 525 M.2 NVMe SSD [5] IT동아갤로그로 이동합니다. 21.12.28 1308 0
585 '빛 좋은 개살구' 중고차, 완성차업계 진출로 해결되나? IT동아갤로그로 이동합니다. 21.12.28 62 0
584 [스케일업] “중대재해 없는 건설현장, 스마트인사이드가 물꼬 튼다” [1] IT동아갤로그로 이동합니다. 21.12.28 726 0
583 [주간투자동향] 차이코퍼레이션, 530억 원 규모의 추가 투자 유치 IT동아갤로그로 이동합니다. 21.12.28 67 0
582 투와이 "인테리어 B2B 시장에도 디지털 혁신 필요" IT동아갤로그로 이동합니다. 21.12.28 75 0
581 NIPA, XR 전문가 위한 '메타버스 캠퍼스'로 시장 성장 돕는다 IT동아갤로그로 이동합니다. 21.12.28 45 0
580 김준태 왓섭 "구독 서비스·고정비 고민, 이제 그만" IT동아갤로그로 이동합니다. 21.12.28 78 0
579 리브스메드 “혁신 수술 기구 아티센셜로 외과 로봇 수술 선도” [2] IT동아갤로그로 이동합니다. 21.12.28 1250 1
578 [DU 스타트업] 엔테로바이옴 “유산균 뛰어넘는 차세대 장내미생물 개발, 우리가 독보적” [1] IT동아갤로그로 이동합니다. 21.12.27 933 1
576 로와커피컴퍼니, "착하고 독창적인 커피로 시장 개척할 것" [5] IT동아갤로그로 이동합니다. 21.12.27 648 1
574 [스케일업] “IT 운영관리 스타트업 알릴 수 있는 창구였어요” IT동아갤로그로 이동합니다. 21.12.25 1388 0
573 자율주행차 관련 제도, 차량, 인프라까지 싹 바뀐다 IT동아갤로그로 이동합니다. 21.12.24 62 0
572 [IT애정남] 와이파이 이름 숨기기, 보안에 도움이 될까요? IT동아갤로그로 이동합니다. 21.12.24 89 0
571 [송대리의 잇(IT)트렌드] 냉동 인간, SF 영화 속 얘기만은 아니라고? IT동아갤로그로 이동합니다. 21.12.24 97 0
570 [DU 스타트업] 플루이드콤프 "높은 에너지 효율, 낮은 가격의 공기압축기" IT동아갤로그로 이동합니다. 21.12.24 69 0
569 [스케일업] ‘세이프웨이의 도전, 사람과 동행하는 저속 모빌리티 플랫폼’ IT동아갤로그로 이동합니다. 21.12.24 50 0
568 [DU 스타트업] 강승현 엔에스비에스 “노약자·장애인 돕는 ‘좋은 제품’을 세계로” IT동아갤로그로 이동합니다. 21.12.24 68 0
567 [DU 스타트업] 판도라 프로젝트 “스니커즈처럼, 한정판 피규어도 제값받고 거래해야” IT동아갤로그로 이동합니다. 21.12.24 74 0
566 키라(KIRA) 기라성 대표, "빛, 소리, 사물인터넷으로 살아있는 감성가구 만든다" [5] IT동아갤로그로 이동합니다. 21.12.24 1415 6
565 [스케일업] 에이치디에너지 (4) 상생 에너지 플랫폼, 꿈을 현실로 IT동아갤로그로 이동합니다. 21.12.24 65 0
564 [리뷰] LG 식물재배기는 정말 싹을 틔울까 - LG 틔운 [22] IT동아갤로그로 이동합니다. 21.12.23 1577 6
563 [스타트업-ing] 유헬스플러스 “AI 기반 맞춤형 한의학 서비스는 블루오션” [2] IT동아갤로그로 이동합니다. 21.12.23 813 0
562 코어다트랩의 보안 화상 회의, "인공지능과 블록체인을 통한 새로운 가치 창출" IT동아갤로그로 이동합니다. 21.12.23 73 0
561 ISK 정연진 대표 “CDO 몸값 높아진 시대, 인포매티카 솔루션으로 경쟁력 극대화” IT동아갤로그로 이동합니다. 21.12.23 59 0
560 [모빌리티 인사이트] “잠깐! 출발 전, 전기차 보조배터리 챙기셨나요?” IT동아갤로그로 이동합니다. 21.12.23 83 0
559 [홍기훈의 ESG 금융] 기업의 매출과 이윤을 분석할 때 ESG 요인을 평가한 사례 'AGF Investments Inc.' Part .6 IT동아갤로그로 이동합니다. 21.12.23 1263 0
558 반려동물 양육 인구 1,500만 시대, 스마트 펫 용품 시장도 활기 [5] IT동아갤로그로 이동합니다. 21.12.22 784 0
557 동국대 창업원 이광근 원장 “창업 DNA의 선순환 구조를 꿈꿉니다” IT동아갤로그로 이동합니다. 21.12.22 83 0
556 [네이버웍스 활용하기] 협업 툴의 활용도, 인공지능에서 나온다 IT동아갤로그로 이동합니다. 21.12.22 70 0
555 올랭귀지 "어학연수 시장의 정보 비대칭, 큐레이션 서비스로 해결" IT동아갤로그로 이동합니다. 21.12.22 57 0
554 [스케일업] 넥스트페이먼츠 (2) “헬로월드와 320만 소상공인 위한 배달 앱 만든다” [1] IT동아갤로그로 이동합니다. 21.12.22 790 0
553 넓어지고 빨라진 넷기어 오르비 공유기 3종(RBK352, RBK752, RBK852), 차이점은? IT동아갤로그로 이동합니다. 21.12.21 57 0
552 [앱으리띵] 스크린골프 '게스트 로그인'은 그만! 골프존 앱 적극 활용하기 IT동아갤로그로 이동합니다. 21.12.21 82 0
551 개인 정보 보호 강조하던 애플도 도입한 '디지털 유산'…그 배경은? [2] IT동아갤로그로 이동합니다. 21.12.21 2736 3
550 스트라드비젼, LG전자 ADAS 카메라 시스템에 기술 공급한다 IT동아갤로그로 이동합니다. 21.12.21 80 0
549 비네스트, "농가와의 상생, 콤부차로 풀어나간다" IT동아갤로그로 이동합니다. 21.12.21 86 0
548 [주간투자동향] 드라마앤컴퍼니, 1,600억 원 규모의 시리즈 D 투자 유치 IT동아갤로그로 이동합니다. 21.12.20 876 0
547 케이비자, "취업 외국인 위한 생활공간 추구··· 내년 2월 서비스 실시" IT동아갤로그로 이동합니다. 21.12.20 62 0
546 [스케일업] 파코웨어 (3) 메타버스 콘텐츠, 기술과 실물 앞세워 ‘증명’하라 [1] IT동아갤로그로 이동합니다. 21.12.20 995 0
545 [IT하는법] 복잡한 와이파이 이름·비번, QR코드로 공유하자 [6] IT동아갤로그로 이동합니다. 21.12.18 2244 1
544 [AICON 광주 2021] 인공지능산업융합사업단-스케일업코리아, AI 스타트업 위한 투자 업무협약 IT동아갤로그로 이동합니다. 21.12.17 63 0
543 [IT애정남] 최신 게임기는 둘, HDMI 2.1 단자는 하나…어떻게 하죠? IT동아갤로그로 이동합니다. 21.12.17 80 0
542 지니고 "임신 기간, 견디는 시간 아닌 누리는 시간되도록" IT동아갤로그로 이동합니다. 21.12.17 121 1
541 [AICON 광주 2021] 미래 AI 트렌드가 한 곳에, '광주 AICON 전시회' IT동아갤로그로 이동합니다. 21.12.17 99 0
540 체험도, 구매도 집에서 비대면으로…삼성전자도 뛰어든 'VR 스토어' IT동아갤로그로 이동합니다. 21.12.17 121 0
539 [AICON 광주 2021] 경기콘텐츠진흥원 민세희 원장 “머신러닝 기반 실감콘텐츠, 가능성 무궁무진” IT동아갤로그로 이동합니다. 21.12.17 48 0
538 [스케일업] 두 마리 토끼를 쫓는다? 미래 가치 판단에 유리한 방향 선택해야 IT동아갤로그로 이동합니다. 21.12.17 52 0
537 [농업이 IT(잇)다] 박서영 에스와이솔루션 “대체육은 건강한 미래 먹거리” IT동아갤로그로 이동합니다. 21.12.17 76 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2