디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

라인의 경쟁력과 안정성, '함께 회고하는 개발 문화가 토대'

IT동아갤로그로 이동합니다. 2021.12.14 14:27:31
조회 54 추천 0 댓글 0
[IT동아 남시현 기자] “IT(정보 기술) 서비스에서의 장애는 기술의 문제며, 근본적인 문제의 원인을 파악하는 게 중요하다. 추정하거나 경험만 갖고 판단하는 게 아니라, 사실 관계와 로그(Log, 기록), 데이터를 기반으로 분석한 것을 토대로 논의해야 한다. 이것이 기본이자 핵심이다”


라인 플랫폼 엔지니어링 3팀 이수안 개발 리드. 출처=IT동아



라인플러스 사무실에서 만난 라인 플랫폼 엔지니어링 3팀 이수안 개발 리드에게 서비스 장애에 대한 근본적인 대처 방안을 묻자 돌아온 대답이다. 오늘날 서비스 장애는 모든 개발자들에게 주어진 숙제이자 성장책이다. 서비스 장애라는 어감이 부정적이기는 하지만, 의외로 장애는 서비스를 개선하는 과정에서 필연적으로 발생하는 현상이며 이를 극복하는 방법이나 과정이 더욱 중시되고 있다. 만약 서비스 장애가 발생하지 않는 사례가 있다면, 오히려 개발이 정체되어 있다고 보는 시각도 있을 정도다. 그렇다면 글로벌 기술 기업에서는 서비스 장애를 어떻게 받아들이고, 또 어떻게 극복해나가고 있을까?

장애에 대한 대처, 라인에게 듣다


라인(LINE)은 전 세계 2억 명의 이용자를 보유하고 있는 글로벌 서비스로, 설립 이후부터 지금까지 끊임없이 서비스 장애를 해결하기 위한 절차와 방안을 모색해왔다. 이날 인터뷰에 응한 이수안 개발 리드는 2005년 네이버에 합류해 사용자용 서비스를 개발해오다가, 2011년 라인 초창기부터 라인에 합류해 라인 플랫폼 서버를 개발하는 등 오늘날 라인의 중추를 만든 핵심 개발자 중 한 명이다. 이수안 개발 리드에게 라인의 서비스 장애 대처 방법부터 이를 극복해나갈 수 있는 원동력인 개발 문화에 대해 들어보았다.


Life on LINE은 라인의 슬로건이다. 출처=라인



이수안 개발 리드가 이끌고 있는 라인 플랫폼 엔지니어링 3팀은 한국과 일본 개발자들이 한 팀처럼 조직되어 있으며, 라인 앱 전체 트래픽을 다루는 ‘라인 플랫폼 서버’를 개발 및 관리한다. 라인 플랫폼 서버는 라인 내 메시징 플랫폼과 라인 서비스를 통해 로그인하는 계정 서버, 라인 스토어 및 라인 공식 계정, 개발자 플랫폼, 오픈 채팅 등 주요 서비스의 기반이 되는 서버다.

가장 먼저 라인의 장애 대책과 관련된 전반적인 흐름에 대한 설명을 부탁했다. 이수안 개발 리드는 “초창기에는 라인의 서버 전체가 내려가는 등의 문제도 있었지만, 지금은 그런 문제보다는 국소적인 장애들이 많이 발생한다. 특히 작은 문제 여러 개가 겹쳐서 큰 문제로 커지는 경우가 있기 때문에 장애의 수준과 관계없이 동일한 위기로 보고 해결하고 있다”라고 대답했고, 장애 처리 과정은 크게 세 단계로 구분했다. 일단 문제가 있으면 이를 인지한 다음, 장애에 대응해 복구에 돌입하고, 그다음 결과 보고서를 작성하는 게 큰 틀이다.


라인 플랫폼 엔지니어링 3팀 이수안 개발 리드. 출처=IT동아



문제를 인지하는 과정은 개발자가 직접 알람을 개발해 스스로 인지하기도 하지만, 누구든지 장애를 발견하면 서로 연락할 수 있는 전용 채널이나 협업 툴을 통해 소통하는 게 문화로 정착해있다. 또 내부에 모니터링 시스템이 있어서 모니터링 전문가가 개발자에게 연락을 주기도 한다. 이렇게 인지된 장애는 개발 리더들이 기틀을 잡고, 개발자들이 라인과 슬랙을 통해 실시간으로 내용을 공유해 문제를 해결한다. 마지막으로 해결 과정을 결과 보고서로 작성해 전파한다. 결과 보고서는 최소 1 근무일 이내 1차 보고가 원칙이며, 클라이언트의 동작 상태나 영향을 받은 숫자들, 실패 건수 등이 모두 분석된 문제 상황을 작성하고, 어떻게 대응했으며 어떤 과정을 도입했는지 등을 상세하게 적어 제출한다.

전 세계 사용자 2억 여명, 안정성 확보가 최우선



2019년 1월 1일 0시 0분 발생한 트래픽 스파이크에 대한 그래프. 출처=라인



라인이 철저한 문제 해결 과정을 수립한 이유는 서버 안정성(Reliability) 때문이다. 메신저 기능에서는 메시지가 제때 전송되고, 문제없이 동작하는 것이 서버 안정성의 의미다. 문제가 생기면 곧 서비스 자체의 신뢰성에 문제가 생기는데, 재작년에 이런 일이 있었다. 매년 1월 1일 0시 0분은 연간 트래픽의 최고치를 달성하는 시점이다. 그래서 개발자들은 3~4개월 전부터 이를 대비하지만, 2019년에는 평소 트래픽의 최대 3배에 달하는 초당 41만 건의 메시지가 쏟아져 메시지 도착 알림 일부가 유실되는 문제가 발생했다. 이후 문제점을 확인하고 6개월 이상 작업을 진행한 결과, 2020년과 올해에는 문제가 발생하지 않았다. 문제 해결의 배경에는 개발자들이 허심탄회하게 의견을 나누는 ‘장애 회고 미팅’이 있었다.

장애 회고 미팅은 결과 보고서를 놓고 사후에 문제점을 논의하는 과정으로, 직급 여하와 관계없이 누구나 참석해 의견을 낸다. 이수안 개발 리드는 “장애 회고 미팅은 실수나 책임을 묻는 자리가 아니라, 왜 문제가 발생했는지에 대한 사실 관계를 찾아가는 과정이다. 문제가 발생한 원인부터 확인된 배경, 문제가 된 설정을 반영한 이유 등에 대해 논의하고, 추후에 개선점까지 발굴한다”라고 말했다. 이 과정은 각국의 라인 개발자들이 참석하며, 전문 통역사가 배석해 영어로 작성된 장애 보고서를 토대로 질의 응답을 주고 받는다”라고 말했다.


라인의 개발 문화는 주인의식 갖기, 열린 자세, 신뢰와 존중으로 축약할 수 있다. 출처=라인



장애 회고 미팅이 자리 잡은 배경에는 라인의 개발자 문화가 있다고 말했다. 이수안 개발 리드는 “장애 회고 미팅은 라인의 세 가지 덕목인 주인의식 갖기(Take Ownership), 열린 자세(Be Open), 그리고 신뢰와 존중(Trust and Respect)을 모두 담은 과정이다. 문제에 대한 주인 의식과 해결을 위한 열린 자세, 그리고 개발자 간의 신뢰와 존중이 모두 녹아있다”라면서, “엔지니어가 성장하는 과정은 실수를 통해 배우고, 이를 놓치지 않는 것에서부터 시작한다. 문제가 생겨도 모두가 함께 있음을 믿고 도전할 수 있도록 하는 게 장애 회고 미팅의 의의”라고 답했다.

문제를 되짚는 문화가 곧 기업의 경쟁력



이수안 개발 리드는 ‘라인 데브 데이 2021’에서 장애 회고 미팅과 처리 과정 등을 소개한 바 있다. 출처=IT동아



이수안 개발 리드는 지난 11월 10일에서 11일 양일간 진행된 ‘라인 데브 데이 2021’에서 ‘라인 플랫폼 서버의 장애 대응 프로세스와 문화’라는 이름으로 서버 안정성에 대한 절차와 과정, 문화를 소개한 바 있다. 이날 인터뷰로 소개한 내용이 단순한 내부 절차에 그치지 않고, 개발자 생태계에 보탬이 되길 바라서다. 이수안 개발 리드는 “우리의 문화는 문제를 인정하는 것을 넘어서 무엇을 배웠는가를 논한다. 이런 문화 덕분에 문제가 발생해도 개인이 아닌 팀으로 움직이며, 개선의 대상이 시스템 오류로 끝나지 않고 팀의 문화와 절차, 더 나아가 시스템 자체가 된다”라고 말했다.

라인이 글로벌 기업으로 성장할 수 있었던 배경은 문제의 규모를 막론하고 놓치지 않는 섬세함, 그리고 작은 문제도 국경을 넘어서 의견을 나눌 정도의 열린 사고방식 덕분이다. 실제로 장애 회고 미팅을 진행하다 보면 한국과 일본, 대만 등 각국의 개발자들마다 문제를 바라보는 시선이나 성향이 달라서 서로 배우는 계기가 된다고 한다. 이러한 노력이 쌓일수록 개인은 발전을 거듭하며, 기업은 곧 경쟁력을 확보한다. 라인의 개발 문화가 그 어떤 기업보다도 회자되는 이유다.

글 / IT동아 남시현 (sh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 카카오톡VS라인, 검색 기능은 어떻게 다를까?▶ 라인에 줄 선 신입 IT 개발자들, '네카라쿠배'가 뭐길래?▶ 라인 AI CEO와의 대담, '라인은 세상을 발전시키기 위해 인공지능을 연구'



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 가족과 완벽하게 손절해야 할 것 같은 스타는? 운영자 24/06/24 - -
3958 [스케일업] 운약근답올핏 [1] “시장·영업·스케일업 전략 명확하게 제시하라” IT동아갤로그로 이동합니다. 17:29 13 0
3957 업비트·빗썸, 가상자산 투자대회 개최 '투자 심리 회복 기대' IT동아갤로그로 이동합니다. 17:13 13 0
3956 뷰소닉 데이빗 첸 “한국 빔프로젝터 시장, 우리 경쟁력 높일 기회의 땅” [3] IT동아갤로그로 이동합니다. 17:07 305 0
3955 브이디컴퍼니 x 타임빌라스 수원 “대형 매장 서빙, 로봇으로 거뜬히” [2] IT동아갤로그로 이동합니다. 16:15 291 0
3954 [정구태의 디지털자산 리터러시] 디지털자산 갈라파고스 탈출을 위한 제언 2. 실명계좌 제도 개선 IT동아갤로그로 이동합니다. 12:02 18 0
3953 헷갈리는 우회전 교통법규 숙지하기! [이럴땐 이렇게!] [13] IT동아갤로그로 이동합니다. 11:31 2355 3
3952 [르포] ‘페라리’ 전동화 전초 기지 ‘e-빌딩’ 현장 살펴보니 IT동아갤로그로 이동합니다. 06.21 86 0
3951 AWS 지용호 마케팅 총괄 “클라우드 강자 AWS, 생성형 AI 혁신도 주도” IT동아갤로그로 이동합니다. 06.21 91 0
3950 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 16 IT동아갤로그로 이동합니다. 06.21 94 0
3949 [생성 AI 길라잡이] 대화형 생성AI도 골라서 쓰자, GPT와 클로드, 제미나이 IT동아갤로그로 이동합니다. 06.21 4369 5
3948 [농업이 IT(잇)다] 마늘 분류에 비전인식 AI 접목한 '젠틀파머스' IT동아갤로그로 이동합니다. 06.21 89 0
3947 “NFT가 가상자산?” NFT 법적 성격 판단 기준 나왔다 IT동아갤로그로 이동합니다. 06.20 705 0
3946 삼성전자, 빌트인 가전 브랜드 '데이코' 전시·판매 확대로 B2C 시장 공략 [2] IT동아갤로그로 이동합니다. 06.19 2421 0
3945 KIAT, 광주 가전산업 위기 극복 위해 기업과 머리 맞대 IT동아갤로그로 이동합니다. 06.19 108 0
3944 [스케일업] 두디스 [1] BM분석 - "유튜브 영상 분석 플랫폼, 첨예한 접근 필요" IT동아갤로그로 이동합니다. 06.19 107 0
3943 브이디컴퍼니 x 향촌흑염소 "서빙로봇, 대형 요식업 매장에 어울려” IT동아갤로그로 이동합니다. 06.19 125 0
3942 [월간자동차] 24년 5월, 국산 ‘기아 카니발’·수입 ‘테슬라 모델 3’ 판매 1위 IT동아갤로그로 이동합니다. 06.19 664 0
3941 초기 스타트업에 대한 전문적·객관적 평가, '상품성 진단' 들여다보니 IT동아갤로그로 이동합니다. 06.19 100 2
3940 AKG, 라이프스타일에 맞춘 새로운 N 시리즈 ‘N5·N9 하이브리드’ [1] IT동아갤로그로 이동합니다. 06.18 2030 0
3939 세일즈포스, 월드투어 코리아서 AI CRM의 현주소·영향력 입증 IT동아갤로그로 이동합니다. 06.18 94 0
3938 뜨거운 미국 증시 시장, 투자 전 확인해야 될 것들 IT동아갤로그로 이동합니다. 06.18 94 0
3937 [신차공개] ‘캐스퍼 일렉트릭’ 티저 공개·’뉴 레인지로버 벨라’ 사전계약 실시 IT동아갤로그로 이동합니다. 06.17 112 0
3936 ‘인공지능’ 처리하는 AI PC 시대 개막, PC 시장이 움직인다 IT동아갤로그로 이동합니다. 06.17 98 0
3935 [정구태의 디지털 자산 리터러시] 디지털자산 갈라파고스 탈출을 위한 제언 1. 법인참여 허용 IT동아갤로그로 이동합니다. 06.17 99 0
3934 [스케일업] 스크램블러 [1] BM 분석 “뷰티? 스토리테크? 선택과 집중이 필요” IT동아갤로그로 이동합니다. 06.17 100 0
3933 [리뷰] 과감한 디자인 속 탄탄한 기본기, 에이수스 터프 게이밍 F16 IT동아갤로그로 이동합니다. 06.17 935 2
3932 [주간투자동향] 고피자, 1000만 달러 규모 투자 유치 IT동아갤로그로 이동합니다. 06.17 95 0
3931 음향기기, 물에 빠졌다면 이렇게![이럴땐 이렇게!] [1] IT동아갤로그로 이동합니다. 06.17 1125 3
3930 [생성 AI 길라잡이] 갤럭시 AI 활용하기 - '서클 투 서치' IT동아갤로그로 이동합니다. 06.14 196 0
3929 [시승기] 원형 OLED 탑재·차체 키워 7년 만에 돌아온 ‘뉴 미니 컨트리맨’ IT동아갤로그로 이동합니다. 06.14 175 0
3928 루나레이크·애로우레이크로 이원화된 인텔 CPU, 라인업 구분은? IT동아갤로그로 이동합니다. 06.14 180 0
3927 금융위원회 “가상자산 사업자 영업 종료 규제 강화한다” IT동아갤로그로 이동합니다. 06.14 810 0
3926 서울 중구-동국대 캠퍼스타운, 대학과 지역이 함께 고민하는 자원순환 문제 IT동아갤로그로 이동합니다. 06.14 127 0
3925 [SBA x IT동아] ‘마이크로바이옴’으로 보다 나은 삶 만들 것, 윤여민 메가랩 대표 IT동아갤로그로 이동합니다. 06.14 119 0
3924 [스타트업리뷰] 건설인력 노무관리 원 클릭 시스템, 웍스메이트 ‘가다오피스’ IT동아갤로그로 이동합니다. 06.14 121 0
3923 [농업이 IT(잇)다] 네오프로틴 “노인 건강의 핵심은 근력 개선, 해법은 마육 단백질에 있습니다” IT동아갤로그로 이동합니다. 06.14 115 0
3922 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 15 IT동아갤로그로 이동합니다. 06.13 122 0
3921 [시승기] 세단의 승차감 구현한 캐딜락 첫 전기 SUV ‘리릭’ IT동아갤로그로 이동합니다. 06.13 116 0
3920 [SBA x IT동아] 아트랩 “피부 좋아지는 법, AI가 찾아드립니다” IT동아갤로그로 이동합니다. 06.13 120 0
3919 [스타트업 첫걸음] 창업 아이디어 검증을 위한 고려사항 IT동아갤로그로 이동합니다. 06.13 796 0
3918 [기술영업人] AI 확산의 시작과 끝을 함께하는 'AMD코리아'의 영업 전선 IT동아갤로그로 이동합니다. 06.13 416 1
3917 토요타 등 日 5개 자동차 제조사 ‘품질 인증 조작’ 파문 [2] IT동아갤로그로 이동합니다. 06.12 533 3
3916 [리뷰] 넷기어 MS108TUP, 2.5G 이더넷에 60W PoE까지 품은 특별한 스위치 IT동아갤로그로 이동합니다. 06.12 120 0
3915 "먹통 사태 교훈 삼아 안정성 극대화"…카카오 첫 자체 데이터센터 살펴보니 [3] IT동아갤로그로 이동합니다. 06.12 607 0
3914 장대익 가천대 스타트업칼리지 학장 “N번째 인생 전환 이끌 기업가 정신 전파” IT동아갤로그로 이동합니다. 06.12 125 0
3913 철저한 인텔 제품 관리의 산실, 대만 인텔 OEM 연구소 가보니 [6] IT동아갤로그로 이동합니다. 06.12 1727 0
3912 [SBA x IT동아] 세컨드팀 “검증된 해외 개발자, 슈퍼코더에 있습니다” IT동아갤로그로 이동합니다. 06.12 123 0
3911 [자동차와 法] 자동차와 무단횡단자의 과실 비율에 대하여 [1] IT동아갤로그로 이동합니다. 06.11 997 0
3910 애플, 오픈AI와 밀월 시각에 선긋기··· '제 길 가는 애플 인텔리전스' [1] IT동아갤로그로 이동합니다. 06.11 737 0
3909 [뉴스줌인] 부쩍 커진 이동식 에어컨 시장, ‘AI’와 ‘듀얼호스’로 방점 찍은 LG전자 IT동아갤로그로 이동합니다. 06.10 591 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2