기술 이야기
home
Programming
home
💾

[NDC] 테라바이트 규모의 변화무쌍한 데이터 정제 플랫폼

Upload date
2022/06/09
Tag
빅데이터
데이터정제
로그시스템
NDC
Editor
데이터엔지니어링팀_이재면
Editor is
넥슨코리아 인텔리전스랩스에서 게임 로그를 위한 수집/적재 플랫폼을 연구/개발과 운영하고 있습니다. 시스템의 효율을 개선시키는 일에 흥미를 갖고, 저전력 분산파일시스템을 연구하여 박사학위를 취득했습니다. 분산파일시스템, 빅데이터 스토리지 시스템, 클라우드/엣지 컴퓨팅, 고신뢰성 시스템, 사이버 물리 시스템에 관심을 갖고 있으며, 클라우드 환경에서 scalable하고 robust한 인프라로 데이터를 수집, 변환, 저장하는 업무를 담당하고 있습니다.
상태
2 more properties

발표 내용의 난이도 | 기본적인 사전지식 필요

대상 | 데이터 엔지니어, 시스템 엔지니어, 백엔드 엔지니어

세션설명

분석 서비스를 위해 게임 로그를 수집하는 데이터 파이프라인 중 하나인 정제 플랫폼을 개발하면서, 어떤 문제점이 도출됐고, 어떻게 해결했는지 공유하고자 합니다. 다양한 게임으로부터 다채로운 로그를 처리하다보니, 정말 변화무쌍하게 데이터가 유입되고 있습니다. 이를 한 곳에서 한 번에 조회할 수 있고 일관성을 보장하기 위해, Data Cleaning, Normalizaiton, Extension, Derivation을 도입하고 있습니다. 일반적인 데이터 파이프라인에 필수 기능은 아닐 수 있지만, 예측되지 않은 데이터를 다루시는 분들께, 데이터 품질을 높이는 과정을 고민하는 분들께 조금이나마 도움이 되었으면 합니다.
NDC 저작권 방침 (펼치기)
Techblog Contents
Related Sites
 넥슨 게임 포탈
회사 소개
인텔리전스랩스 소개
인재 영입
인텔리전스랩스 블로그 운영 정책
 테크블로그 문의 devrel@nexon.co.kr