상세 컨텐츠

본문 제목

데이터는 처음이라

커리어리뷰

by 자연키 2022. 11. 6. 15:29

본문

1. 기획자에게 데이터란

기획자에게 데이터 분석 역량을 요구하는 케이스가 많이 높아졌습니다. 당연히 데이터 수집 기술이나 디지털 환경 상에서 비즈니스들이 많이 이루어지다 보니 데이터의 중요성은 나날이 증대하고 있는 것이 사실입니다. 물론 서비스기획자에게 데이터엔지니어 수준의 데이터 관련 기술을 요구하거나 데이터과학자 수준의 데이터 분석 역량을 요구하진 않습니다. (잘하면 좋긴 하지만 그렇게 다 잘할거면 기획도 하고 개발도 하고 디자인도 하고...)

다만, 수집된 데이터를 어떻게 해석을 해야겠다거나 간단한 가공 정도는 할 수 있는 수준이 되면 좋긴 합니다. 단순히 데이터를 분석하기 위해서가 아니라 서비스기획의 뒷받침이 될 근거를 만들기 위함입니다. 아예 새로운 것을 만든다면 직관이 좀 더 중요할 수도 있습니다. 그렇다고 해도 비슷한 사례나 하늘아래 완전히 새로운 서비스는 없다는 것이 중론이긴 합니다. 그렇다면 논리적인 근거로 사회과학의 방법론인 통계를 들고 오는 것이 가장 합리적입니다. 그렇다면 이 통계를 데이터와 어떻게 실무적으로 엮게 될까요? 

2. 데이터 수집

통상 서비스기획자에게 가장 많이 주어지는 데이터는 GA와 같은 로그 분석 툴에서 수집된 데이터입니다. GA는 Google Analytics로, 구글에서 제공하는 무료(트래픽 수준이나 지원 등에 따라 유료) 로그 분석 툴입니다. 과거까지는 GA3(Universal Analytics)를 많이 이용했으나 내년부터는 GA4 이용이 필수로 변경될 예정입니다. 이 내용도 추후에 포스팅으로 다뤄보겠습니다. 아무튼 이런 분석 툴은 GA를 제외하더라도 에이스카운터, 앱애니 등 여러 분석 툴이 시중에 있습니다. 세부적인 용어나 설치방법 등은 다를지 언정 기본적인 개념은 어느정도 컨센서스가 형성되어 있다고 봐도 무방합니다.

물론 서비스 기획자가 직접 데이터 수집을 수행하진 않습니다. 이러한 데이터 분석 툴을 설치하는 것은 개발자와의 협업이 필요한 부분입니다. 그러나 최근에는 GTM(Google Tag Manager)와 같은 솔루션을 통해 최초 설치 이후에는 비개발자도 원하는대로 데이터를 수집할 수 있는 여건을 제공하기도 합니다.

2.1. 사용자

가장 중요한 개념입니다. 우리의 서비스를 이용하는 사용자를 분석하기 위해 데이터를 수집합니다. 인구통계학적으로 분석할 수도 있고, 지리적으로, 혹은 디바이스에 대한 분석 등이 이루어질 수 있습니다. 또한, 코호트 분석이라 불리는 사용자를 그룹으로 분류해서 분석하는 기법을 활용할 수도 있습니다. 어떤 방식이 되었든 우리 서비스를 사용하고 있는 사용자에 대해서 분석하기 위한 데이터를 수집하게 됩니다. 예를 들면 AOS(안드로이드)에서는 전환이 잘 이루어 지고 있었는데 업데이트 이후 IOS(애플)에서는 전환이 잘 일어나지 않는다는 분석 결과를 받아들이게 되면, 사용자를 두 집단으로 나누어봤을 때, 한쪽에서의 전환율이 급격하게 낮아지는 것이므로 변경된 페이지가 IOS와 호환이 잘 안되었다거나 이런 부분을 캐치할 수 있겠죠. 이 경우, 두 집단(세그먼트)를 나누는 기준이 디바이스의 OS유형이 될 것이구요.

2.2. 행동

위의 여러 형태의 사용자들이 취하는 행동을 의미합니다. 간단하게 화면을 조회(view) 하는 경우도 있고, 화면 내에서 스크롤링(scroll)하거나 특정 링크나 버튼과 같은 클릭가능한 요소를 클릭(click)하는 경우도 있을 수 있겠죠. 이 행동들을 기반으로 서비스의 핵심 KPIs(Key Performance Index)를 설정할 수도 있고 지속 가능한 서비스로 기획자가 관심을 쏟게 되겠습니다. 이러한 행동은 어떠한 트리거(trigger)가 작동하게 되면 일정한 데이터를 적재하게 됩니다. 예를 들어 쇼핑몰의 경우, 구매라는 비즈니스 프로세스가 가장 중요한 부분이므로 사람들이 구매 버튼을 클릭하는 행동을 측정해야 할 필요가 있다고 간주해봅시다. 그러면 그 버튼에 대해서 클릭 했을 때 데이터가 적재될 수 있도록 세팅을 하고 단순히 클릭 횟수만 측정하는 것이 아니라 분석을 위해 어떤 제품군(product category)인지 어떤 제품(SKU, product name, product name)인지 제품의 색상이나 옵션(product color, product option)을 함께 수집한다면 사용자 정보와 결합하여 보다 풍부한 데이터 분석을 할 수 있을 것입니다.

3. 데이터분석

GA가 되었든 뭐가 되었든 데이터를 수집하게 되었으면 이제 분석을 해야 합니다. 데이터가 많아도 쓸모있는 데이터가 아니면 쓰레기(Garbage data)에 불과합니다.

Garbage in, Garbage out

데이터를 분석하는데에 가장 기초적으로 쓰일만한 툴은 엑셀입니다. 실무에서는 ANOVA 같은 통계기법을 활용하기 보다는 단순 기술통계만으로도 많은 일을 할 수가 있습니다. 대표적으로 AB테스트가 그렇습니다. UX에 대한 의사결정 때문에 버튼의 크기를 확대해야 한다고 가정해 봅시다. 그럼 그 확대의 정도를 어느정도로 가져갈 것인지 그 누구도 알 수가 없습니다. 더불어 버튼확대가 실제로 도움이 된다는 가설에 대해 그 누구도 보장할 수 없는 것이 현실입니다. 그러면 어떡해야 할까요? 간단합니다. 테스트를 해보면 됩니다. 기존과 동일한 크기의 버튼이 있는 화면(A)과 기존보다 큰 크기의 버튼이 있는 화면(B)간 어느 쪽에서 더 구매가 많이 일어나는지 측정을 해보고 신뢰도를 고려해서 의사결정을 하면 됩니다.

구분 Case A Case B
구매 100 150
비구매 150 100

위와 같은 결과가 나왔다면 아마도 특별한 사정이 없는 한 Case B를 선택하겠죠? 이게 AB테스트라는 개념인거고 이를 기술통계적으로 분석한 결과로 의사결정하는 사례를 예시로 든 것입니다. 물론 회사라는 공간의 특성 상 분석 결과가 상황에 따라 표의 형태가 될 수도 있고 차트가 될 수도 있으며, 이러한 영역을 데이터 시각화라고 불리는 영역이긴 합니다. 데이터 시각화도 엑셀에서도 충분히 가능하며 최근에는 python을 따로 배워서 pandas 라는 패키지를 활용하기도 합니다.

Jupyter Notebook 예시 이미지
Python을 Jupyter Notebook을 통한 구현 캡쳐 이미지

반응형

'커리어리뷰' 카테고리의 다른 글

MECE는 처음이라  (0) 2022.11.07
custom event는 처음이라  (0) 2022.11.07
[python] 데이터는 처음이라 - csv 파일 불러오기  (0) 2022.11.06
PM은 처음이라  (0) 2022.11.06
서비스기획자는 처음이라  (0) 2022.11.06

관련글 더보기

댓글 영역