이번 레터는 다양한 관점에서의 데이터에 대한 이야기들을 주로 선정해보았습니다. 재밌 읽어봐 주세요 😃 PAP는 PM, 분석가, 개발자, 연구원 등 데이터에 관심있는 다양한 직군의 사람들이 모여 이야기를 나눌 수 있는 공간인데요. 앞으로는 그 공간을 조금 더 넓혀나가려고 하고 있어요.
뉴스레터를 시작하게 된 계기도 더 많은 분들이 데이터에 관한 이야기를 접했으면 한다는 바람이었고요.
그래서 지금 이 레터를 열어본 구독자님이 주시는 의견들도 저희에겐 많은 도움이 되고 있어요. 앞으로 PAP의 공간이 더 넓혀지면 그 공간에 초대해서 같이 의견을 나눠봐도 좋을 것 같다는 생각하고 있어요.
그래서 이번 레터는 다양한 관점에서의 데이터에 대한 이야기들을 주로 선정해보았습니다. 재밌게 읽어봐 주세요 😃
* PAP 뉴스레터는 2주에 한 번씩 발송됩니다. |
|
|
PAP의 퍼블리셔 분들이 정성스럽게 작성한 글 중 꼭 읽어봤으면 하는 글들을 소개해 드립니다 |
|
|
사용자의 패턴을 세부적으로 도출해보자
“사용자들이 우리의 제품을 어떻게 사용하고 있을까? 문제는 없을까?” 이러한 질문과 고민에 가장 기본적으로 깔대기 모양의 퍼널을 구성하여 시각화시키고 문제점을 찾곤 합니다. 이는 사용자가 어떤 부분에서 이탈을 하는지 혹은 전환율이 어떻게 되는지 전체적인 흐름을 파악할 수 있는 지표입니다.
그러나 큰 흐름을 보다보면 문제의 지점이 보이게 되고 이를 개선하기 위해서 세부적으로 분석을 해야하는 경우가 있는데 이런 경우 사용할 수 있는 하나의 방법이 프로세스 마이닝입니다.
- 프로세스 마이닝이란 무엇일까?
- 프로세스 마이닝에서 중요한 개념
- 프로세스 마이닝을 잘 사용해보기 위해 필요한 TIP
- 프로세스 마이닝 시각화 방법
|
|
|
데이터 파이프라인 개념 정리
우리는 주로 BI 툴이나 대시보드 툴을 통해 데이터를 확인하고 분석합니다. 하지만 이 데이터, 어디서 어떻게 처리되는지 알고 있나요?
필요한 데이터를 원하는 대로 활용하려면 데이터 파이프라인과 데이터 처리 방식에 대해 알아둘 필요가 있습니다. 그런 뒤에 효율적인 데이터 수집 방식이나 활용 방법을 고민한다면 좋겠죠. 분석가, 엔지니어와도 수월하게 대화할 수 있을 거고요. BI를 설계할 때에도 데이터 파이프라인을 꼭 알아둬야 합니다.
- 빅데이터는 무엇이고 왜 주목받게 되었을까?
- 데이터 파이프라인은 무엇일까?
- 데이터 웨어하우스를 주축으로 한 데이터 파이프라인
- 데이터 레이크를 주축으로 한 데이터 파이프라인
|
|
|
통계학, 그게 왜 중요한데?
DA/DS 도메인에 계시는 분이라면 어디선가 통계학의 중요성을 강조하는 영상이나 아티클을 한 번 쯤은 보셨을거라 생각합니다. 통계학을 전공했던 학생이라 이런 이야기를 들을 때마다 기분이 좋긴 했지만, 통계학이 중요하다고 말하는 구체적인 이유에 대해 항상 궁금해하곤 했습니다.
한 마디로 잘 요약된 직접적인 답을 드릴 순 없겠지만, 간접적인 답을 제시하고자 합니다.
- 통계학이 쓰레기라고?
- 통계학으로부터 배운 포인트들
|
|
|
AB Test를 악용하여 프로덕트와 조직을 망치는 5가지 방법
AB Test를 잘 쓰면 도움이 된다는 사실은 누구나 알고 있습니다. 하지만 AB Test를 악용하여 상품과 조직을 망치는 방법은 당하지 못하면 알지 못합니다. 혹시나 조직이 커지면서 AB Test를 악용하기 시작한 것은 아닌지 타산지석 삼을 수 있는 이야기들을 담아보았습니다.
- 직관이 뛰어나다고 과신하며, 기대와 다른 결과가 나오면 원하는 결과가 나올때까지 실험을 반복하거나, 실험 조건을 조작한다.
- AB Test를 상벌처럼 이용해, 일부에게는 면제권을 주고, 일부에게는 견제수단으로 사용한다.
- 검증이 충분히 되지 않은, 또는 특정 조직과 담당자의 입장만 반영하는 2차 메트릭을 이용하여 평가한다.
- P-Value를 무시하고, 변화량으로 이야기한다.
- P-Value를 맹신하고, 특정 메트릭의 변화만 가지고 의사결정한다.
|
|
|
최근 많이 회자되고 있는 아티클 중 PAP 멤버들의 추천을 통해 선정된 아티클들을 소개합니다 |
|
|
데이터에 진심인 회사, 우버(Uber)는 모든 직원이 특별한 기술 지식 없이도 더 나은 의사결정을 내리고 결과를 예측할 수 있도록 한다는 데이터 사이언스 비전을 가지고 있습니다. 즉, 모든 구성원이 각자의 영역에서 데이터 과학자가 되는 것이지요!
- 더 나은 예측을 위해 과거 데이터 확보, 활용에 집중
- 훌륭한 기술을 넘어, 부서 간 상호작용 활성화
- 모든 데이터와 지표를 실시간으로 관측 가능한 환경 조성
|
|
|
성장이 정체 됐다고 느껴지던 듀오링고에서, 4년 동안 DAU를 4.5배 성장시킨 비결로써 Growth Modeling을 소개한 아티클을 공유합니다. 특히 80%의 신규 유저를 paid 가 아닌 organic 하게 획득했다는 것이 인상적이에요!
- 목표지표(DAU)를 설정하고, 이를 상세 유저 세그먼트로 분해한다.
- Markov Model 개념을 도입해, 각 세그간 Transition Probability를 구한다.
- Transition Probability 중, 어떤 것을 높여야 목표지표에 가장 큰 영향을 미치는지 시뮬레이션한다.
- 찾아낸 가장 임팩트 큰 레버를 개선하기 위한 Iteration을 반복한다.
|
|
|
💌 구독자님에게 드리는 운영진의 편지
안녕하세요. PAP 운영진 한상윤입니다.
PAP 커뮤니티와 뉴스레터에 관심을 가져주셔서 감사드립니다. 저는 PAP 내에서도 Community Relations를 맡고 있는데요, 쉽게 말해 PAP 내에서 여러분들과의 소통을 즐기며 PAP에서 나온 다양한 이야기와 지식을 효과적으로 공유하는 방법을 고민하는 사람 중 한 명입니다.
운영진은 PAP의 큰 틀 또는 뼈대일 뿐이라서 꼭 이래야 한다! PAP는 이런 것이다! 라고 정의하고 있지 않습니다. 데이터를 중심으로 다양한 의견과 경험을 공유하면서 커리어는 물론, 개인의 삶에서도 즐거움과 배움이 있었으면 좋겠다라는 생각으로 운영하고 있습니다. PAP 내에는 PM, 분석가, 개발자, 연구원 등 데이터에 관심있는 다양한 직군의 사람들이 모여있고, 앞으로 더 다양한 경험과 지식을 가지신 분들이 함께 대화할 수 있는 이야기의 장을 만들려고 합니다. 여러분들의 아이디어와 의견을 언제든지 환영하며, 저희에게 제안해주실 것이 있다면 편하게 말씀해주세요.
PAP의 블로그나 뉴스레터를 보시다가 의견을 주셔도 되고 ‘데이터에 관해 고민이 있는데 다른 사람들은 어떤 생각을 가지고 있을까’와 같은 것도 좋습니다. 실제로 데이터 관련 팀 빌딩이나 데이터 기반 의사결정, 거버넌스 등에 대한 발화가 있어서 의미있는 대화를 가졌던 적도 있습니다. 저희는 앞으로 이런 대화를 통해 얻은 인사이트나 의견을 공유하고 이를 통해 함께 성장하는 것을 목표로 하고 있습니다. 저희는 현업자의 인사이트도 중요하게 생각하지만 입문자의 시선 그리고 업무 상 카운터파트의 생각도 중요하다고 여기기 때문에 직군, 연차 등을 신경쓰지 말고 편하게 의견주세요.
여러분들과 함께 소통하며 성장하고 싶습니다. 다시 한번 여러분의 관심에 감사드리며 마무리하도록 하겠습니다. 즐거운 가정의 달, 5월 보내시기 바랍니다!
|
|
|
PAP 커뮤니티를 더 알아가고 싶다면 아래 페이지들로 놀러오세요! |
|
|
PAP | Product Analytics Playground
|
|
|
|
|