데이터 분석에는 얕은 분석과 깊은 분석이 있습니다. 이 글에서는 얕은 분석과 깊은 분석의 차이를 설명하고, 깊은 분석이 어려운 이유를 설명합니다. 미래에는 깊은 분석이 얕은 분석이 될 수 있다는 점을 인지하며, 분석가들이 미래에도 임팩트를 낼 수 있는 분석을 해야한다는 내용을 담았습니다.
최근 chatGPT 같은 언어 모델에 대한 관심이 많아지고 단순히 chatGPT API를 이용하는게 아니라 직접 언어 모델을 개발해서 적용하려는 움직임이 많은 것 같습니다.(최적화, 보안 등 때문에 직접 개발 및 운영) 그러면서 동시에 LLM을 운영하고 최적화할지 등을 고려하는게 LLMOps인데 한글 자료 중 잘 정리된 것이 있어 소개드립니다.
LLMOps는 아주 큰 언어 모델인 Large Language Model (LLM)을 학습하고 배포하기 위한 기술을 가리킵니다.
이는 더 많은 데이터를 활용하여 모델을 학습시키고, 컴퓨터 자원을 최적화하여 큰 모델을 효과적으로 학습시키며, 이러한 모델을 실제 서비스로 배포하는 과정을 다룹니다.
LLM의 파라미터 수가 계속 증가함에 따라 이러한 LLMOps 기술은 더욱 중요해질 것이고, LLM 기반의 서비스가 늘어나면서 사용자들이 원하는 결과를 얻기 위한 prompting 기술에도 큰 영향을 줄 것으로 보입니다.
데이터 기반 접근 방식을 채택하는 기업은 그렇지 않은 기업보다 훨씬 더 나은 성과를 거둔다고 합니다. 하지만 데이터 기반 기업을 찾기는 쉽지 않은데요. 데이터 기반 기업이 되기 위해 필요한 내용을 정리한 글이 있어 소개드립니다.
잘못된 데이터를 구분하는 것
데이터 통합을 기술 문제로 보는 것
단기 비즈니스 이익이 없는 것
최종 사용자에게 필요한 셀프 서비스 도구를 제공하지 않는 것
최종 사용자를 개발 과정에 포함시키지 않는 것
신뢰 부족
💌 구독자님에게 드리는 운영진의 편지
안녕하세요. PAP 운영진 김상현입니다.
벌써 2023년이 절반이나 지나가고 있네요. 제가 다니고 있는 회사는 1년을 크게 상반기, 하반기로 나누어 팀마다 목표를 설정하고 달려갑니다. 상반기의 성과를 갈무리하는 시기가 다가온 것이죠. 6개월 동안 좋은 사람들과 함께 일하며, 문득 데이터 분석가란 팀의 "응원단장"이란 생각을 많이 하게 되었어요. 부족하고 개선해야 할 점을 찾아낼 때 데이터는 엄청난 무기가 되지만, 우리 팀이 잘하고 있다는 것을 어필할 때에도 손에 잡히는 지표만한게 없는 것 같습니다. 지표를 활용해 우리의 부족함 뿐 아니라, 잘하고 있는 것들을 Highlight 하기 위해 노력했는데요. 팀원들의 사기가 높아지는 것을 지켜보며 큰 보람을 느낄 수 있었습니다. 데이터를 다루다보면 개선해야할 것에, 위험 신호를 나타내는 것에 집중하게 될때가 많지만, 반대 방향으로도 잘 활용할 수 있다는 것을 배우는 6개월이었습니다.
여러분의 2023년 상반기는 어떠셨나요? 다가오는 하반기도 값진 경험과 배움으로 채워졌으면 좋겠습니다. PAP 뉴스레터를 구독해주시는 여러분께 항상 감사합니다.
ps. 뜬금없지만 문득 얼마나 많은 분들이 [운영진의 편지]까지 정독하시는지 궁금해졌습니다. 이 추신을 읽고, playinpap@gmail.com 로 회신을 주시는 분 중 랜덤으로 한 분께 기프티콘을 보내 드릴게요. 완독률 추정을 위한 훌륭한 소스 데이터가 되실 수 있는 기회를 놓치지 마세요!