
RFM 1등급 고객들은 서로 비슷할까요?아래의 User A, B, C는 모두 RFM 기준으로 1등급에 해당하는 고객이지만, 실제로는 완전히 다른 성향의 골퍼입니다. User A: 평일 낮에만 꾸준히 방문→ 직장인일 가능성은 낮고, 시간 여유가 있는 5060대 골퍼일 가능성이 높음User B: 오직 주말에만 이용→ 평일에는 시간이 없는 전형적인 직장인User C: 한여름인 7~8월에는 요일을 가리지 않고 자주 이용했지만, 9월에는 단 한 번도 스크린골프를 치지 않았음→ 가을에는 필드 라운딩을 나가는 골퍼일 가능성이 높음이처럼 연간 예약 횟수는 비슷해도, 고객의 성향은 완전히 다른 경우가 많습니다. 이들에게 동일한 CRM을 똑같은 시점에 하는 것은 합리적이지 않기 때문에, RFM 분석만으로는 부족하다고 말..
10명도 안되던 스타트업의 초기 멤버로 합류한지 4년이 지났다.앱 다운로드는 200만을 바라보고 있고, 그 사이 수많은 성공과 실패를 경험했다.하지만 나는 단 한번도 외부에 글을 쓴 적이 없다.쓸 말이 없어서는 아니었고, 오히려 할 이야기는 늘 많았다. -그냥.. 요즘 들어 글을 써야겠다는 의무감, 자신감, 불안감이 겹쳤다.1. 우리 회사의 발자취를 깔쌈하게 남겨야겠다는 의무감 (PO로서)2. 나의 경험이 누군가에게는 도움이 될 것이라는 자신감 (성공 경험들)3. 더 늦기 전에 나의 흔적을 세상에 남겨야겠다는 불안감 (이제 만 29세;) -그래서 한 달에 1-2개 정도의 글을 쓰기로 했다. 폐쇄적인 시장을 혁신해온 이야기,시장이 폭풍 성장했을 때와 침체기를 맞이했을 때의 경험,유니콘 같은 팀원들과의 ..

분석 모형 전개 (deployment)분석 결과 활용 시나리오 개발분석 모형 모니터링분석 모형 리모델링1. 분석 모형 전개(1) 빅데이터 모형 운영 시스템 적용 방안빅데이터 모형 개발 및 운영 단계분석 목적 정의가설 검토데이터 준비 및 처리 : 불필요한 변수는 제거하고 변수 변환, 새로운 파생변수를 생성하는 등의 작업을 통해 변수별로 분석 모형에 포함하는 것이 타당한지 확인. 데이터 마이닝 기반 분석 모형을 개발할 때는 학습 데이터세트, 평가,검증 데이터 세트로 수집된 데이터를 나누는 작업 수행모델링 및 분석 : 구체적인 통계적 질문으로 변환하는 단계정확도 및 성능 평가운영빅데이터 모형의 운영 시스템 적용 방안빅데이터 모형의 운영 시스템 적용 단계분석 모형 적용 모듈 결정분석 모형 통합 결정 및 구현(2..

시공간 시각화관계 시각화비교 시각화인포그래픽1. 시공간 시각화(1) 시간 시각화시간 시각화 개념주요 관심요소는 경향성. trend. 추세선과 산점도의 경우 시간의 흐름에 따른 추세를 알아볼 수 있음시간 시각화의 유형막대 그래프누적 막대그래프선 그래프영역차트계단식 그래프. : 변화가 생길때까지 x축과 평행 선 유지. 다음 값으로 변하는 지점에서 급격하게 뛰어오르는 계단층시간 시각화의 해석한 지역의 월별 교통사고 추이를 시각화하기 위해 R의 ggplot2 패키지에서 제공하는 함수를 이용하여 막대그래프를 작성한다.막대그래프는 R 언어의 geom_bar() 함수를 이용하여 작성한다.(2) 공간 시각화공간 시각화의 개념 : 지도 정보 표현. 위도 경도 사용공간 시각화의 유형등치지역도 : 지리적 단위로 데이터의 의..

분석 모형 해석비즈니스 기여도 평가1. 분석 결과 해석(1) 데이터 시각화의 개념(2) 데이터 시각화 기능설명 기능 :탐색 기능 :표현 기능 :(3) 데이터 시각화 목적정보 전달설득(4) 데이터 시각화 유형시간 시각화분포 시각화관계 시각화비교 시각화공간 시각화(5) 빅데이터 시각화 도구시간 시각화 : 막대그래프, 점그래프분포 시각화 : 파이 차트, 도넛 차트, 트리맵관계 시각화 : 산점도, 버블 차트, 히스토그램비교 시각화 : 히트맵, 평행 좌표 그래프, 체르노프 페이스공간 시각화 : 등치선도, 도트맵, 카토그램(5) 빅데이터 시각화 도구태블로 : 클라우드 기반으로 데이터를 클라우드에 저장인포그램 : 실시간으로 인포그래픽을 연동해줌. 교육, 강의, 미디어 등 자료 제작차트 블록 : 코딩 없이 스프레드시트..

과대 적합 방지매개변수 최적화분석 모형 융합최종 모형 선정1. 과대 적합 방지(1) 과대 적합의 개념제한된 학습 데이터 세트에 너무 지나치게 특화되어 새로운 데이터에 대한 오차가 매우 커지는 현상. 모델의 파라미터 수가 많거나 학습용 데이터 세트의 양이 부족한 경우에 발생함분석 모형 관련 용어학습 데이터 : 관측된 데이터를 좌표계로 변환함일반화 : 테스트 데이터에 대한 높은 성능을 갖춤. 과대적합, 과소적합을 피하고 정상추정함과대 적합 : 모델이 학습 데이터에 너무 잘 맞지만, 일반화가 떨어짐과소 적합 : 모델이 너무 단순하여 데이터의 내재된 구조를 학습하지 못할 때 발생(2) 과대 적합 방지하기데이터 증강모델은 학습용 데이터 세트의 양이 적을 경우, 해당 데이터의 특정 패턴이나 노이즈까지 분석되어 과대..