I. 계산기 소개
사용자 생명주기 리텐션 분석 계산기는 등록으로 그룹화하여 사용자의 후속 각 생명주기 일/월 리텐션 상황을 분석하는 전용 도구입니다. 본 도구는 항상 등록일(또는 등록월)을 그룹화 레이블로 사용하며, 첫 주문이나 첫 구매 등의 행동을 그룹화 기준으로 의존하지 않습니다. 등록월 또는 등록일로 그룹화하여 서로 다른 동기군(cohort)이 등록 후 각 오프셋 월, 오프셋 일의 유지 인원수와 유지율을 추적하고, 리텐션 매트릭스와 평균 유지 추세도를 생성하여 서로 다른 시기에 획득한 사용자의 리텐션 성능을 이해하고, 신규 획득과 리텐션 전략 수립에 데이터 지원을 제공합니다.
핵심 기능
- 자연월 리텐션 매트릭스:등록월로 그룹화하여 각 오프셋 월(당월, 1개월 후, 2개월 후… 최대 12개월)의 사용자 유지 인원수를 표시하여 역삼각 리텐션 매트릭스를 형성
- 자연일 리텐션 매트릭스:등록일로 그룹화하여 각 오프셋 일(당일, 1일차… 30일차)의 사용자 유지 인원수를 표시(최근 30개 등록일). 등록 후 첫 달 리텐션 세부사항을 관찰하기 용이
- 평균 유지 추세도:각 오프셋 월의 평균 유지 인원수와 유지율을 집계하여 추세 곡선을 형성하고, 리텐션 전환점을 식별하기 용이
- 통일된 그룹화 기준:모든 분석은 등록을 cohort 시작점으로 하며, 첫 주문 등의 다른 그룹화 로직을 포함하지 않음
적용 시나리오
- 서로 다른 등록 시기의 사용자의 장기 리텐션 차이를 평가하고, 고품질 획득 채널을 식별
- 리텐션 전환점(예: 몇 개월째, 며칠째에 이탈이 증가)을 식별하고, 타겟팅된 운영 전략을 수립
- 운영 캠페인이나 제품 개편 전후로 신규 등록 사용자의 리텐션 변화를 비교
- 사용자 생명주기 유지 추세를 관찰하여 신규 획득·리텐션 전략에 데이터 근거를 제공
적용 고객
본 계산기는 사용자 생명주기 리텐션을 분석해야 하며 사용자 등록일과 행동일을 갖춘 모든 업계와 시나리오에 적용되며, 특히 다음 유형의 고객에 적합합니다:
- 음식·음료 업계:레스토랑, 패스트푸드점, 커피숍, 버블티 가게 등. 등록으로 그룹화하여 사용자 리텐션을 분석하고, 음식 품질과 서비스 경험이 리텐션에 미치는 영향을 평가
- 전자상거래 플랫폼:B2C 전자상거래, C2C 플랫폼, 수직 전자상거래 등. 등록으로 그룹화하여 사용자 리텐션을 추적하고, 신규 사용자 가이드와 재구매 전략을 최적화
- 소매 업계:슈퍼마켓, 편의점, 전문점, 브랜드 소매 등. 등록으로 그룹화하여 사용자 리텐션 습관을 이해하고, 회원 마케팅과 프로모션 전략을 수립
- 생활 서비스:미용실, 피트니스 클럽, 세차 서비스, 가사 서비스 등. 등록으로 그룹화하여 서비스 이용 리텐션을 분석하고, 서비스 품질이 리텐션에 미치는 영향을 평가
- 온라인 교육:온라인 코스 플랫폼, 교육 기관 등. 등록으로 그룹화하여 학습자의 리텐션을 추적하고, 코스 내용과 학습 경험을 최적화
- 구독 서비스:동영상 플랫폼, 음악 플랫폼, 독서 플랫폼 등. 등록으로 그룹화하여 구독 사용자의 리텐션을 분석하고, 서비스 품질과 사용자 만족도를 평가
- 기타 B2C 사업:개인 소비자를 대상으로 하는 모든 사업으로, 사용자 등록과 행동 기록을 포함하며 등록으로 생명주기 리텐션을 분석하고자 하는 경우 본 도구를 사용할 수 있습니다
적용 전제:귀하의 사업이 사용자 ID, 이벤트일(주문일, 로그인일 등의 행동 발생일), 등록일의 데이터를 제공할 수 있으며, 사업상 사용자가 등록 당일에 행동이 있었는지를 구분할 수 있어야 합니다(본 도구는 등록 당일에 거래/행동이 있는 사용자만 집계합니다).
II. 알고리즘 소개
2.1 핵심 개념
그룹화 레이블: 등록
- Cohort 그룹화 레이블:등록일 또는 등록월. 사용자는 등록일이 속한 날짜 또는 월에 귀속하여 동기군을 형성합니다.
- 첫 주문 사용 안 함:본 도구는 첫 주문, 첫 구매 등을 그룹화 기준으로 사용하지 않으며, 등록만을 레이블로 사용합니다.
유지와 오프셋
- 당일 / 당월:등록일 당일, 또는 등록일이 속한 자연월.
- N일차 / N개월 후:등록일로부터의 상대적인 오프셋 일수 또는 오프셋 월수.
- 유지:어떤 오프셋 일 또는 오프셋 월에서, 사용자가 그 일 또는 그 월에 최소 1건의 이벤트(주문, 로그인 등) 기록이 있는 것.
사용자 범위
- 등록 당일에 거래(행동)가 있는 사용자만 집계:어떤 사용자가 등록 당일에 이벤트 기록이 없는 경우, 해당 사용자는 본 분석에 참여하지 않습니다.
- 이로써 각 cohort의 "시작점"이 일치하여 서로 다른 등록 시기의 리텐션 성능을 가로 방향으로 비교하기 용이합니다.
2.2 계산 로직
단계 1: 데이터 전처리
시스템은 데이터에 대해 다음 처리를 수행합니다:
- 날짜 파싱:등록일, 이벤트일 문자열을 날짜 객체로 파싱
- 무효 데이터 필터링:사용자 ID, 등록일, 이벤트일이 누락되거나 무효한 기록을 제외
- 무효 구간 제외:이벤트일이 등록일보다 이른 기록을 제외
단계 2: "등록 당일에 거래 있음" 사용자 식별
각 사용자에 대해:
- 이벤트일 = 등록일인 기록이 존재하는지 확인
- 존재하는 경우, 해당 사용자를 "등록 당일에 거래 있음"으로 표시하고 후속 분석에 포함; 그렇지 않으면 제외
단계 3: 오프셋 월 / 오프셋 일 계산
- 자연월:등록월
join_month(YYYY-MM), 이벤트월 event_month(YYYY-MM). 오프셋 월 = 두 월 사이의 월 차이(0 = 당월, 1 = 1개월 후, …).
- 자연일:등록일, 이벤트일을 일 차이로 계산하여 오프셋 일수를 계산(0 = 당일, 1 = 1일차, …). 자연일 표는 0~30일의 열만 유지하며, 최근 30개 등록일만 표시합니다.
단계 4: 리텐션 매트릭스 구축
- 자연월 표:행 = 등록월, 열 = 당월, 1개월 후, …, 최대 12개월 후; 셀 = 해당 cohort가 해당 오프셋 월에 여전히 행동이 있는 중복 제거 사용자 수.
- 자연일 표:행 = 등록일(최근 30행), 열 = 당일, 1일차, …, 30일차; 셀 = 해당 cohort가 해당 오프셋 일에 행동이 있는 중복 제거 사용자 수.
단계 5: 평균 유지 추세도
오프셋 월로 집계: 각 오프셋 월에 대해, 모든 cohort의 유지 사용자 수 평균(또는 유지율)을 구하여 "평균 유지 추세" 곡선을 생성합니다.
단계 6: 결과 표시
- 사용자 생명주기 유지 추세(자연월):등록월로 그룹화하여 각 오프셋 월의 사용자 유지 인원수를 표시; 등록 당일에 거래가 있는 사용자만 집계
- 사용자 생명주기 유지 추세(자연일):등록일로 그룹화하여 각 오프셋 일(0~30일)의 사용자 유지 인원수를 표시; 등록 당일에 거래가 있는 사용자만 집계, 최근 30행
- 평균 유지 추세:각 오프셋 월의 평균 유지 인원수/유지율 곡선
2.3 데이터 필터링 규칙
- 데이터 완전성:중요한 필드(사용자 ID, 등록일, 이벤트일)가 누락된 기록은 자동으로 제외됩니다
- 날짜 파싱:시스템은 일반적인 날짜 형식을 자동으로 식별하며, 파싱할 수 없는 날짜는 제외됩니다
- 사용자 범위:등록 당일에 거래가 있는 사용자만 집계하며, 등록 당일에 행동이 없는 사용자는 분석에 참여하지 않습니다
- 자연일 표:최근 30개 등록일, 0~30일의 오프셋 열만 표시; 자연월 표의 오프셋 월은 최대 12개월
III. 사용 설명 및 주의사항
3.1 데이터 준비
필수 필드
데이터를 가져오기 전에, 데이터 파일에 다음 세 가지 필드가 포함되어 있는지 확인하세요:
- 사용자 ID (
user_id)
- 설명: 사용자를 고유하게 식별하는 필드(사용자 ID 또는 전화번호 모두 가능)
- 형식 요구사항: 텍스트 또는 숫자 모두 가능
- 예시:
U001, 12345, 13800138000
- 이벤트일 (
event_date)
- 설명: 사용자가 행동을 한 날짜(주문일, 로그인일 등)
- 형식 요구사항: 여러 날짜 형식을 지원(
YYYY-MM-DD, YYYY/MM/DD, MM/DD/YYYY 등)
- 주의사항: 시스템은 일반적인 날짜 형식을 자동으로 식별하며, 파싱의 정확성을 보장하기 위해 표준 날짜 형식 사용을 권장합니다
- 등록일 (
register_date)
- 설명: 사용자 등록일(그룹화 레이블로 사용), 형식은 2025-01-01 또는 2025/1/1 등
- 형식 요구사항: 이벤트일과 동일한 형식
- 중요: 이 필드는 반드시 제공되어야 하며, 이 필드가 누락된 사용자는 분석에서 제외됩니다; 본 도구는 등록만을 그룹화 기준으로 사용하며, 첫 주문 등을 사용하지 않습니다
데이터 형식 요구사항
- 파일 형식:CSV 및 Excel(.xlsx) 형식 지원
- 인코딩:UTF-8 인코딩 사용을 권장
- 데이터량:계산 효율을 보장하기 위해 1회 분석의 데이터량은 100만 레코드를 초과하지 않는 것을 권장
- 데이터 범위:서로 다른 등록 시기의 리텐션 성능을 관찰하기 위해 충분한 역사 데이터를 포함하는 것을 권장; 자연월 표의 오프셋 월은 최대 12개월, 자연일 표는 최근 30개 등록일을 표시
3.2 필드 매핑
데이터를 업로드한 후, 시스템은 데이터 파일의 열을 다음 필드에 매핑하도록 요청합니다:
- 사용자 ID 열 → 사용자의 고유 식별자를 포함하는 열 선택
- 이벤트일 열 → 사용자의 행동일(주문일 또는 행동일)을 포함하는 열 선택
- 등록일 열 → 사용자의 등록일을 포함하는 열 선택(그룹화 레이블)
3.3 데이터 필터링(선택 사항)
시스템은 이벤트일에 대한 필터링을 지원합니다:
- 날짜 범위 필터링:분석의 시간 범위를 지정할 수 있으며, 지정된 시간 범위 내의 데이터만 분석
- 사용 권장:데이터량이 큰 경우, 계산 속도를 향상시키기 위해 먼저 최근 1~2년의 데이터로 필터링하는 것을 권장
3.4 결과 해석
지표 설명
- 사용자 생명주기 유지 추세(자연월):등록월로 그룹화된 사용자가 각 오프셋 월에서 유지하는 인원수를 반영하며, 서로 다른 획득 시기의 장기 리텐션 차이를 관찰하기 용이합니다. 유지 인원수는 오프셋 월의 증가에 따라 전반적으로 감소하며, 리텐션 전환점을 식별할 수 있습니다
- 사용자 생명주기 유지 추세(자연일):등록일로 그룹화된 사용자가 각 오프셋 일(0~30일)에서 유지하는 인원수를 반영하며, 등록 후 첫 달의 일별 리텐션 세부사항을 관찰하기 용이합니다
- 평균 유지 추세:각 오프셋 월의 전반적인 평균 유지 수준을 반영하며, 곡선의 급격한 하락은 일반적으로 이탈이 심화되는 시점에 해당하며, 이를 바탕으로 운영 리듬을 최적화할 수 있습니다
리텐션 매트릭스 분석
- 동행 비교:같은 등록월/일의 사용자에 대해, 오프셋 월/일의 증가에 따라 유지 인원수는 전반적으로 감소합니다; 어떤 열이 비정상적인 변동을 보이는 경우, 사업 활동과 결합하여 조사할 수 있습니다
- 행 간 비교:서로 다른 등록 시기의 cohort 간에, 같은 오프셋 월/일의 유지 인원수를 비교하여 서로 다른 시기의 획득 품질 또는 운영 효과의 차이를 평가할 수 있습니다
추세 분석
- 상승 추세:평균 유지율이 상승 추세를 보이는 경우, 사용자 리텐션 효과가 개선되었으며 신규 획득 또는 리텐션 전략이 효과적임을 나타냅니다
- 하락 추세:평균 유지율이 하락 추세를 보이는 경우, 제품 경험, 서비스 품질 또는 운영 전략에 주의를 기울이고 적시에 조정해야 합니다
- 전환점 명확:어떤 오프셋 월 후에 유지율이 현저히 하락하는 경우, 해당 단계에서 사용자 접촉 또는 혜택 설계를 강화할 수 있습니다
3.5 주의사항
⚠️ 중요한 설명
- 그룹화 레이블은 등록만:
- 모든 cohort는 등록일/등록월로 구분되며, 본 도구는 첫 주문, 첫 결제 등을 그룹화 기준으로 사용하지 않습니다
- 권장:"등록일" 필드가 사용자의 등록 시간을 정확히 반영하여 올바른 그룹화가 가능하도록 하세요
- 등록 당일에 거래가 있는 사용자만 집계:
- 시스템은 등록 당일에 최소 1건의 이벤트 기록이 있는 사용자만 집계합니다; 등록 당일에 행동이 없는 사용자는 제외됩니다
- 사용자가 등록 당일에 행동이 없는 경우, 후속에 유지가 있어도 분석에 포함되지 않습니다
- 권장:이벤트일과 등록일의 기준이 일치하는지 확인(예: 모두 주문일 또는 모두 로그인일), 데이터에서 "등록 당일에 행동이 있었는지"를 구분할 수 있어야 합니다
- 이벤트일과 등록일:
- 이벤트일이 등록일보다 이른 기록은 제외됩니다
- 권장:업로드 전에 데이터의 완전성을 확인하고, 등록일, 이벤트일의 형식이 올바르며 논리적으로 타당한지 확인하세요
- 자연일 표와 자연월 표 범위:
- 자연일 표는 최근 30개 등록일, 0~30일의 오프셋 열만 표시; 자연월 표의 오프셋 월은 최대 12개월
- 더 장기적인 추세는 평균 유지 추세도와 사업 요구사항을 결합하여 종합적으로 판단할 수 있습니다
💡 사용 권장
- 데이터 품질 확인:
- 업로드 전에 데이터의 완전성을 확인하고, 사용자 ID, 등록일, 이벤트일 필드가 누락되지 않았는지 확인
- 날짜 형식이 올바른지 확인하여 날짜 파싱 오류를 피하세요
- 등록일과 이벤트일의 논리 관계가 올바른지 확인(이벤트일은 등록일보다 이르지 않아야 함)
- 분석 시간 범위:
- 서로 다른 등록 시기의 리텐션 성능을 관찰하기 위해 충분한 역사 데이터(최소 수개월)를 포함하는 것을 권장
- 데이터량이 큰 경우, 먼저 최근 1~2년으로 필터링한 후 필요에 따라 범위를 확대
- 결과 검증:
- 서로 다른 등록 시기의 리텐션 매트릭스를 비교하여 비정상적인 변동을 식별
- 사업 활동 시간과 결합하여 유지율 변화의 원인을 분석
- "등록 당일에 거래가 있는 사용자만 집계" 규칙이 사업 기대에 부합하는지 검증
- 전략 최적화:
- 어떤 오프셋 월 후에 유지율이 현저히 하락하는 경우, 해당 단계에서 사용자 접촉 또는 혜택 설계를 강화
- 서로 다른 등록 시기의 리텐션 차이가 큰 경우, 획득 채널과 운영 전략의 차이를 평가하고 신규 획득과 리텐션 투자를 최적화
3.6 자주 묻는 질문
Q1: 데이터 내 일부 사용자가 집계되지 않는 이유는?
A: 가능한 이유에는 다음이 포함됩니다:
- 사용자에게 등록일 필드가 누락됨
- 사용자가 등록 당일에 이벤트 기록이 없음(본 도구는 등록 당일에 거래가 있는 사용자만 집계)
- 사용자의 등록일 또는 이벤트일 형식이 파싱할 수 없음
- 이벤트일이 등록일보다 이른 기록은 제외됩니다
Q2: "등록 당일에 거래"가 필수인 이유는?
A: 명확한 cohort 시작점을 정의하고 "등록했지만 한 번도 행동을 하지 않은" 사용자를 혼입하지 않아 리텐션 기준의 일관성에 영향을 주지 않도록 하기 위함입니다. 등록 당일에 행동이 있는 사용자만 집계함으로써 모든 cohort가 같은 시작점에서 리텐션 성능을 비교할 수 있게 됩니다.
Q3: "유지"는 어떻게 정의됩니까?
A: 어떤 오프셋 일 또는 오프셋 월에서, 해당 사용자에게 최소 1건의 이벤트 기록이 있는 경우, 해당 일/월에 유지된 것으로 간주됩니다. 같은 사용자가 같은 오프셋 일/월에 여러 기록이 있어도 1회만 집계됩니다.
Q4: 자연일 표가 0~30일만 표시하는 이유는?
A: 등록 후 첫 달 리텐션에 초점을 맞추고 매트릭스 크기를 제어하여 보기 쉽게 하기 위함입니다. 더 장기적인 추세에 대해서는 자연월 표와 평균 유지 추세도를 참조하세요.
Q5: 본 도구는 "첫 주문"을 그룹화 기준으로 사용합니까?
A: 사용하지 않습니다. 본 도구는 등록일/등록월만을 그룹화 레이블로 사용하며, 첫 주문, 첫 구매 등의 행동에 의존하지 않습니다. 모든 cohort는 등록으로 구분됩니다.
Q6: 사용자 생명주기 리텐션을 향상시키는 방법은?
A: 다음 측면에서 시작하는 것을 권장합니다:
- 등록과 첫 경험을 최적화하여 등록 당일 행동 전환을 향상
- 리텐션 전환점에 해당하는 단계에서 사용자 접촉을 강화하고 혜택 또는 활동 정보를 푸시
- 고 리텐션 cohort의 특성을 분석하여 획득 채널과 운영 전략을 최적화
- 자연월, 자연일 매트릭스와 평균 유지 추세를 결합하여 중요한 이탈 지점을 식별하고 타겟팅된 전략을 수립
IV. 요약
사용자 생명주기 리텐션 분석 계산기는 등록으로 그룹화된 리텐션 매트릭스와 평균 유지 추세를 통해 사용자 생명주기 리텐션을 분석합니다. 본 도구는 등록만을 그룹화 레이블로 사용하며, 등록 당일에 거래가 있는 사용자만 집계하여 cohort 간 비교를 용이하게 합니다. 이 도구를 올바르게 사용하면 다음이 가능합니다:
- 서로 다른 등록 시기의 사용자의 리텐션 차이를 신속하게 식별하고 획득과 리텐션 효과를 평가
- 오프셋 월/일에 따른 유지율의 변화 패턴을 발견하고 이탈 전환점을 식별
- 서로 다른 시기의 cohort의 리텐션 성능을 비교하고 신규 획득과 리텐션 전략을 적시에 조정
- 사용자 생명주기 운영 전략 수립에 데이터 지원을 제공
질문이 있거나 기술 지원이 필요한 경우 시스템 관리자에게 문의하세요.