최종 프로젝트

[0310 TIL] 최종 프로젝트 3일차 (EDA-blinkit_products)

sjy0074 2025. 3. 11. 09:24

 

현재 환율 / 3년 내 크게 변화 없음 (16~17루피)

 

전일 추가 eda 아이디어 체크하기

 

카테고리별 제품명과 제품 수 확인

 

  • [x] 금액단위확인

→루피일듯.. 한국 환율로 바꿔봤을 때도 납득 가능한 정도의 금액대

🟢실판매가(price) 가장 높은 제품과 금액 / 가장 낮은 제품과 금액 확인

 

 

제품별 가격 다른것(개수 차이? 브랜드 차이?)

→ 제품별로 브랜드 중복 X, 가격 다 다름 egg예시로 보면 989루피(1만6천원)부터 58루피(975원)까지 다양한 가격대 분포(갯수 정보 X)

결론 : 갯수 차이가 날 것으로 예상 그러나 정보 없음 / 브랜드 차이 또한 있음 동일 제품에 브랜드 중복 없음

 

전체 컬럼 히스토그램 분포 확인

→ 가격은 12~996루피 사이 분포

 

→ 할인율(margin_percentage)는 5퍼센트 단위로 나뉘어있으며, 15%~40% 사이

!! 카테고리별로 할인율은 동일하다(제품별/브랜드별 차이 X)

 

→ 유통기한은 3일~365일 사이 분포( 고루 분포 아니며 3일, 7일, 90일, 100일, 365일 이렇게 구성)

 

 

할인금액 vs 할인율 차이

💬 할인 금액(mrp 최대소매가 - 실판매가)

  • 절대적인 할인 금액이 중요한 경우
    • 예: 원가 10,000원짜리 제품이 5,000원 할인(할인율 50%)
    • 예: 원가 1,000,000원짜리 제품이 100,000원 할인(할인율 10%)
    • 100,000원 할인된 고가 제품이 더 중요한 경우
  • 예를 들어, 고가 제품(예: 가전, 명품)의 경우 할인 금액이 크면 소비자에게 중요한 정보
  • 단순히 가장 큰 할인 금액을 알고 싶을 때
    • 특정 예산 내에서 얼마나 절약할 수 있는지 확인하는 용도
    💬 할인율((price/mrp)*100) → 구할 필요 없어짐, margin_percentage 컬럼 존재!
  • 소비자가 체감하는 할인 정도를 비교할 때
    • 1,000,000원짜리 제품이 100,000원 할인(할인율 10%) vs. 10,000원짜리 제품이 5,000원 할인(할인율 50%)
    • 가격 대비 할인율이 크면, 소비자가 더 많은 가치를 얻는 느낌을 받음
  • 소비자가 가격 대비 가장 저렴하게 구매할 수 있는 상품을 찾고 싶을 때
    • 할인율이 높은 제품을 찾는 것이 더 실용적

➡️우리 데이터 속 products들은 대부분 가격대가 12루피~995루피(한화 200원~1만6천원 정도)의 적당한 가격이라 할인 금액순으로 보는 것

❗️margin_percentage 라는 컬럼 존재

(mrp - price) / mrp * 100 (반올림 처리한 것으로 보임)

= 구하려던 할인율과 일치

직접 계산한 결과(discount_percentage) 컬럼 반올림한게 margin_percentage 컬럼….임

 

 

할인율 가장 높은 것 : 40프로 할인율 가장 낮은 것 : 15프로 ! 결론 : mrp 보다 최소 15프로 이상의 할인된 금액으로 배달 서비스를 제공 -> 그렇다면 후기에서 금액적인 만족도가 높은가? ex)싸게 구매해서 좋아요 등 (확인 필요!) 원래 소매로 팔 때에 보통 소매 가게에서는 어떻게 파는지 조사 필요(원래도 mrp보다 조금은 싸게 파는게 맞는지, 그것보다 비싸게 파는 것도 일반적인지, 제품에 따라 다른지) -> 그렇다면 블링킷은 어떤 걸로 순익을 남기나? ex)서비스 이용료?(무료?) / 도매가로 물건을 공수? / 브랜드에서도매? but 데이터 상으로는 같은 브랜드 같은 제품 겹치지 X/ 배달 기사 수수료? 등 요인 파악 필요, 추가적으로 찾아봐야 할 듯

 

  • 유통기한 + 최소 재고 수준 + 최대 재고 수준

→어떻게 엮어봐야 할 지 고민하기(지금 재고현황 정보 X)

제품명 별 오더개수 확인해서 유통기한과 재고수준 기준 정해야하나?

 

 

  • [x] (추가아이디어!) 음료수 등 가격(납득 안되는 너무 높거나 낮은 가격) 이상치 확인

→ 이상치 없음.. 너무 깔끔한 데이터인데…..만든걸까?

IQR / 박스플럿 두가지 사용해서 확인했고, none