현재 위치 - 회사기업대전 - 기업 정보 공시 - 사례 연구 및 비교 분석의 일반적인 오류

사례 연구 및 비교 분석의 일반적인 오류

비교 분석 (비교, 링비 등) 은 데이터 분석에서 가장 간단하고 가장 일반적으로 사용되는 분석 방법입니다. 데이터 분석가뿐만 아니라 거의 모든 사람이 사용할 수 있지만 모든 사람이 제대로 사용할 수 있는 것은 아닙니다. 문말에는 비교 분석 오류에 대한 사례 분석이 첨부되어 있다.

간단하고 일반적인 네 가지 가장 일반적인 오류의 비교 분석:

오류 1: 비교 개체가 일치하지 않습니다.

미국 역사상 해군 징병 선전이 있었다. 스페인과의 전쟁에서 미 해군의 사망률 () 는 9‰ 이고, 같은 기간 뉴욕시 주민의 사망률 (16) 은16 이었다. 그래서 군대에 입대하는 것이 더 안전하다!

이 사건의 문제는 비교대상이 다르다는 점이다. 군대에 입대하는 건장한 청남들과 뉴욕 주민들이 자연사망, 노약자, 교통사고, 형사범죄 등을 더 많이 포함하고 있다.

같은 문제도 뉴스에 자주 등장한다. 예를 들면' 배달형 월급은 사무직 근로자보다 훨씬 높다' 는 것이다. 배달형 업종에서 소득이 가장 높은 사람을 일반 사무직 근로자와 비교해 자연스럽게 이런 결론을 내린다.

오류 2: 시간 범위가 일치하지 않습니다.

예를 들어 HR 지원자의 이력서에는 이런 자기마케팅이 있다. 이전 회사의 영업 직원 이직률은 12% 였지만 HR 이 도착한 후 회사의 영업 직원 이직률은 4% 로 떨어졌습니다.

이때 전문 데이터 분석가로서 한 가지 더 물어봐야 합니다. 이 두 지표의 계산 시간 범위가 일치합니까? 모두 월/분기/년으로 계산됩니까?

오류 3: 정의와 계산 논리가 다릅니다.

비즈니스 지표 뒤의 수학 공식에는 많은 변화가 있다. 통일이 없다면 이런 비교는 의미가 없다.

환매 금액 등 복잡한 척도는 업무 수요가 다르기 때문에 환매 행동을 정의할 때 오류가 발생하기 쉽다.

회원 등록이 끝나면 카운터로 돌아가 소비하면 다시 구매해도 된다.

이미 소비한 것, 다시 매장에 가서 소비해야만 환매로 간주된다.

또 다른 예로, 한 달에 첫 소비와 두 번째 소비를 마친 회원은 그 달의 환매 지표를 계산하는 데도 어려움이 있을 수 있다. 소비 행위에 따라 첫 번째 소비가 첫 번째 구매액에 부과되고 두 번째 소비주문이 환매에 포함된다면 이 회원이 환매 회원에게 부과될 수 있을까?

따라서 지표의 대비를 볼 때마다 먼저 뒤의 계산 공식이 같은 맥락에 있는지 기억해야 한다.

오류 4: 일치하지 않는 데이터 소스

데이터 소스 오류 문제가 숨겨져 있습니다. 한 가지 일반적인 시나리오는 데이터 센터가 아직 구축되지 않은 기업에서 사업부가 데이터를 저장하기 위해 서로 다른 정보 시스템을 보유하고 있다는 것입니다. 예를 들어, 주문 데이터는 ERP 시스템, POS 시스템, CRM 시스템에 존재할 수 있으며, 데이터가 시스템 간에 흐르면 오류가 발생할 수 있습니다. 따라서 동일한 데이터 계산 지표라도 CRM 및 ERP 시스템에서 계산할 때 오류가 발생할 수 있습니다.

또한 비즈니스 요구에 따라 시스템 유지 관리 및 업그레이드도 일반적입니다. 업그레이드 중 데이터 동기화는 종종 변동합니다. 이때 지표를 계산하면 다른 결과를 얻을 수 있다.

따라서 서로 다른 업무 부서 간의 지표를 비교할 때 동일한 배경에 두는 것이 의미가 있습니다.

실제 사례 데이터는 전년 대비 분석에서 흔히 볼 수 있는 전년 대비 오차이다.

사례 1: 일일 판매 보고서 분석, 202 1 1 4 의 소매 판매가 2020 1 4 보다 30% 감소한 경우 2021/

사실 구체적인 업종을 감안하면 계절적/주기적인 특징이 비교적 강한 소매업체라면 이런 비교는 의미가 없다. 202 1 1.4 는 근무일이고 2020 1.4 는 토요일이기 때문이다

즉, 소매업체의 경우 이 두 날짜는 서로 다른 비즈니스 시나리오에 있으므로 직접 비교할 수 없습니다.

같은 이치 (주말인지 여부) 는 발렌타인데이와 발렌타인데이, 크리스마스, 크리스마스와 같은 휴일로 확대될 수 있다.

또한, 올해 1 1 월 연휴 7 일, 작년과 같이 7 일간 방학할지 여부 등 암묵적인 방학주기가 있다. 수명 주기: 특히 티몰 등 전자상업계는 매년 쌍십일 수명 주기가 다르다. 예를 들어, 20 19 에 비해 2020 년 공식 매출의 최고치는 10 월의 1 1 -3 이므로 데이터 지표의 예상을 조정해야 합니다.

사례 2: 전염병을 고려하지 않고 월보 분석에서 202 1 년 2 월 매출이 2020 년 2 월보다 5% 하락했다고 가정하면 202 1 년 2 월 매출에 문제가 있습니까?

이때 우리는 달력을 이용하여 이런 분석이 합리적인지 아닌지를 판단해야 한다.

1, 판매 일수는 달력을 보면 찾을 수 있습니다.

2020 년, 2 월에는 28 일이 있습니다.

202 1 윤년이고 2 월은 29 일입니다.

그래서, 차이 1 일의 맥락에서 판매 격차가 합리적입니까?

2. 명절인가요? 또한 달력을 보면 다음과 같은 것을 알 수 있습니다.

2020 년 춘윈 65438+ 10 월 25 일.

202 1 설날은 2 월 12 입니다.

소매업체에게 설 기간 동안 판매 상황이 좀 좋아졌나요? 그렇다면 휴가가 있는 달은 휴가가 없는 2 월보다 많이 팔리겠죠?

3, 달력 주말 수 다시 관찰:

2020 년 2 월에는 9 개의 주말이 있습니다.

202 1 2 월에는 주말이 8 개밖에 없습니다.

사례 1 에서 설명한 바와 같이 소매업계는 한 주말 차이가 나서 판매 수치가 몇 퍼센트일 수 있다.

따라서 위의 몇 가지를 근거로 2 월의 판매 실적을 판단하는 것이 더 합리적일 수 있다.

copyright 2024회사기업대전