5 비용이 발생할 수 있는 데이터 세분성 실수

빅 데이터 시대에는 더 이상 충분한 데이터에 액세스하지 못하고 있습니다. 지난 기사에서,나는 중요한 비즈니스 자산 인 대체 데이터의 가치에 초점을 맞추었다. 그러나 대체 데이터의 이점이 있더라도 잘못된 데이터 세분성은 데이터 기반 관리의 투자 수익을 저해 할 수 있습니다.

“우리는 데이터에 너무 집착하여 그것을 해석하는 방법을 잊어 버립니다.” -다나 보이드,마이크로 소프트 리서치의 수석 연구원

그래서 얼마나 밀접하게 당신은 당신의 데이터를보고해야합니까? 잘못된 데이터 세분성은 당신이 생각하는 것보다 더 많은 비용이들 수 있기 때문입니다.

간단히 말해 데이터 세분성은 데이터의 세부 수준을 나타냅니다. 데이터가 세분화될수록 특정 데이터 요소에 포함된 정보가 더 많아집니다. 한 국가의 모든 매장에서 연간 거래를 측정하는 것은 고객이 언제 어디서 구매하는지에 대해 거의 알지 못하기 때문에 세분성이 낮습니다. 반면에 개별 상점의 거래를 두 번째로 측정하는 것은 엄청나게 높은 세분성을 가질 것입니다.

이상적인 데이터 세분성은 수행 중인 분석 종류에 따라 다릅니다. 수십 년 동안 소비자 행동의 패턴을 찾고 있다면,낮은 세분성은 아마도 괜찮을 것입니다. 그러나 매장 보충을 자동화하려면 훨씬 더 세분화 된 데이터가 필요합니다.