1. 대량의 데이터 (예: TB, PB, 심지어 EB) 가 있어 분석 처리가 필요합니다.
2. 신속한 대응을 요구하고, 시장 변화가 빠르며, 변화에 대한 시기적절하고 빠른 대응을 요구한다. 데이터에 대한 분석도 빨라야 하고 성능에 대한 요구도 높아야 하기 때문에 데이터 양은 속도에 있어서 다소 "큰" 것 같다.
3. 데이터 다양성: 서로 다른 데이터 소스의 구조화되지 않은 데이터가 점점 많아지고 있으며, 청소, 정렬, 필터링을 거쳐 구조화된 데이터가 되어야 합니다.
4. 가치 밀도가 낮아 데이터 수집이 적시에 이루어지지 않고, 데이터 샘플이 불완전하며, 데이터가 불연속적인 등의 이유로 데이터가 왜곡될 수 있습니다. 그러나 데이터의 양이 일정 규모에 도달하면 더 많은 데이터를 통해 보다 사실적이고 포괄적인 피드백을 얻을 수 있습니다.
많은 업계에서는 통신 산업, 인터넷 산업 등 많은 양의 데이터를 쉽게 생산할 수 있는 업종과 같은 큰 데이터 수요를 가지고 있습니다. 의약품, 교육, 광업, 전력 등 많은 전통 업종은 모두 큰 데이터 수요를 가지고 있다.
비즈니스가 지속적으로 확장되고 기록 데이터가 증가함에 따라 데이터의 양이 지속적으로 증가하고 있습니다.
큰 데이터를 분석해야 하는 경우 Hadoop 과 같은 오픈 소스 대형 데이터 프로젝트 또는 영홍 Z-Suite 와 같은 상업용 대형 데이터 BI 도구를 사용할 수 있습니다.
인터넷과 이동성이 급속히 발전함에 따라 각 분야에서 빅데이터가 점점 더 많이 사용되고 있습니다. 개인 빅 데이터 애플리케이션도 점점 더 직면하고 있습니다.