맥킨지 글로벌 연구원은 기존 데이터베이스 소프트웨어 도구의 획득, 저장, 관리 및 분석 능력을 훨씬 뛰어넘는 데이터 세트로, 데이터 규모, 데이터 흐름 속도, 데이터 유형 다양성, 가치 밀도가 낮은 4 가지 특징을 가지고 있다고 정의했습니다.
빅 데이터 기술의 전략적 중요성은 방대한 데이터 정보를 파악하는 것이 아니라 이러한 의미 있는 데이터를 전문화하는 것입니다. 즉, 큰 데이터를 하나의 산업에 비유한다면, 이 업계의 수익성의 관건은 데이터의' 처리 능력' 을 높이고' 처리' 를 통해 데이터의' 부가 가치' 를 실현하는 것이다.
기술적으로 큰 데이터와 클라우드 컴퓨팅의 관계는 동전의 앞면과 뒷면처럼 밀접한 관계가 있다. 큰 데이터는 단일 컴퓨터에서 처리할 수 없으며 분산 아키텍처를 사용해야 합니다. 대량 데이터의 분산 데이터 마이닝이 특징입니다. 그러나 클라우드 컴퓨팅의 분산 처리, 분산 데이터베이스, 클라우드 스토리지 및 가상화 기술에 의존해야 합니다.
클라우드 시대가 도래함에 따라 빅데이터는 점점 더 많은 관심을 받고 있다. 분석가 팀은 큰 데이터가 일반적으로 한 회사에서 만든 대량의 구조화되지 않은 데이터와 반정형 데이터를 설명하는 데 사용되며 분석을 위해 관계형 데이터베이스에 다운로드하는 데 너무 많은 시간과 비용이 소요된다고 생각합니다. 대용량 데이터 세트의 실시간 분석에는 MapReduce 와 같은 프레임워크가 수십 대, 수백 대, 심지어 수천 대의 컴퓨터에 작업을 할당해야 하기 때문에 대용량 데이터 분석은 클라우드 컴퓨팅과 연결되는 경우가 많습니다.
대용량 데이터는 허용 시간 내에 대량의 데이터를 효율적으로 처리하기 위해 특별한 기술이 필요합니다. 대용량 데이터에 적합한 기술은 MPP 데이터베이스, 데이터 마이닝, 분산 파일 시스템, 분산 데이터베이스, 클라우드 컴퓨팅 플랫폼, 인터넷 및 확장 가능한 스토리지 시스템입니다.
이것은 큰 데이터의 정의이다. 사람마다 주는 것이 다르다는 것을 알 수 있지만 결과는 똑같다. 빅데이터의 전망이 좋으니 임금은 확실히 문제가 되지 않는다. 먼저 스스로 알아봐 주세요. Itjob 공식 홈페이지에는 관련 자료가 있으니 게시해서 물어볼 수도 있습니다.