기본 단계: Linux, Docker, KVM, MySQL, Oracle, MongoDB, redis.
Hadoop MapReduce HDFS 사: Hadoop: Hadoop 개념, 버전, 역사, HDFS 작동 방식, 사 소개, 구성 요소 소개
대용량 데이터 저장 단계: hbase, hive, sqoop.
대형 데이터 스키마 설계 단계: Flume distributed, Zookeeper, Kafka.
빅 데이터 실시간 계산 단계: Mahout, Spark, storm.
빅 데이터 수집 단계: 파이썬, 셀라.
빅 데이터 비즈니스 실무 단계: 엔터프라이즈 빅 데이터 처리 비즈니스 시나리오의 실제 운영, 요구 사항 분석, 솔루션 구현, 통합 기술의 실제 적용
빅 데이터 분석의 몇 가지 측면:
1, 시각화 분석: 시각화 분석은 큰 데이터의 특징을 시각적으로 나타낼 수 있으며, 독자가 쉽게 받아들일 수 있습니다. 마치 그림을 보고 말하는 것처럼 간단합니다.
2. 데이터 마이닝 알고리즘: 빅 데이터 분석의 이론적 핵심은 데이터 마이닝 알고리즘입니다.
3. 예측 분석: 큰 데이터에서 특징을 발굴하고, 과학적으로 모델을 만들고, 미래 데이터를 예측한다.
4. 의미엔진: 충분한 인공지능을 설계하여 데이터에서 능동적으로 정보를 추출해야 한다.
5. 데이터 품질 및 데이터 관리: 분석 결과의 신뢰성을 보장합니다.