IT 업계가 저렴한 스토리지의 장점을 지속적으로 주입함에 따라 기업은 이전보다 더 많은 데이터를 보유하고 있습니다. 그렇다면 대규모 데이터 인프라를 평가할 때 어떤 요소를 검토해야 합니까? 이 문서에서는 용량, 지연 시간, 도달 가능성, 보안 및 비용과 같은 중요한 요소에 대한 평가를 다룹니다.
빅 데이터 개발의 원동력
이전보다 더 많은 데이터를 저장할 수 있을 뿐만 아니라, 우리가 직면한 데이터 유형도 더욱 복잡해졌다. 이러한 데이터 소스에는 인터넷 거래, 소셜 네트워킹 활동, 자동화 센서, 모바일 장치 및 과학 연구 장비가 포함됩니다. 정적 데이터 증가 외에도 트랜잭션 트랜잭션은 고정 데이터 "증가율" 을 유지합니다. 예를 들어, 사회 정보의 급속한 증가로 인한 대량의 거래와 기록. 그러나 기존의 확장되는 데이터 세트는 기업에 중요한 정보를 검색할 수 있다는 보장은 없습니다.
오늘의 정보는 중요한 생산 요소이다.
데이터는 자본, 노동력, 원자재와 마찬가지로 생산 자료가 되었으며, 특정 업계의 특정 응용에 국한되지 않습니다. 기업의 모든 부서는 점점 더 많은 데이터 세트를 통합하는 것을 목표로 비용 절감, 품질 향상, 생산성 향상 및 신제품 개발을 위해 노력하고 있습니다. 예를 들어, 현장 제품의 직접 데이터 분석은 설계를 개선하는 데 도움이 됩니다. 예를 들어, 기업은 사용자 습관에 대한 심층 분석을 통해 전체 시장의 성장 특성을 비교함으로써 경쟁 분석 능력을 크게 향상시킬 수 있습니다.
스토리지 개발의 필요성
대용량 데이터는 데이터가 자체 인프라를 초과하여 스토리지, 네트워크 및 컴퓨팅 시스템의 발전을 촉진하여 이러한 특수한 과제를 해결하는 것을 의미합니다. 소프트웨어 어플리케이션의 수요는 결국 하드웨어 기능의 발전을 촉진하는데, 이 경우 빅 데이터 분석 처리가 데이터 스토리지 인프라의 발전에 영향을 미치고 있습니다. 이는 스토리지 및 IT 인프라스트럭처 기업에게 영업 기회입니다. 정형 및 비정형 데이터 세트가 증가함에 따라 이러한 데이터의 분석 방법이 더욱 다양해지고 있으며, 현재의 스토리지 시스템 설계는 대규모 데이터 인프라의 요구를 충족하기가 어렵습니다. 스토리지 공급업체는 이러한 요구 사항을 충족하기 위해 블록 기반 및 파일 기반 시스템을 도입하기 시작했습니다. 대용량 데이터 스토리지 인프라스트럭처의 몇 가지 특징은 다음과 같습니다. 대용량 데이터의 당면 과제입니다.
용량. "대형" 은 많은 경우 페타바이트급 데이터로 이해될 수 있으므로 대규모 데이터 인프라는 확장 가능해야 합니다. 그러나 쉽게 확장할 수 있어야 하며, 모듈식 또는 어레이 방식으로 사용자에게 직접 용량을 추가하거나 최소한 시스템 가동 중지 시간을 방지할 수 있어야 합니다. 확장형 스토리지는 이러한 요구를 충족할 수 있기 때문에 매우 인기가 있습니다. 스케일 아웃 클러스터는 기존 시스템에서 발생할 수 있는 굴뚝 스토리지 문제를 방지하기 위해 원활하게 확장할 수 있는 처리 능력과 접속성을 갖춘 스토리지 노드로 구성됩니다.
큰 데이터는 또한 대량의 파일을 의미한다. 메타데이터 파일 시스템의 누적을 관리하면 확장성이 떨어지고 성능에 영향을 줄 수 있습니다. 이 경우 기존 NAS 시스템에 문제가 발생할 수 있습니다. 반면 객체 기반 스토리지 아키텍처는 기존 파일 시스템에서 발생하는 로드 문제 없이 대용량 데이터 스토리지 시스템의 파일 수를 10 억 레벨까지 확장할 수 있도록 지원합니다. 개체 기반 스토리지는 여러 지역으로 확장할 수 있으며 대규모 인프라는 여러 다른 위치로 확장할 수 있습니다.
지연. 실시간 구성 요소는 대용량 데이터 인프라, 특히 웹 상호 작용 또는 금융 처리 거래에도 포함될 수 있습니다. 지연으로 인해 오래된 데이터가 생성될 수 있으므로 스토리지 시스템은 성능을 유지하면서 이러한 문제를 처리할 수 있어야 합니다. 이 영역에서 스케일 아웃 인프라는 스토리지 노드 클러스터를 적용하여 처리 능력과 접속 기능도 향상시킬 수 있습니다. 객체 기반 스토리지 시스템에는 동시 데이터 스트림이 있을 수 있으므로 처리량이 크게 향상됩니다.