첫째, 데이터웨어 하우스는 기업의 전통적인 데이터 관리 솔루션입니다. 규모가 큰 기업은 데이터 웨어하우스를 구축하여 특정 "고립된 데이터" 문제를 해결하여 엔터프라이즈 데이터를 보다 합리적으로 활용하고 데이터 웨어하우스를 통해 여러 시스템을 상호 연결할 수 있습니다.
그러나 대규모 데이터 시대에는 엔터프라이즈 데이터 웨어하우스가 규모, 데이터 유형, 응답 속도, 배포 아키텍처 등에 큰 변화를 겪게 되며, 주로 다음과 같은 측면에 반영됩니다.
첫째, 데이터 웨어하우스는 클라우드 컴퓨팅을 기반으로 합니다. 클라우드 컴퓨팅의 출현은 전체 IT 업계의 기술 및 스토리지 자원 사용에 대한 인식을 어느 정도 변화시켰습니다. 클라우드 컴퓨팅의 유연한 서비스 모델과 저렴한 사용 전략으로 인해 더 많은 기업들이 클라우드 컴퓨팅 서비스를 기꺼이 채택할 수 있게 되었으며, 클라우드 컴퓨팅은 기업 업그레이드 정보화의 문턱을 낮추는 원스톱 솔루션을 제공할 수 있게 되었습니다. 클라우드 컴퓨팅 플랫폼에 데이터 웨어하우스를 구축하는 것은 현재 클라우드 컴퓨팅에서 해결할 수 있는 중요한 문제 중 하나입니다.
둘째, 데이터 웨어하우스의 스토리지 구조가 Sql 에서 NoSql 로 변환됩니다. 많은 기업의 데이터 웨어하우스는 여전히 구조화된 데이터를 기반으로 하지만, 사물의 인터넷이 발전함에 따라 향후 데이터 웨어하우스에 대량의 구조화되지 않은 데이터와 반정형 데이터가 나타날 수밖에 없습니다. 이 경우 데이터 웨어하우스는 이에 따라 조정되어야 하며, 데이터베이스 유형은 Sql 기반 데이터베이스에서 NoSql 기반 데이터베이스로 전환되고, 향후 Sql 데이터베이스와 NoSql 데이터베이스는 병렬로 전환됩니다.
셋째, 지능형 데이터웨어 하우스 관리. 클라우드 컴퓨팅 플랫폼의 지원을 받아 향후 엔터프라이즈 데이터 웨어하우스 관리는 지능화 방향으로 발전해야 하며, PaaS 를 기반으로 지능형 관리 시나리오를 구축하는 것이 더 쉬워져 데이터 웨어하우스의 가치를 높일 수 있습니다.
마지막으로, 이 일련의 변화는 자연히 인재 구조의 업그레이드와 불가분의 관계에 있다.