데이터 웨어하우스 정의
데이터 웨어하우스의 아버지인 빌 은문이 199 1 에서 출판한' 데이터 웨어하우스 구축' 이라는 책에서 제기한 정의가 널리 받아들여졌다. 데이터 웨어하우스는 주제 지향적이고 통합적이며 역사적 변화를 반영하는 비교적 안정적인 (비휘발성) 이다.
우리는 두 가지 수준에서 데이터 웨어하우스의 개념을 이해할 수 있다. 첫째, 데이터 웨어하우스는 기업의 기존 운영 데이터베이스와는 달리 의사 결정 및 분석 지향 데이터 처리를 지원하는 데 사용됩니다. 둘째, 데이터 웨어하우스는 여러 이기종 데이터 소스의 효과적인 통합입니다. 통합 후 주제별로 재구성되고 과거 데이터가 포함되며 데이터 웨어하우스에 저장된 데이터는 일반적으로 수정되지 않습니다.
둘째, 데이터웨어 하우스의 특성
1, 테마 지향. 데이터베이스를 운영하는 데이터 조직은 트랜잭션 작업을 대상으로 하며, 각 비즈니스 시스템은 분리되어 있으며, 데이터 웨어하우스의 데이터는 특정 주제 도메인에 따라 구성됩니다. 주제는 사용자가 데이터 웨어하우스를 사용하여 의사 결정을 내릴 때 관심을 갖는 핵심 측면을 나타내는 추상적인 개념입니다. 한 주제는 일반적으로 여러 운영 정보 시스템과 관련이 있습니다.
2. 종합적입니다. 트랜잭션 지향 운영 데이터베이스는 일반적으로 특정 애플리케이션과 관련이 있으며, 이러한 데이터베이스는 서로 독립적이며 일반적으로 이질적입니다. 데이터 웨어하우스의 데이터는 원래의 분산된 데이터베이스 데이터를 추출하고 정리하여 체계적으로 처리, 요약 및 정리한 것입니다. 데이터 웨어하우스의 정보가 일관되고 기업 전체에 대한 글로벌 정보가 되도록 소스 데이터의 불일치를 제거해야 합니다.
상대적으로 안정적입니다. 실행 데이터베이스의 데이터는 일반적으로 실시간으로 업데이트되며 필요에 따라 적시에 변경됩니다. 데이터 웨어하우스의 데이터는 주로 엔터프라이즈 의사 결정 분석에 사용되며 관련된 데이터 작업은 주로 데이터 쿼리입니다. 데이터가 데이터 웨어하우스에 들어가면 일반적으로 데이터 웨어하우스에 많은 쿼리 작업이 있지만 수정 및 삭제 작업은 거의 없으며 일반적으로 정기적으로 로드 및 새로 고침만 하면 됩니다.
4. 역사적 변천을 반영하다. 운영 데이터베이스는 일정 기간 동안의 현재 데이터에 초점을 맞추고 있으며, 데이터 웨어하우스의 데이터에는 일반적으로 과거 시점 (예: 데이터 웨어하우스 적용 시간) 에서 현재 단계까지의 정보를 체계적으로 기록하는 기록 정보가 포함되어 있습니다. 이 정보를 통해 기업의 발전 과정과 미래 추세를 정량적으로 분석하고 예측할 수 있다.
엔터프라이즈 데이터 웨어하우스의 건설은 기존 엔터프라이즈 비즈니스 시스템과 대량의 비즈니스 데이터의 축적을 기반으로 합니다. 데이터 웨어하우스는 정적 개념이 아닙니다. 정보를 필요로 하는 사용자에게 적시에 정보를 제공하여 업무 운영을 개선하기 위한 의사 결정을 내려야 정보가 작용하고 작용할 수 있습니다. 정보를 정리, 요약 및 재구성하여 적절한 관리 의사 결정권자에게 적시에 제공하는 것이 데이터 웨어하우스의 근본적인 과제입니다. 그래서 업계의 관점에서 볼 때, 데이터 웨어하우스 건설은 프로젝트이자 과정이다.