현재 위치 - 회사기업대전 - 기업 정보 조회 - 데이터 웨어하우스는 무엇을 합니까?

데이터 웨어하우스는 무엇을 합니까?

현재, 데이터 웨어하우스라는 단어는 아직 통일된 정의가 없다. 유명한 데이터 웨어하우스 전문가인 W.H.Inmon 은 그의 저서' 데이터 웨어하우스 구축' 에서 데이터 웨어하우스가 주제 지향적이고, 통합되며, 비교적 안정적이며, 역사적 변화 (시간) 를 반영한다는 설명을 했다. 우리는 두 가지 수준에서 데이터 웨어하우스의 개념을 이해할 수 있다. 첫째, 데이터 웨어하우스는 기업의 기존 운영 데이터베이스와는 달리 의사 결정 및 분석 지향 데이터 처리를 지원하는 데 사용됩니다. 둘째, 데이터 웨어하우스는 여러 이기종 데이터 소스의 효과적인 통합입니다. 통합 후 주제별로 재구성되고 과거 데이터가 포함되며 데이터 웨어하우스에 저장된 데이터는 일반적으로 수정되지 않습니다.

데이터 웨어하우스의 개념에 따라 데이터 웨어하우스에는 다음 네 가지 특성이 있습니다.

1, 테마 지향. 데이터베이스를 운영하는 데이터 조직은 트랜잭션 작업을 대상으로 하며, 각 비즈니스 시스템은 분리되어 있으며, 데이터 웨어하우스의 데이터는 특정 주제 도메인에 따라 구성됩니다. 주제는 사용자가 데이터 웨어하우스를 사용하여 의사 결정을 내릴 때 관심을 갖는 핵심 측면을 나타내는 추상적인 개념입니다. 한 주제는 일반적으로 여러 운영 정보 시스템과 관련이 있습니다.

2. 종합적입니다. 트랜잭션 지향 운영 데이터베이스는 일반적으로 특정 애플리케이션과 관련이 있으며, 이러한 데이터베이스는 서로 독립적이며 일반적으로 이질적입니다. 데이터 웨어하우스의 데이터는 원래의 분산된 데이터베이스 데이터를 추출하고 정리하여 체계적으로 처리, 요약 및 정리한 것입니다. 데이터 웨어하우스의 정보가 일관되고 기업 전체에 대한 글로벌 정보가 되도록 소스 데이터의 불일치를 제거해야 합니다.

상대적으로 안정적입니다. 실행 데이터베이스의 데이터는 일반적으로 실시간으로 업데이트되며 필요에 따라 적시에 변경됩니다. 데이터 웨어하우스의 데이터는 주로 엔터프라이즈 의사 결정 분석에 사용되며 관련된 데이터 작업은 주로 데이터 쿼리입니다. 데이터가 데이터 웨어하우스에 들어가면 일반적으로 데이터 웨어하우스에 많은 쿼리 작업이 있지만 수정 및 삭제 작업은 거의 없으며 일반적으로 정기적으로 로드 및 새로 고침만 하면 됩니다.

4. 역사적 변천을 반영하다. 운영 데이터베이스는 일정 기간 동안의 현재 데이터에 초점을 맞추고 있으며, 데이터 웨어하우스의 데이터에는 일반적으로 과거 시점 (예: 데이터 웨어하우스 적용 시간) 에서 현재 단계까지의 정보를 체계적으로 기록하는 기록 정보가 포함되어 있습니다. 이 정보를 통해 기업의 발전 과정과 미래 추세를 정량적으로 분석하고 예측할 수 있다.

엔터프라이즈 데이터 웨어하우스의 건설은 기존 엔터프라이즈 비즈니스 시스템과 대량의 비즈니스 데이터의 축적을 기반으로 합니다. 데이터 웨어하우스는 정적 개념이 아닙니다. 정보를 필요로 하는 사용자에게 적시에 정보를 제공하여 업무 운영을 개선하기 위한 의사 결정을 내려야 정보가 작용하고 작용할 수 있습니다. 정보를 정리, 요약 및 재구성하여 적절한 관리 의사 결정권자에게 적시에 제공하는 것이 데이터 웨어하우스의 근본적인 과제입니다. 따라서 업계의 관점에서 볼 때 데이터 웨어하우스 구축은 프로젝트, 프로세스입니다.

전체 데이터 웨어하우스 시스템은 다음 그림과 같이 4 계층 아키텍처입니다.

데이터 웨어하우스 시스템 아키텍처

데이터 소스: 데이터 웨어하우스 시스템의 기초이자 전체 시스템의 데이터 소스입니다. 일반적으로 내부 및 외부 정보가 포함됩니다. 내부 정보에는 RDBMS 에 저장된 다양한 업무 처리 데이터와 다양한 문서 데이터가 포함됩니다. 외부 정보에는 각종 법규, 시장 정보, 경쟁사 정보 등이 포함됩니다.

데이터 저장 및 관리: 전체 데이터 웨어하우스 시스템의 핵심입니다. 데이터 웨어하우스의 진정한 핵심은 데이터 저장 및 관리입니다. 데이터 웨어하우스의 구성 및 관리 방식에 따라 기존 데이터베이스와 다르며 외부 데이터의 표현도 결정됩니다. 어떤 제품과 기술을 사용하여 데이터 웨어하우스의 핵심을 구축하는지 결정하기 위해서는 데이터 웨어하우스의 기술적 특징을 분석해야 합니다. 기존 비즈니스 시스템의 데이터를 추출, 청소, 효과적으로 통합하고 주제별로 구성합니다. 데이터 범위에 따라 데이터 웨어하우스는 엔터프라이즈 데이터 웨어하우스와 부서별 데이터 웨어하우스 (일반적으로 데이터 마트라고 함) 로 나눌 수 있습니다.

OLAP 서버: 분석에 필요한 데이터를 효과적으로 통합하고 다차원 모델에 따라 구성하여 다각적 인 다단계 분석을 수행하고 추세를 파악합니다. 구체적인 구현은 ROLAP, MOLAP 및 HOLAP 으로 나눌 수 있습니다. ROLAP 기본 및 합산 데이터는 RDBMS 에 저장됩니다. MOLAP 기본 및 합산 데이터는 다차원 데이터베이스에 저장됩니다. HOLAP 기본 데이터는 RDBMS 에 저장되고 합계 데이터는 다차원 데이터베이스에 저장됩니다.

프런트 엔드 도구: 주로 다양한 보고 도구, 쿼리 도구, 데이터 분석 도구, 데이터 마이닝 도구 및 데이터 웨어하우스 또는 데이터 마트를 기반으로 하는 다양한 애플리케이션 개발 도구를 포함합니다. 여기서 데이터 분석 도구는 주로 OLAP 서버를 대상으로 하고, 보고 및 데이터 마이닝 도구는 주로 데이터 웨어하우스를 대상으로 합니다.

copyright 2024회사기업대전