현재 위치 - 회사기업대전 - 기업 정보 공시 - 데이터 웨어하우스 및 메타데이터 관리

데이터 웨어하우스 및 메타데이터 관리

머리말 거래 처리 시스템의 데이터는 주로 업무 상황을 기록하고 조회하는 데 사용됩니다. 데이터 웨어하우스 기술이 성숙함에 따라 기업의 데이터는 점차 의사 결정의 주요 근거가 되고 있습니다. 데이터 웨어하우스 (Data warehouse) 는 의사 결정 지향적인 주제이며 현재 및 과거 요약 데이터가 있는 읽기 지향 데이터베이스 시스템입니다. 그 목적은 의사 결정을 지원하는 것이다. 데이터 웨어하우스는 의사 결정의 필요에 따라 기업 내부 및 외부에서 관련 데이터를 수집하여 적절하게 만들어야 합니다. 조직 처리는 의사 결정 프로세스에 대한 정보를 효과적으로 제공 할 수 있습니다. 데이터 웨어하우스의 데이터는 많은 비즈니스 처리 시스템에서 추출되고 변환됩니다. 이처럼 복잡한 엔터프라이즈 데이터 환경에서는 안전하고 효율적인 방식으로 관리하고 액세스하는 것이 특히 중요합니다. 이 문제를 해결하는 관건은 과학적으로 메타데이터를 효과적으로 관리하는 것이다. 메타데이터는 데이터 조작 프로세스 및 애플리케이션의 구조와 중요성에 대한 설명 정보입니다. 그것의 주요 목표는 포괄적인 데이터 자원 가이드를 제공하는 것이다. 메타데이터는 데이터 웨어하우스의 데이터에 대한 스키마 소스, 추출 및 변환 규칙을 정의할뿐만 아니라 전체 데이터 웨어하우스 시스템의 작업은 데이터 웨어하우스 시스템의 모든 느슨한 구성 요소를 연결하여 유기적인 전체를 형성하는 메타데이터를 기반으로 합니다. 이 문서에서는 먼저 메타데이터의 정의, 기능 및 의미를 소개한 다음 데이터 웨어하우스 시스템의 메타데이터 관리 현황 및 문제에 대해 설명합니다. 메타데이터의 표준화는 결국 메타데이터 관리 시스템을 구축하는 단계와 구현 방법을 제시합니다. 전통적인 정의에 따르면 메타데이터는 데이터에 대한 데이터입니다. 데이터 웨어하우스 시스템에서 메타데이터는 데이터 웨어하우스 관리자와 데이터 웨어하우스 개발자가 관심 있는 데이터를 쉽게 찾을 수 있도록 도와줍니다. 메타데이터는 데이터 웨어하우스의 데이터 구조 및 설정 방법을 설명합니다. 목적에 따라 데이터 웨어하우스의 데이터는 기술 메타데이터와 비즈니스 메타데이터의 두 가지 범주로 나눌 수 있습니다. 기술 메타데이터는 데이터 웨어하우스 시스템의 기술적 세부 사항을 저장하는 데이터로, 데이터 웨어하우스를 개발하고 관리하는 데 사용됩니다. 주로 다음 정보를 포함합니다 &; #; 데이터 웨어하우스 구조에 대한 설명에는 웨어하우스 스키마 뷰 차원의 계층, 내보낸 데이터의 정의, 데이터 마트의 위치 및 내용이 포함됩니다. #; 비즈니스 시스템의 데이터웨어 하우스 및 데이터 마트의 아키텍처 및 모델 & #; 합산에 사용되는 알고리즘에는 측정값 및 차원 정의 알고리즘, 데이터 세분성, 주제 영역 합산 및 합산, 사전 정의된 쿼리 및 보고 & amp;; 가 포함됩니다 #; 운영 환경에서 데이터 웨어하우스 환경으로의 매핑에는 소스 데이터와 해당 컨텐츠, 데이터 분할, 데이터 추출, 정리, 변환 규칙 및 데이터 새로 고침 규칙이 포함됩니다. 보안 (사용자 권한 부여 및 액세스 제어) 비즈니스 메타데이터는 비즈니스 관점에서 데이터 웨어하우스의 데이터를 설명합니다. 사용자와 실제 시스템 사이에 의미 계층을 제공하여 컴퓨터 기술을 모르는 비즈니스 사용자도 데이터 웨어하우스의 데이터를 읽을 수 있도록 합니다. 업무 메타데이터는 주로 정보 사용자의 업무 용어에 표현된 데이터 모델 객체 이름 및 속성 이름, 데이터에 액세스하는 원칙 및 데이터의 출처, 시스템에서 제공하는 분석 방법, 공식 및 보고서에 대한 정보 & #; 엔터프라이즈 개념 모델 비즈니스 메타 데이터가 제공해야 하는 중요한 정보입니다. 엔터프라이즈 데이터 모델의 상위 수준 정보, 엔터프라이즈 전체의 비즈니스 개념 및 관계를 나타냅니다. 이러한 엔터프라이즈 모델을 기반으로 데이터베이스 기술 및 SQL 문을 이해하지 못하는 비즈니스 인력도 데이터 웨어하우스의 데이터를 잘 알 수 있습니다. #; 다차원 데이터 모델은 비즈니스 분석가에게 데이터 마트에 어떤 차원, 데이터 큐브 및 데이터 마트의 집계 규칙이 있는지 알려주는 엔터프라이즈 개념 모델의 중요한 부분입니다. 여기서 데이터 큐브는 주제 영역에서 비즈니스 사실 테이블과 차원 테이블의 다차원 조직 형태를 나타냅니다. #; 비즈니스 개념 모델과 물리적 데이터의 종속성 위에서 언급한 비즈니스 메타데이터는 실제 데이터 웨어하우스 또는 데이터베이스 다차원 데이터베이스의 테이블 필드에 대한 차원 계층에 해당하는 데이터의 비즈니스 뷰를 나타냅니다. 데이터 웨어하우스 시스템에서 메타데이터 메커니즘은 주로 다음과 같은 5 가지 시스템 관리 기능 (1) 을 지원합니다. 데이터 웨어하우스에는 어떤 데이터가 있습니까? (2) 데이터 웨어하우스에 들어갈 데이터 및 데이터 웨어하우스에서 생성된 데이터를 정의합니다. (3) 업무 이벤트 발생에 따라 데이터 추출 진행 상황을 기록합니다. (4) 시스템 데이터 일관성의 요구 사항 및 구현을 기록하고 테스트합니다. (5) 측정 데이터 품질. 데이터 웨어하우스는 소프트웨어 개발 프로젝트라기 보다는 시스템 통합 프로젝트 [] 입니다. 주요 업무는 필요한 데이터 웨어하우스 도구를 통합하여 데이터 추출, 변환, 로드, OLAP 분석 및 데이터 마이닝을 수행하는 것이기 때문입니다. 일반적인 구조는 운영 환경, 데이터 웨어하우스 및 비즈니스 계층으로 구성됩니다. 여기서 첫 번째 계층 (운영 환경 계층) 은 기업 전체의 비즈니스 관련 OLTP 시스템 및 일부 외부 데이터 소스를 나타냅니다. 데이터 웨어하우스 계층의 세 번째 계층은 비즈니스 데이터 분석을 완료하는 다양한 도구로 구성된 비즈니스 계층 다이어그램입니다. 그림의 왼쪽에는 메타데이터 관리가 있으며, 다음과 같은 여러 방면에서 계승 역할을 합니다. #; 손쉬운 통합&; #; 시스템의 유연성 향상&; #; 데이터 품질 및 amp 보장 #; 사용자가 데이터의 의미를 이해할 수 있도록 데이터 웨어하우스의 메타데이터 관리 현황에는 두 가지 주요 작업이 있습니다. 하나는 메타데이터 데이터베이스의 메타데이터를 저장하고 유지 관리하는 것이고, 다른 하나는 데이터 웨어하우스의 모델링 도구, 데이터 수집 도구 및 프런트엔드 도구 간의 메시징을 담당하는 것입니다. 모듈과 도구 간의 작업을 조정합니다. 위 섹션에서는 메타데이터를 데이터 웨어하우스 또는 비즈니스 인텔리전스 (BI) 시스템이라고 부를 수 있다는 것을 알고 있습니다. 영혼은 메타 데이터가 데이터 웨어하우스의 전체 수명 주기 동안 중요한 역할을 하기 때문입니다. 각 공급업체의 데이터 웨어하우스 솔루션은 메타데이터 관리에 대해 언급하지만, 유감스럽게도 모든 솔루션은 완전한 메타데이터 관리 모델을 명확하게 제시하지 않았습니다. 특정 로컬 메타데이터만 관리할 수 있습니다. 현재 시장에서 메타데이터와 관련된 주요 도구는 그림과 같습니다. 웨어하우스 도구에 따르면 비즈니스 시스템의 데이터 추출 및 변환을 데이터 웨어하우스에 통합하는 네 가지 유형의 데이터 추출 도구로 나눌 수 있습니다. 예를 들어, Ardent 의 DataStage CA (이전 플래티넘) 의 Decision Base 및 ETI 의 extract 와 같은 도구는 기술 메타데이터만 제공하며 비즈니스 메타데이터는 거의 지원되지 않습니다. 프런트 엔드 데모 도구에는 OLAP 분석이 포함됩니다. MicroStrategy 의 DSS 에이전트 Cognos, PowerPlay Business Objects 의 BO 및 brio 와 같은 보고 및 비즈니스 인텔리전스 도구는 관계형 테이블을 비즈니스 관련 팩트 및 차원 테이블에 매핑하여 다차원 비즈니스 뷰를 지원하고 데이터 웨어하우스의 데이터에 대한 다차원 분석을 수행합니다. 이러한 도구는 모두 비즈니스 및 기술 메타데이터를 제공합니다. 해당 의미 계층 모델링 도구는 비전문가를 위한 비즈니스 모델링 도구입니다. 이러한 도구는 CA 의 ERwin Sy *** 등과 같은 특정 업무와 관련된 상위 수준의 의미를 제공합니다. Ase PowerDesigner, Rational Rose 등의 메타데이터 스토리지 툴은 보통 블랙박스 같은 전용 데이터베이스에 저장됩니다. 이러한 도구에서 사용 및 생성된 메타데이터가 어떻게 저장되어 있는지 알 수 없습니다. 또 다른 도구는 메타데이터베이스라고 하는데, 다른 도구와는 별개이다. 데이터는 Microsoft Repository CA, Repository Ardent MetaStage 및 Sybase WCC 와 같은 메타데이터 관리 표준화 등 중앙 집중식 스토리지 공간을 제공합니다. 방원 메타데이터 관리가 어려운 중요한 이유 중 하나는 통일된 기준이 부족하다는 것이다. 이 경우, 각 회사의 메타데이터 관리 방안은 다르다. 최근 몇 년 동안, MDC (메타데이터 연합) 의 오픈 정보 모델 OIM (메타데이터 연합) 과 OMG 조직의 public * * * CWM (공용 창고 모델) 표준이 점진적으로 개선되고 MDC 와 OMG 조직의 합병이 이루어지면서 데이터 웨어하우스 공급업체에 일관된 표준을 제공하여 메타데이터 관리의 길을 닦았습니다. 메타데이터의 발전 역사에서 알 수 있듯이, 메타데이터 관리 방법에는 크게 두 가지가 있습니다 (). 비교적 간단한 환경의 경우, 일반적인 메타데이터 관리 기준 () 에 따라 중앙 집중식 메타데이터 지식 기반을 설정합니다. 복잡한 환경의 경우, 여러 부분의 메타데이터 관리 시스템을 구축하고 분산된 메타데이터 지식 기반을 형성합니다. 그런 다음 표준 메타데이터 교환 형식을 설정하여 메타데이터를 통합적으로 관리할 수 있습니다. 다음은 MDC 의 OIM 표준과 OMG 의 CWM 표준, MDC 의 OIM 스토리지 모델을 각각 소개하고, 2000 년에 설립되어 공급업체와 관계를 맺는 데 주력하고 있습니다. 특정 기술에 독립적인 엔터프라이즈 메타데이터 관리 표준인 비영리 기술 연합. 이 연합은 마이크로소프트나 IBM 과 같은 유명한 소프트웨어 제조업체를 포함한 몇 명의 회원이 있다. MDC 는 Microsoft 가 OIM 을 메타데이터 표준으로 사용하자는 제의를 받아들였다. OIM 의 목적은 공용 메타데이터 정보를 통해 서로 다른 도구와 시스템 간의 데이터를 지원하는 것입니다. 설계에서 게시에 이르기까지 정보 시스템의 모든 단계를 즐기고 재사용합니다. 메타데이터 유형에 대한 표준 설명을 통해 도구와 기술 자료 간의 데이터를 공유할 수 있습니다. OIM 선언의 메타데이터 유형은 UML (Universal Modeling Language) 에 의해 설명되며 사용 및 확장이 용이한 여러 주제 영역으로 구성됩니다. 이러한 주제 영역에는 &; #; 분석 및 설계는 주로 소프트웨어의 분석, 설계 및 모델링에 사용됩니다. 이 항목의 범위는 UML 패키지 (UML 확장 패키지, 일반 요소 패키지, 일반 데이터 유형 패키지, 엔티티 관계 모델링 패키지 등) 로 세분화됩니다. #; 객체와 구성 요소에는 객체 지향 개발 기술의 모든 측면이 포함됩니다. 이 항목의 범위에는 구성 요소 설명 모델링 패키지&#; 데이터베이스 및 웨어하우스는 데이터베이스 스키마 관리, 재사용 및 데이터 웨어하우스 구축을 위한 메타데이터 개념 지원을 제공합니다. 이 항목의 범위는 관계형 데이터베이스 스키마, OLAP 스키마 및 데이터 변환으로 세분화됩니다. Rmations) 는 레코드 지향 데이터베이스 스키마, 스키마, 보고서 정의 등을 캡슐화합니다. #; 상업 공사는 기업 운영을 위한 청사진을 제공한다. 이 항목의 범위는 비즈니스 목표 패키지, 조직 요소 패키지, 비즈니스 규칙 패키지, 비즈니스 프로세스 패키지 등으로 세분화됩니다. #; 지식 관리에는 기업의 정보 구조가 포함됩니다. 이 주제의 범위는 지식 설명 (지식 입세 신지/문장/절차/갑골문/201311/18587
copyright 2024회사기업대전