1. 데이터 계층화
알리바바 데이터에서는 데이터 계층화를 대형, 중형, 소형 프런트 데스크라고 합니다. 비즈니스 디지털화를 실현하기 위해서는 모든 비즈니스 활동이 관련 데이터를 기록하고 이를 비즈니스로 전환해야 합니다. 데이터에서 가치를 발견하고 비즈니스에 힘을 실어주는 것이 핵심입니다.
2. 데이터 표준화
알리바바의 데이터센터 아이디어에서는 데이터 표준화를 원데이터(OneData)라고 합니다. 데이터 자산의 각 도메인, 테마, 모델, 필드, 지표 명명 등에 대한 통일된 사양을 달성하려면 대기업의 비즈니스 시스템 데이터 자산이 이 원칙을 따르는 경우 데이터 표준화가 소스에서 해결되어야 한다는 점을 강조할 가치가 있습니다. , 그것은 매우 강력해야합니다. 차원 모델링을 사용하여 버스 매트릭스를 구축하고 데이터 도메인과 비즈니스 프로세스를 명확하게 정의할 수 있습니다.
3. 주제 태깅
알리바바 데이터센터에서는 주제 태깅을 OneID라고 합니다. ID-MAPPING은 다양한 분야에서 수집된 데이터를 상속받아 상호 연관시켜 분석할 수 있도록 보장하는 기술입니다. 데이터 사일로의 형태. 데이터 연관은 기존 데이터 웨어하우스의 데이터 분석을 위한 기초이기도 합니다.
4. 데이터 자산 카드
Alibaba 데이터 센터에서는 데이터 자산 카드를 OneMeta라고 합니다. 이는 당사의 데이터 자산 분석 및 데이터 계보 추적의 기초이며, 데이터 관리에 있어 매우 기본적인 사항입니다. 여기에는 데이터 보안 관리, 품질 관리, 비용 관리, 자산 생성 정보, 수정 정보 등이 포함됩니다.
5. 주제별 데이터 서비스
알리바바 데이터 센터에서는 주제별 데이터 서비스를 OneService라고 합니다. 비즈니스를 위한 데이터 내보내기 및 데이터 쿼리 논리를 통합하고, 여러 데이터 소스와 여러 물리적 테이블을 보호하며, 데이터 검색을 용이하게 하는 비즈니스 중심 가상 쿼리 집합인 메타데이터를 기반으로 구축된 간단한 데이터 서비스 쿼리 엔진입니다. 데이터 푸시, 예약된 작업, 소스 간 데이터 서비스 등을 모두 주제 데이터 서비스라고 합니다.
기업이 데이터 센터를 구축할 때 준수해야 할 원칙에 대해 Qingteng 편집자가 여기에서 공유하겠습니다. 빅데이터 엔지니어링에 깊은 관심을 갖고 계시다면, 이 글이 도움이 되길 바랍니다. 데이터 분석가와 빅데이터 엔지니어의 기술과 자료에 대해 더 알고 싶다면 이 사이트의 다른 기사를 클릭하여 알아볼 수 있습니다.