빅데이터는 이미 우리 각자의 일상생활과 밀접하게 연결되어 있다.
한 장면의 예를 들어 보겠습니다. 예를 들어 아침에 깨어나면 스마트 시계의 데이터를 통해 어젯밤의 수면의 질이 좋지 않다는 것을 알 수 있다. 아침에 세수를 하고 이를 닦은 후 1000 여 걸음 6 구 지하철 카드로 지하철을 탔습니다. 2 정거장 3 원에 올림픽공원에 도착했습니다. 지하철에서 발견되기 전에 둘러보았던 나이키 농구화 한 켤레가 가격을 내렸다. JD.COM 이 자발적으로 이 제품 정보를 푸시해서 바로 주문했습니다.
이 과정에서 저는 개인적으로 수면 데이터, 걷기 거리 데이터, 지하철 카드 소비 데이터, 지하철 출발점 및 목적지 지리 데이터, JD.COM 쇼핑 데이터, 위챗 위챗 모멘트 데이터를 생성하여 한 번에 이렇게 많은 데이터를 생산했습니다. 큰 데이터 소비자로서 나중에 JD.COM 몰이나 앱을 방문할 때 베개, 농구화 또는 기타 농구화 관련 제품을 추천해 줄 수 있어 수면 지능을 높일 수 있고, 위챗 모멘트 친구들도 내 공유로 구매할 수 있다.
우리가 생성하는 데이터는 기업, 특히 인터넷 회사에서 얻은 후 수학 통계 및 마이닝 알고리즘을 통해 클러스터링, 분할 및 예측을 통해 더욱 관련된 데이터를 얻을 수 있습니다. 이 데이터를 통해 우리 각자를 하나의 레이블로 묘사하다. 성별, 혼인 상태, 취미, 수입, 운동 좋아하는 것, 민감성 증진 등. 기본 인구 속성, 구매력, 행동 특성, 소셜 네트워크, 심리적 특성, 취미 등 우리 각자의 많은 속성을 얻었습니다.
기업이 이러한 데이터를 파악한 후 어떻게 활용할 수 있습니까? 이 데이터를 통해 마케팅을 하는 것이 정밀마케팅, 정밀광고, 정밀추천 상품입니까? 아니면 이 데이터를 통해 기업의 내부 운영 관리를 구체화할 것인가? 아니면 이 데이터를 이용하여 생산 공정을 개선하고 제품의 2 차 연구 개발을 지도합니까? 이것은 기업의 빅 데이터 실천 수준에 달려 있다. 빅데이터의 좋은 응용은 정말 전략적 높이로 올라갈 수 있고, 잘 쓰이지 않는다. 큰 데이터는 금상첨화이지만 선택 사항입니다.
데이터 마이닝의 클러스터링 아이디어에 따르면 기업 데이터는 내부 데이터와 외부 데이터로 나눌 수 있으며 내부 데이터는 재무 데이터와 공급망 데이터 (대형 공급망의 개념) 로 간단히 나눌 수 있습니다. 물론 업종별 기업의 업무 내용도 많이 다르다. 예를 들어, 금융업계에서는 투자 융자, 현금 관리 등 재정적 측면이 많고, 공급망이 적고, 제조업이나 유통 서비스업에서는 공급망 관련 데이터가 더 많을 수 있습니다.
재무 데이터는 주로 재무제표, 특히 대차대조표, 이윤표, 현금 흐름표 등 세 가지 주요 재무제표입니다. 그리고 총계정 원장입니다. 총계정 원장에 있는 회계에는 과목이 관련되어 있고, 과목이 부족하면 우리도 보조회계를 설치할 것이다. 대부분의 기업들도 매년 예산을 편성하고, 대부분의 예산도 재무지표를 중심으로 책정되거나, 재무예산을 기준으로 업무예산을 뒤집는다. 물론 재테크의 큰 부분은 자금 관리이다.
공급망에는 구매, 창고, 물류, 생산, 판매, 애프터 데이터 등 공급망 상류의 공급자에서 하류의 소비자에 이르기까지 더 많은 종류의 데이터가 있습니다. 물론, 우리는 또한 각 부분을 더 구체화할 수 있다.
또한, 생산 마케팅을 위해 문을 닫은 사람은 국가 정책, 경제 환경, 주식 시세, 경쟁 업체, 주요 원자재 가격 등을 포함한 외부 데이터를 적극적으로 참고해서는 안 된다고 믿습니다.
빅 데이터의 전체 아키텍처 대부분의 기업은 BI 시스템이나 보고서 자동화 시스템을 구현해야 합니다. 이 시스템들이 을측이 계획하고 건설한 것이라면, 계획 또는 구현 과정에서 제정한 시스템 시나리오 맵은 3 단계, 최대 4 단계 이상이다.
상향식, 1 차 메타데이터 계층 또는 데이터 소스 계층은 비즈니스 애플리케이션 시스템의 데이터, 재무, 공급망, 인적 자원, 예산 등입니다.
두 번째 계층은 큰 데이터 저장소 계층이라고 합니다. 즉, 각 계층의 데이터 소스를 하나의 데이터 웨어하우스로 수집한 다음 세 번째 계층으로 이동하여 모델 계층을 분석하고 데이터 웨어하우스를 기반으로 분석 모델을 구축하는 것입니다. 일부 시나리오에서는 분석 모델 레이어를 직접 생략하고 마지막 레벨 데이터 표시 레벨까지 직접 이동하여 분석 모델의 데이터를 표시합니다. 필자의 다년간의 경험에 따르면, 이런 조직 형식은 최대 BI 시스템이라고 부를 수 있지만, 큰 데이터 시스템이라고 부를 수는 없다.
JD.COM 빅 데이터는 단일 시스템이나 제품이 아니며 JD.COM 빅 데이터 애플리케이션은 모든 비즈니스 애플리케이션 시스템에 통합되어 있습니다. Dell 의 대용량 데이터 수집 플랫폼은 시스템 또는 제품의 효율성과 고객 경험에 영향을 미치지 않고 Hadoop 플랫폼의 모든 데이터를 정기적으로 실시간으로 자동 수집합니다. 대형 데이터 플랫폼을 중심으로 가공, 처리, 분석, 발굴 결과를 쇼핑몰, 판매, 데이터 나침반, 탐색 등 다양한 비즈니스 시스템 및 데이터 제품에 배포합니다. 다음 그림은 정보 제공만을 목적으로 합니다.
기업 빅 데이터 애플리케이션 수준은 모든 기업이 JD.COM 인 것은 아니며, 모든 기업이 인터넷 회사인 것은 아니다. 모든 기업의 비즈니스가 큰 데이터 지원을 필요로 하는 것은 아닙니다. 기업이 자신의 비즈니스 요구 사항을 충족하면서 작은 데이터 어플리케이션도 즐길 수 있습니까? 대답은' 예' 입니다. 빅 데이터 애플리케이션도 계층화할 수 있으며, 각 계층은 다양한 데이터 계층에 대한 기업의 요구를 충족시킵니다. 대략 다섯 단계로 나뉘는데, 각 레벨은 순차적으로 점진적으로 진행됩니다.
1. 비즈니스 모니터링
이것은 빅 데이터 응용 프로그램의 초기 단계인 기존의 DW/BI 단계입니다. 이 단계에서 기업은 기존 비즈니스의 운영을 모니터링하는 자동 보고 시스템인 BI (비즈니스 인텔리전스) 솔루션을 배포합니다.
업무 모니터링 (업무 성과 관리라고도 함) 은 기업이 기본 분석 방법을 활용하여 업무 운영에 대해 예상보다 낮거나 높은 경보를 발령하고 해당 업무 및 관리자에게 관련 경보 정보를 자동으로 발송하는 것을 의미합니다. 기업 경영 경영진은 이전에 제정한 경보 규칙에 따라 기업 경영 상황을 미리 파악하고 경보를 실현하며, 이를 목표로 하고 예견적인 조치와 수단을 취하여 미연에 예방할 수 있도록 도울 수 있다.
이 단계에는 두 가지 핵심 사항이 있습니다. 첫째, 조기 경보 규칙의 설계. 일반적으로 사용되는 방법은 참조 방법 (동시 비교, 유사 마케팅 활동 비교, 동료 비교) 또는 지표 방법 (브랜드 개발, 고객 만족도, 제품 성과, 재무 분석) 입니다. 지표 분석은 합리적인 지표를 선택하는 것이다. 물론, 여기서 합리적인 지표를 선택하는 것은 말하기는 쉬워도 하기는 어렵다. 사실, 이렇게 하려면 많은 머리를 써야 한다. 제가 전에 만났던 예를 하나 들어보겠습니다. 당시 이산식 제조업체를 위한 방안 설계였다. 재고 관리에 대한 성과 평가의 중요한 지표 중 하나는 재고 회전율 또는 재고 회전율 일수입니다. 이는 원래 정상적이고 일반적으로 사용되는 지표였습니다. 하지만 이 단위의 재고 관리에는 가짜 출고와 가짜 입고가 있어 재고 회전율이 좋아 보인다. 나중에 동판매비와 예금비를 지표로 삼은 후, 우리는 재고지표와 판매지표를 결합하여 피했다. 이 예의 목적은 우리가 업무 감시를 할 때 지표의 선택이 매우 중요하다는 것을 보여 주는 것이다. 이 업무의 경영 상황을 정확하고 공평하게 반영할 수 있을 뿐만 아니라 인위적인 위조를 피할 수 있다.
2. 비즈니스 통찰력
비즈니스 통찰력은 시스템이 데이터 보고서뿐만 아니라 "스마트" 보고서나 "스마트" 대시보드도 제공한다는 것을 의미합니다. 이전의 역사적 데이터를 기반으로 한 다차원 분석을 통해 우리가 모르는 데이터를 더 예측하고 발굴해야 합니다.
예를 들어, 항저우의 한 호텔 체인을 위해 프로젝트를 할 때, 우리는 호텔이 전국적으로 투자한 호텔의 자료에 근거하여 좀 더 재미있는 것을 만들어야 한다. 예를 들어, 우리는 이전에 투자한 호텔의 인테리어 투자, 현재 다른 등급의 입주율, 호텔 음식점부의 상석률과 회전율, 영업수입, 비용, 현지 도시의 경쟁 업체 등을 근거로 새로운 투자 호텔의 투자 수익률과 회수 기간을 예측해야 한다. 또한 재무 분석에 일반적으로 사용되는 듀폰 분석법도 있습니다. 간단히 말해서 듀폰 분석은 재무 관점에서 기업 전체의 재무 성과를 종합적으로 분석하는 모델입니다. 그것의 기본 원리는 맨 위가 로이라는 것이다. ROE 의 경우, 우리는 ROA× 지분 승수로 나눌 수 있고, ROA 는 순 판매율 × 자산 회전율로 나눌 수 있으며, 다시 분해하면 결국 재무 지표로 가득 찬 트리 구조가 된다. 이러한 재무 지표는 재무제표 항목, 회계, 보조 회계를 통해 계산되기 때문에 매우 시급한 논리적 관계를 가지고 있습니다. 이렇게 하면 시뮬레이션 예측을 달성하기 위한 기술적 수단을 계산할 수 있다. 예를 들어, 내년 예산이나 계획을 세울 때 일부 재무 지표를 미리 조정하고자 할 경우 순이익 65,438+0% 증가, 판매 수익, 마케팅 비용, 관리 등과 같은 기타 관련 지표도 연계될 수 있습니다. 이것은 우리가 미리 예측하고 더 나은 계획과 예산을 만드는 데 도움이 될 것이다.
물론, 소매업과 같은 현 단계에서는 여전히 예측할 수 있는 것이 많다. 대부분의 판매 범주에는 판매 주기가 있습니다. 판매 주기를 기준으로 판매를 예측할 수 있습니다. 또한 역사적 사용자가 서로 다른 마케팅 방식에 대한 반응, 마케팅 비용, 마케팅 상품, 마케팅 효과 간의 관계에 따라 대상 집단을 정확히 잠그고 목표 마케팅을 하고 마케팅 효율성을 높이며 마케팅 비용을 절감할 수 있습니다.
3. 비즈니스 최적화
비즈니스 최적화는 대부분의 기업에게 여전히 매력적이며, 이는 많은 기업들이 밤낮으로 생각하는 목표이기도 합니다. 구현 단계는 차근차근 진행될 수 있으며, 적어도 기업은 분석 기술을 비즈니스 운영에 내장할 수 있습니다. 다음은 우리가 전통적인 기업을 위해 한 사례입니다. 대부분의 기업들과 마찬가지로, 이 기업도 ERP 시스템을 가지고 있다. 조달 과정에서 공급자 성과 모델을 도입할 수 있습니다. 물론 이 공급자 성과 모델은 공급 품질, 공급 효율성, 불량품 비율, 애프터서비스 등 여러 가지 요소를 고려해야 할 수 있습니다. 구매 시 구매자는 공급자 성과 모델에 따라 적절한 공급자를 선택할 수 있습니다. 이것이 그 예입니다. 또한 주요 원자재의 시장 가격은 구매 인터페이스에 실시간으로 연결하여 구매 관리자가 구매 주기를 파악하고 구매 계획을 합리적으로 계획할 수 있도록 합니다.
소매 업계에서는 맥주와 기저귀, 초콜릿, 콘돔의 예와 같이 상품, 사용자, 사용자, 상품 사이에 강한 연관성이 있다는 것을 알고 있습니다. 여기서는 대부분의 전기상들이 어떻게 만들어졌는지 조금 말씀드릴 수 있습니다. 구매 기록에 나오는 이 제품들을 통해 우리는 두 제품 간의 관계를 찾아낼 수 있다. 이런 관계는 동등하지 않다. 예를 들어, 휴대전화를 사는 사용자는 보통 휴대전화 케이스를 동시에 사고, 휴대전화 케이스를 사는 사람은 반드시 핸드폰을 사는 것은 아니다. 이것은 휴대전화와 휴대전화 케이스가 관련이 있고 강한 관계라는 것을 보여준다. 휴대전화 케이스와 휴대전화의 관계는 약하다. 여기서는 관계의 강약을 계수로 설명한다. 그래서 상품과 상품 사이의 이런 관계로 우리는 상품 모델을 형성했다. 이 제품 모델을 기반으로 사용자가 찾아보고, 구매하고, 소장하고, 댓글을 달았던 제품을 더 잘 추천할 수 있습니다. 상품을 다 말하고 사용자에 대해 다시 말해 보자. 사용자는 유사한 찾아보기 동작, 검색 동작, 설명 동작, 구매 동작을 통해 사용자 간의 관계를 파악할 수 있습니다. 사용자 간의 행동 관계에 따라 그와 매우 관련이 있는 다른 사용자가 구매하거나 관심 있는 제품을 추천할 수 있습니다. 이는 많은 인터넷 회사들이 광고 추천, 상품 추천, 홍보 정보 추천에 대한 보편적인 관행이기도 하다.
4. 데이터 수익성
데이터 이익은 우리가 흔히 말하는 데이터 현실화입니다. 데이터 수익을 창출하는 한 가지 방법은 데이터 상품화입니다. 현재 많은 데이터 서비스 회사들이 모바일 게임, app 사용, 사용자 행동 등의 데이터를 수집하고 데이터 마이닝 및 분석 기술을 통해 실현 목적을 달성한 다음 제품 또는 서비스의 행동 출력을 통해 이를 수행할 수 있습니다. 또한 샤오미, 화웨이 등과 같은 휴대전화 업체들은 수억 명의 활동적인 사용자를 보유하고 있으며, 휴대전화 중 한 사람의 행동 데이터를 파악하고 심지어 지불 데이터도 포함하고 있다. 실현할 수 있는 방면이 많은데, 그들을 제한하는 것은 그들의 생각이다. 또한 점점 더 많은 기존 제조업체가 제품을 디지털화하고 있습니다. 예를 들어 자동차+빅데이터는 테슬라가 되고, 홈+빅데이터는 스마트홈으로 변한다. 물론 여기에는 많은 예가 있습니다.
5. 비즈니스 리모델링
비즈니스 리모델링은 빅 데이터 성숙도 모델의 가장 높은 단계여야 합니다. 이 단계에서 일부 기업은 고객 사용 모델, 제품 성능 행동 및 전체 시장 추세를 분석하여 비즈니스 모델을 징둥 등의 새로운 시장의 새로운 서비스로 전환하고자 합니다. COM 의 새로운 업무, 징둥 금융 및 징둥 지능. 게다가, 우리는 우리의 상상력을 이용할 수 있다. BAT 의 어떤 업무가 주영 업무 데이터를 기반으로 개발된 것입니까? 우리는 많은 것을 생각해 낼 수 있습니까?
중국과 세계에서 실제로 큰 데이터를 보유한 기업은 많지 않다. 우리는 전자 상거래의 전체 가치 사슬에 큰 데이터를 가지고 있어서 매우 운이 좋다. 이 금광을 어떻게 발굴합니까? 오직 우리 자신의 생각만이 우리를 제한한다.
변쇼가 공유하는 징둥 새로운 이해와 응용에 관한 내용이다. COM 의 엔터프라이즈 빅 데이터 공유. 더 많은 정보는 전 세계 아이비리그 더 많은 건화물 공유에 집중할 수 있다.