빅토르 마이어 쇤버그는' 빅 데이터 시대' 라는 책에서 여러 가지 예를 들었는데, 빅 데이터 시대가 도래했을 때 빅 데이터의 잠재적 가치를 발굴하기 위해 빅 데이터 사고를 사용해야 한다는 점을 설명하기 위해서였다.
빅 데이터 사고란 무엇입니까? 빅토르 마이어 쇤버그는 1) 샘플이 아닌 모든 데이터 샘플이 필요하다고 생각합니다. 2) 정확성보다는 효율성에 중점을 둡니다. 3) 인과 관계보다는 관련성에 중점을 둡니다.
우리는 빅데이터가' 대' 가 아니라' 유용' 하다고 생각한다. 빅 데이터 사고는 데이터의 가치를 완전히 이해하고 빅 데이터를 사용하여 비즈니스 의사 결정을위한 기반을 제공하는 방법, 즉 데이터 처리를 통해 비즈니스 가치를 창출하는 방법을 아는 것입니다.
빅 데이터 사고의 핵심은 데이터의 가치를 이해하고 데이터 처리를 통해 비즈니스 가치를 창출하는 것입니다.
하버드 비즈니스 위크에 따르면 데이터 과학자는 2 1 세기의 가장 섹시한 직업이다. 방대한 양의 데이터를 얻은 후에는 데이터 활용 방법을 고려해야 한다. 데이터 과학자는 과학적 방법과 데이터 마이닝 도구를 사용하여 새로운 데이터 견해를 발견하는 엔지니어이다. 빅 데이터 시대는 데이터 과학자의 중요성과 데이터 분석과 비즈니스의 결합의 필요성을 부각시켰다. 하드웨어와 인프라에 대량의 데이터가 있으면 대량의 분산된 데이터를 구조화된 데이터로 바꾸어 분석하고 통합 및 정리하여 결과 데이터 세트를 형성해야 합니다.
인재 레이더가 대표적인 예다. 모든 사람이 인터넷에 남긴 생활 궤적, 사회적 언행 등 개인 정보를 담은 인터넷 데이터를 바탕으로 온라인 행동에서 그의 관심도, 성격 초상화, 능력 평가를 떼어냈다. 인재 레이더, 데이터 마이닝 기반 인재 추천 플랫폼, 기업이 보다 효율적인 직책 매칭을 실현하고 헤드헌터 서비스를 제공할 수 있도록 지원합니다. 한 기술자의 전문성을 평가하기 위해 인재 레이더는 전문 포럼 (예: Github, CSDN, 지평, 라일락원 등) 에 게재된 게시물 수 등 데이터, 내용 참조 수, 인용된 사람들의 영향력 등을 사용한다. , 그리고 이 정보를 통해 모델을 만들어 그 직업의 영향에 대한 판단을 완성한다. (윌리엄 셰익스피어, 윈스턴, 일명언) 한편 웨이보의 데이터는 충분히 활용되고 있다. 여기에 반영된 사회관계도 한 사람의 전문능력을 판단하는 요인 중 하나다. 따라서 소셜네트워크서비스 (SNS) 에서의 사용자 친구의 직업적 영향력을 판단하는 것도 인재 레이더 추천 시스템의 관건이다. 한편, 추천인의 개인적 능력이 전문적인 요구를 만족시키기 어렵더라도 좋은 친구 관계가 있다면 적절한' 추천인' 으로 임무를 다음 단계로 분산시킬 수 있다. 사용자들마다 소셜네트워크서비스 (SNS) 에서 서로 다른 행동 습관을 가지고 있다. 예를 들면 웨이보 보내는 시간 법칙, 전문포럼에서의 시간 길이 등이 있다. 이러한 행동 패턴은 근무 시간을 판단하고 해당 업무 요구 사항을 충족하는지 확인하는 데 사용할 수 있습니다. 인재 레이더는 다양한 데이터 소스의 통합 분석을 통해 기업이 비용을 절감하면서 인재 채용의 효율성을 높이는 데 도움이 될 수 있습니다. 전통적인 헤드헌터 업무보다 집단 지능을 이용하여 인재를 더 광범위하고 객관적으로 선별할 수 있으며, 수동적인 측정으로 일부 구직자들이 직접 면접에서 허위 표현을 어느 정도 피할 수 있다. 현재 고객으로는 타오바오, 마이크로소프트, 바이두 등 유명 기업이 있다.
아마존은 20 13 년 2 월' 예상 배송' 에 대한 새로운 특허를 획득하여 고객이' 구매' 를 클릭하기 전에도 배송할 수 있게 했다. 이 기술은 배송 시간을 줄이고 소비자가 실제 매장을 방문하는 횟수를 줄일 수 있다. 특허 문서에서 아마존은 주문과 수령 사이의 시간 지연이' 전자상가에서 상품을 구매하는 고객의 열정을 약화시킬 수 있다' 고 밝혔다. 아마존은 이전 주문 및 기타 요인에 따라 특정 지역의 고객이 구매하지만 주문하지 않은 제품을 예측하여 포장해 보낼 것이라고 밝혔다. 특허에 따르면 고객이 주문하기 전에 이러한 사전 납품된 화물은 택배회사의 배송센터나 트럭에 보관됩니다. "예상 배송" 제품을 예측할 때 아마존은 고객의 과거 주문, 제품 검색, 위시리스트, 장바구니의 내용, 반품, 심지어 고객의 마우스 커서가 제품에 머무는 기간을 고려할 수 있습니다. 이 특허는 아마존이 보유하고 있는 방대한 고객 정보를 최대한 활용하여 경쟁 우위를 확보하고자 한다는 것을 보여준다.
빅데이터의 가장 본질적인 응용은 대량 데이터에서 특정 특징을 분석하여 앞으로 발생할 수 있는 일을 예측하는 예측이다. (존 F. 케네디, 데이터, 데이터, 데이터, 데이터, 데이터, 데이터, 데이터, 데이터) 서로 다른 데이터 흐름이 하나의 대형 데이터베이스에 통합되면 예측의 폭과 정확도가 크게 향상됩니다.