현재 위치 - 회사기업대전 - 기업 정보 조회 - 빅 데이터 개발을위한 세 가지 필수 조건

빅 데이터 개발을위한 세 가지 필수 조건

빅 데이터 개발을위한 세 가지 필수 조건 _ 데이터 분석가 테스트

최근 몇 년 동안 큰 데이터에 대한 토론은 기술, 응용, 모델 등 여러 차원에서 전개되어 산업 발전의 방향을 대표하는 것으로 간주되었다. 그러나 인터넷 회사들의 여러 가지 관행에 비해 데이터 자원에 선천적 우위를 점하고 있는 것으로 여겨지는 통신 사업자들은 뒤처져 있다. (윌리엄 셰익스피어, 윈스턴, 인터넷명언) (윌리엄 셰익스피어, 윈스턴, 인터넷명언) 전 세계를 바라보더라도 통신 사업자의 대용량 데이터 응용 사례는 손꼽힌다. 모바일 광대역과 고정 광대역의 급속한 발전, OTT 의 강세로 인해 통신 사업자들은 자신의 데이터 자원을 최대한 활용하고 네트워크 가치를 극대화할 수 있는 또 다른 방법을 모색해야 한다는 결정이 내려졌다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 이동명언) 따라서 통신 사업자가 큰 데이터를 적용하는 것은 필연적이며 시장 전망은 매우 넓다.

큰 데이터의' 착지' 를 가속화하기 위해 업계 각 방면, 특히 통신사업자들이 큰 데이터를 더 잘 이해하고, 큰 데이터 전략 발전의 중요성을 인식하고, 발전 길에서 직면한 어려움과 장애를 분석하고, 큰 데이터 산업 체인의 성숙을 촉진하고, 큰 데이터의 응용과 보급을 추진하도록 돕는다. 오늘부터 인민우편은 중흥통신, 중국통신연구원, 3 대 사업자의 전문가를 특별히 초청하여' 금을 파는 대데이터' 시리즈 보도를 내놓아 독자를 대접하였다.

빅데이터 개념의 출현은 불과 몇 년 만에 나타난 방대한 데이터에 달려 있다. 통계에 따르면 인터넷상의 데이터는 2 년마다 두 배씩 증가하고 있으며, 현재 전 세계 데이터의 90% 이상이 최근 몇 년 사이에 생성된 것으로 집계됐다. 물론 대량 데이터는' 빅 데이터' 개념의 일부일 뿐이다. 4 개의 "V" 특징, 즉 양 (대량), 속도 (고속), 변수 (다양성), 값 (가치) 만 있으면 큰 데이터의 정의는 완전하며, 마지막 값 (가치) 은 큰 데이터의 미래 방향을 결정하는 열쇠입니다.

빅 데이터 개발을위한 세 가지 필수 조건

빅 데이터의 발전에는 데이터 소스, 데이터 거래 및 데이터 가치 창출 프로세스의 세 가지 필수 조건이 필요합니다. 최근 몇 년 동안 소셜네트워크의 출현, 사물인터넷의 발전과 모바일 인터넷의 보급으로 위챗, 웨이보, 스마트폰, 전자상거래가 보편화되면서 위치, 생활정보 등 많은 가치 있는 데이터 소스가 탄생했다. 데이터 소스의 출현은 큰 데이터의 발전을 위한 토대를 마련했다. 빅데이터 시대가 도래한 중요한 상징은 대량의 전문' 데이터 거래원' 의 출현과 데이터 거래를 중심으로 수집, 정리, 분석, 적용 전 과정을 관통하는 산업 사슬이다. 빅 데이터 개발의 핵심은 사용자가 대량의 비정형 데이터와 반정형 데이터로부터 새로운 가치를 얻을 수 있도록 하는 것입니다. 데이터 가치는 데이터 거래의 원동력입니다.

최근 몇 년 동안 IBM, Oracle, SAP 는 데이터 관리 및 분석 회사를 인수하는 데 막대한 투자를 해 왔습니다. 이러한 인터넷 거물들의 추진으로 데이터 분석 기술이 점점 성숙해지고 있다. 20 13 년 6 월 에드워드 스노든은' 모경문' 프로젝트를 공개했다. 모경문' 사건은 빅데이터 기술이 성숙해졌다는 것을 보여주며, 빅데이터 발전을 가로막는 것은 기술이 아니라 데이터 거래 및 데이터 가치라는 것을 증명한다. (윌리엄 셰익스피어, 템플린, 데이터, 데이터, 데이터, 데이터, 데이터, 데이터, 데이터)

빅 데이터 기술의 발전으로 클라우드 컴퓨팅의 착지가 추진되고 클라우드 컴퓨팅 배포가 완료되면서 데이터 가치 창출에 대한 시장의 기대치가 높아졌습니다. 빅데이터 개념이 제기된 후, 시장은 마침내 클라우드 컴퓨팅의 수익 방향을 보았다. 클라우드 컴퓨팅 시장은 하룻밤 사이에 폭발하는 것 같다. 거의 1 ~ 2 년 동안 국내 대형 프로그램 업체와 대형 통합업체, 즉 각지의 1 급 시스템 통합업체가 현지 정부와 협력하여 클라우드 데이터 센터를 구축하고 스마트 도시를 건설했습니다. 각 업계의 거물들은 각 업계의 혼합 클라우드 표준을 구축하고 업계 클라우드 플랫폼을 구축하고 있습니다. 공용 클라우드도 왔고, 각 주요 IT 거물들은 국내에서 공용 클라우드 면허증을 신청하기 위해 온갖 수단을 다 동원했다. 클라우드 컴퓨팅은 개념에서 착지까지 5 년이 걸렸고, 결국 이 모든 것을 가능하게 한 것은 큰 데이터, 또는 시장의 데이터 가치에 대한 기대였다. 스마트 도시 개념이 국내에서 대규모로 보급됨에 따라 클라우드 컴퓨팅 인프라는 기본적으로 준비되었다. 한편, 대규모 데이터 애플리케이션을 위한 하드웨어 기반을 갖추고 있고, 클라우드 컴퓨팅의 투자 회수 압력으로 인해 시장은 애플리케이션 배포가 절실히 필요하며, 큰 데이터는 눈 속에서 숯을 보내는 것과 같이 시장에 큰 기대를 걸고 있습니다.

자, 모든 것이 "데이터는 어떻게 가치를 창출합니까? 클릭합니다

56 데이터 창출 가치 6 의 초석은 데이터 통합과 개방입니다.

빅 데이터 서비스 신생 회사인 Connotate 는 800 여 명의 비즈니스 및 IT 임원을 조사했습니다. 그 결과 응답자의 60% 가 "이 빅데이터 투자 프로젝트가 반드시 좋은 수익을 가져다 줄 것이라고 말하는 것은 시기상조다" 고 답했다. 이는 현재의 대용량 데이터에 필요한 개방성이 부족하기 때문입니다. 즉, 데이터가 서로 다른 부서와 기업의 손에 달려 있고, 이러한 부서와 기업은 데이터 공유를 원하지 않기 때문입니다. 빅데이터는 데이터의 관련성을 연구하여 객관적인 법칙을 발견하지만, 데이터의 연관성은 데이터의 진실성과 보편성에 달려 있다. 데이터 * * * 를 액세스 가능하고 개방적으로 만드는 방법은 현재 빅 데이터 개발의 약점이자 해결해야 할 큰 문제입니다.

오바마는 20 12 미국 대선에서 데이터 통합의 혜택을 받았다. 오바마 경선 팀에는 엄청난 양의 데이터를 발굴하여 오바마가 6543.8+0 억 달러를 모으는 신비한 데이터 마이닝 팀이 있습니다. 이들은 데이터 마이닝을 통해 행사 광고의 효율성을 14% 높였다. 스윙 주 유권자의 상세한 모델을 만들어 매일 밤 6 만 6000 회의 모의선거를 통해 오바마의 스윙 주 승률을 계산하고 자원 분배를 지도할 수 있다. 이 데이터 마이닝 팀은 오바마의 성공적인 연임에 기여했다. 롬니 경선팀에 비해 오바마 경선팀의 가장 큰 장점은 빅 데이터 통합이다. 오바마의 데이터 마이닝 팀도 전 세계에 동일한 문제가 있다는 것을 깨달았습니다. 즉, 데이터가 너무 많은 데이터베이스에 분산되어 있다는 것입니다. 이에 따라 지난 18 개월 동안 오바마 경선팀은 여론조사자, 기증자, 현장 직원, 소비자 데이터베이스, 소셜미디어, 스윙 주 주요 민주당 유권자들의 정보를 통합하는 단일 방대한 데이터 시스템을 만들었습니다. 이 방대한 종합 데이터베이스는 선거팀에게 유권자를 찾아 관심을 받는 방법을 알려줄 뿐만 아니라, 데이터 처리팀이 어떤 부류의 사람들이 어떤 특정한 일에 설득될 수 있는지를 예측하는 데도 도움이 된다. 전투 지휘관인 짐 메시나가 말했듯이, 전체 전투에서 데이터 지원이 없다는 가정은 거의 없다.

2065438+2002 년 3 월, 미국 오바마 정부는' 빅 데이터 연구 및 개발 계획' 을 시작하기 위해 2 억 달러를 투입해 빅 데이터 연구를 국가적 의지로 끌어올려 빅 데이터 통합에 큰 영향을 미쳤다고 발표했다. 한 나라의 데이터 규모와 데이터 운용 능력은 종합 국력의 중요한 부분이 될 것이다. 중국 스마트 도시의 건설 목표 중 하나는 데이터 집중 공유를 실현하는 것이다.

데이터로 가치를 창출하려면 협력공승의 비즈니스 모델이 필요하다.

클라우드 컴퓨팅, 빅 데이터 기술 및 관련 비즈니스 환경이 성숙함에 따라 점점 더 많은 "소프트웨어 개발자" 가 업계 간 대형 데이터 플랫폼을 활용하여 혁신적인 빅 데이터 애플리케이션을 만들고 있으며, 이 임계 값은 감소하고 있습니다. 먼저, 데이터 소유자가 이런 일을 하고자 하기 때문에 적은 비용으로 추가 수입을 얻고 수익성을 높일 수 있습니다. 둘째, 대형 데이터 장비 업체들은 소비자들이 장비를 구입하도록 유도하기 위해 응용해야 하기 때문에, 윈-윈 협력 관계를 발전시키는 것이 단순한 장비 판매보다 더 많은 돈을 벌 수 있기 때문이다. 일부 선견지명이 있는 제조업체는 자금, 기술 지원 및 주식 보유를 제공하여 이러한 소프트웨어 개발자를 지원하기 시작했습니다. 셋째, 데이터 분석 및 응용에 대한 업계의 세분화에 대한 수요가 커지고 있습니다. 전체 빅 데이터 산업 체인에 대해 혁신적인 산업 데이터 애플리케이션 개발자는 향후 빅 데이터 산업 체인 전체에서 가장 활발한 부분이 될 것입니다.

피할 수 없는 빅 데이터 시대에, 기업의 세 가지 유형은 "빅 데이터 산업 체인" 에서 중요 한 위치에 있을 것입니다: 대량 효율적인 데이터를 가진 기업, 강력한 데이터 분석 기능을 가진 기업, 혁신적인 기능을 가진 "소프트웨어 개발자". 소셜네트워크, 모바일 인터넷, 정보기업, 통신사업자들은 모두 방대한 데이터의 생산자이다. 페이스북은 8 억 5 천만 명, 타오바오는 3 억 7 천만 명 이상의 등록자를 보유하고 있으며, 텐센트의 위챗 사용자는 이미 3 억 명을 넘어섰다. 이러한 방대한 사용자 집단이 제공하는 데이터는 엄청난 상업적 에너지를 방출할 시기를 기다리고 있다. 가까운 장래에 페이스북, 텐센트, 통신사업자 등 방대한 데이터 보유자가 자신을 데이터 분석 공급업체로 발전시키거나 IBM, 중흥 등과 긴밀하게 연계해 상하 협력업체가 될 것으로 예상된다. 빅데이터 산업 체인은 어떤 폭발점이 되면 놀라운 속도로 성장할 것이다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), Northern Exposure (미국 TV 드라마), 성공명언)

큰 데이터의 위험성을 경계하다

빅 데이터 시대에 전통적인 무작위 샘플링은 "모든 데이터 수집" 으로 대체되었으며, 사람들의 사고 결정 모델은 "무엇" 에 따라 직접 결론을 내릴 수 있습니다. 이 결론은 개인의 감정, 심리적 동기, 샘플링 정확도 등의 요인들의 간섭을 배제하기 때문에 더욱 정확하고 예측 가능합니다. 그러나 큰 데이터는 데이터 수집에 지나치게 의존하기 때문에 데이터 자체에 문제가 발생할 경우 "치명적인 큰 데이터" 가 발생할 가능성이 높습니다. 즉, 데이터 자체의 문제로 인해 잘못된 예측과 의사 결정이 발생할 수 있습니다.

빅 데이터의 이론은 "짚 더미에서 바늘을 찾는 것" 이지만, "모든 짚이 그 바늘처럼 보이면?" 진위와 가치를 분간할 수 없는 정보가 너무 많아 정보가 너무 적은 것처럼 즉각적인 판단이 필요한 상황에도 해로울 수 있으며, 일단 판단이 잘못되면 심각한 결과를 초래할 수 있다. 빅 데이터 이론의 기초는' 대량 데이터는 사실이다' 인데, 만약 데이터 제공자가 허위로 날조한다면 어떻게 할 것인가? 이는 데이터 제공자와 수집자 자체의 편견과 필터링을 통제할 수 없기 때문에 빅 데이터 시대에 더욱 해로워졌습니다. 가장 완벽한 데이터베이스, 가장 먼저' 빅 데이터' 개념을 받아들이는 월스트리트 투항과 유럽의 주요 평가 기관들은 중대한 문제에 대한 판단에서 실수를 하는 경우가 많기 때문에 그 자체로' 빅 데이터' 의 한계를 드러낸다.

뿐만 아니라, 빅데이터 시대는 데이터 유출이 국익, 공익, 개인의 프라이버시를 손상시키는 것을 어떻게 막을 수 있는지에 대한 전례 없는 압력과 책임에 직면해 있는 데이터베이스 유비쿼터스 세계를 창조했습니다. 어떻게 정보 불평등을 피하고 약자 집단의 이익을 손상시킬 수 있습니까? 위험을 효과적으로 통제하기 전에 큰 데이터를' 새장' 에 가두는 것이 좋을 것 같다.

빅데이터의 경제적 가치는 이미 사람들에게 알려지고 있고, 빅데이터의 기술도 점차 성숙해지고 있다. 일단 데이터 통합과 규제가 완료되면, 빅데이터 폭발 시대가 도래할 것이다. 우리가해야 할 일은 우리 자신의 방향을 선택하고 큰 데이터의 도착을 미리 준비하는 것입니다.

변쇼가 공유하는 발전 빅데이터의 세 가지 필수조건이다. 더 많은 정보는 글로벌 아이비리그 더 많은 건화물 공유에 집중할 수 있다.

copyright 2024회사기업대전