빅 데이터 사고를 중요하게 생각하면서 전체 데이터 모델에 대한 오해, 양적 사고에 대한 불안, 관련성에 대한 과도한 숭배와 같은 한계를 이성적으로 다루어야 합니다. 전반적으로 양적 통합의 질적, 인과는 관련 상호 보완을 강조하여 빅 데이터 사고의 초월을 실현해야 한다. (윌리엄 셰익스피어, 윈스턴, 양적, 양적 통합, 양적 통합, 양적 통합, 양적 통합, 양적 통합)
차세대 정보기술의 급속한 발전, 특히 모바일 인터넷, 빅 데이터, 클라우드 컴퓨팅, 스마트 웨어러블 등의 기술이 널리 보급되면서 데이터가 폭발적으로 증가하면서 인간 사회는 데이터 중심의 빅 데이터 시대로 접어들었다. "모든 것이 기록되고 모든 것이 분석되는 디지털 시대의 도래는 막을 수 없다." [1] 10 의 큰 데이터 환경에서 데이터는 경제사회 발전을 주도하고 더 큰 경제적 사회적 효과를 창출하는' 새로운 에너지' 가 된다. 과학 연구 분야에서 컴퓨터 과학 튜링상 수상자인 짐 그레이는 과학 연구의' 제 4 패러다임' 즉 데이터 집약적인 컴퓨팅을 기반으로 한 연구 패러다임을 제시했다. 이런 맥락에서' 모든 것을 정량화하다',' 데이터를 말하게 하다' 는 시대적 구호가 되었다. 사람들은' 모든 데이터가 샘플을 대체한다' 는 전체적인 사고에 더 집중하고' 양적 대체정성' 을 추구하는 정량적 사고를 추구하며' 관련성 대체인과성' 과 관련된 사고를 강조한다. 이는 규칙성, 인과성, 샘플링 방법을 추구함으로써 사물 간의 관계를 파악하는 전통적인 사고에 큰 영향을 미쳤다. 그러나 어떤 것이든 대립 통일이다. 현재의 빅 데이터 사고 열풍에서는 이성 유지, 변증적 사고 변화, 그 한계를 진지하게 받아들이고, 보완적인 길을 탐구하며, 사고 차원에서 빅 데이터 시대의 생존 발전에 더 잘 적응할 필요가 있다.
1 빅 데이터 사고의 한계
1. 전체 데이터 패턴에 대한 오해
다양한 센서와 지능형 장치가 보급됨에 따라 사물에 대한 실시간 모니터링과 데이터 수집 전송을 실현할 수 있으며, 사물에서 얻은 데이터는 단순한 샘플 데이터가 아니라 모든 데이터입니다. 이 모델을 "전체 데이터 모드" 라고 합니다. 전체 데이터 모델을 기반으로 사물의 특성과 속성을 보다 포괄적으로 분석하고 파악할 수 있으며 보다 객관적이고 과학적인 의사 결정에 도움이 됩니다. 그러나 전체 데이터 모델의 경우, 일부 학자들은 "N = all" 이 종종 현실이 아니라 데이터의 가정이라고 제안한다. 따라서 데이터를 충분히 추구하는 동시에 필요한 퇴고가 필요하다.
첫째, 우리는 점차 데이터 폭발적 성장과 기술 낙후라는 모순에 빠져들고 있다. 큰 데이터 환경에서는 데이터가 정적이 아닌 빠르게 변화하고 있습니다. IBM 에 따르면 매일 새로 생성되는 데이터의 양은 2.5 * 10 18 바이트로 추산됩니다. 1 입방미터의 물을 1 바이트와 비교하면, 그 데이터의 양은 지구의 총 저수량보다 더 크다. 1.42 * 10 18 입방미터인18 입방미터이다 데이터 기술 수준이 빠르게 높아져도 데이터 증가 속도보다 뒤처져 있습니다. "모든 데이터를 수집하고 기술로 분석하는 경우에도 점과 점 사이의 관계를 파악하거나 국부적인 상관관계를 파악할 수 밖에 없습니다. 그러나 이것이 사물의 보편적인 법칙과 추세를 이끌어 낼 수 있다는 것을 의미하지는 않는다. " 이것은 기술의 상대적 지연이 전체 데이터 패턴의 구현을 방해한다는 것을 보여준다.
둘째, "고립된 데이터" 의 객관적인 존재는 "전체 데이터 스키마" 의 구현을 제한합니다. "전체 데이터 모드" 를 구현하려면 데이터 개방 및 * * * 공유가 필요합니다. 데이터의 가치가 기업과 정부에 알려지면서 데이터 개방과 공유는 어느 정도 성과를 거두었지만, 지금까지 데이터 자원의 유통 채널은 아직 완전히 통하지 않았으며' 데이터 섬' 문제는 어느 정도 남아 있다. 주요 성과는: 첫째, 업계 간 데이터 흐름이 실제로 실현되지 않았다는 것이다. 기업과 정부는 데이터의 잠재적 가치를 인식한 후 부서 간 또는 부서 내 데이터 자원의 흐름을 신속하게 실현하여 조직의 편리한 발전을 용이하게 합니다. 그러나 각 데이터 주체의 이익에 따라 부서 간, 부서 내 데이터는 진정한 상호 흐름을 실현하지 못하고 있어' 데이터 섬' 에서 또 하나의 시급한 문제가 되고 있다. 둘째, 데이터 거래 시장의 출현으로' 데이터 섬' 의 형성이 어느 정도 심화되고 있다. 이익에 따라 데이터 판매를 수익 모델로 하는 신흥 기업은 수집한 데이터의 기밀성을 높일 수밖에 없으며, 이러한 심리와 행동으로 인해' 데이터 섬' 문제가 더욱 두드러질 수 있습니다. 셋째, 기업 도킹 속도가 느리고 데이터 업데이트 속도가 빨라' 데이터 섬' 문제가 두드러진다. 기술의 발전 속도가 데이터의 성장 속도를 따라잡지 못하고, 데이터 업데이트가 느리기 때문에, 신구 데이터의 * * * 는 사람들의 시야를 "눈 멀게" 하여 새로운 차원의 "데이터 섬" 으로 이어질 수 있기 때문이다. 따라서 소위 "전체 데이터 모델" 은 우리가 기대하는 이상적인 상태가 될 수 있으며, 데이터 기술 발전에 의해 구축된 새로운 유토피아가 되어 정보 사회의 투영인 플라톤의 동굴 그림자가 될 수 있습니다.
마지막으로, 빅 데이터의 핵심 가치는' 대' 와' 전체' 가 아니라' 유용' 입니다. 전체 데이터 패턴을 추구하면 모든 데이터를 얻을 수 있는 한 더 많은 데이터 가치를 발굴할 수 있다는 착각을 불러일으킬 수 있다. 현재 가치를 발굴할 수 있는 데이터의 대부분은 컴퓨터가 인식할 수 있는 구조화된 데이터이지만, 전체 데이터 세계에서 가장 중요한 데이터는 문서가 인식하지 못하는 구조화되지 않은 데이터를 기반으로 합니다. 20 14, 비정형 데이터가 전체 데이터의 80% 이상, 20 15, 85% 이상 차지. 또한 비정형 데이터의 증가율은 정형 데이터의 두 배 이상입니다. 이로 인해 일부 구조화되지 않은 데이터는 "데이터 가비지" 로 인식되지 않아 인식되지 않아 폐기됩니다. 이렇게 하면 우리가' 전체 데이터 패턴' 이라고 부르는 실현이 더욱 어려워질 것이다.
2. 양적 사고 불안
빅 데이터 시대에 자연과 인간 사회의 모든 현상과 행동 변화는 디지털화되어 "모든 것을 정량화" 할 수 있습니다. 동시에, 정량적 사고에서 몇 가지 문제에 주의해야 한다. 온톨로지와 방법의 결함 오늘날의 빅 데이터 시대에 모든 인간 활동은 데이터의 흔적을 남기고 전 세계는 점차 디지털 세계로 진화 할 것이며 데이터 세계관은 계속 강조 될 것입니다. 데이터 세계관의 지도 아래' 모든 것을 수량화' 하는 것이 빅 데이터 시대의 방법론이 되었다. 철학자들도 데이터와 세계의 관계를 반성하기 시작했고, 심지어' 세계의 기원은 데이터다' 라는 결론을 내리기도 했다. 그러나 데이터는 세계의 온톨로지가 되었습니까? 우리는 이런 생각이 생기는 것은 주로 데이터의 본질에 대한 인식이 편향되어 있기 때문에 신중히 고려해야 한다고 생각한다.
첫째, 빅 데이터의 데이터 소스는 주로 사회 생활에서 의식적이거나 무의식적인 행동에 기반을 두고 있다. 즉, 빅데이터는 사람들의 사회생활에서 감성적 객관적 활동의 객관적 존재를 수량화하는 양적 반영이며,' 모든 것을 수량화' 는 빅 데이터 시대에 사물을 인식하는 이상적인 방식이다. 그래서 본질적으로, 데이터의 출처는 객관적인 물질 세계이다. 물질적인 세계가 없다면 데이터는' 수동적인 물, 본본이 없는 나무' 가 될 것이다.
둘째,' 만물 정량화' 의 주요 목적은 과거의 감성적 객관적 활동으로 인한 데이터를 수집, 전송, 저장 및 분석하여 사람들의 행동에 개입하고 지도하는 것이다. 그 주된 역할은 예측의 객관성과 과학성을 제고하고 인간의 주관적 능동성과 창조성을 충분히 발휘하는 것이다. 그러나이 "모든 것을 정량화하는" 이상적인 방법은 "데이터는 인간 사회 생활의 정적 데이터" 라는 것을 깨닫지만 "인간 사회 생활은 역동적 인 데이터" 라는 객관적인 사실을 무시합니다. 그것은 전체 인간 사회 생활을 생명력이 없는 정적 데이터 세트로 보고, 자연계와 인류 사회 전체의 많은 현상을 간과하는 것은 순식간에 변화하고 복잡하게 얽혀 있다.
(2) 개인적인 행동은 "선택됨"
양적 예측은 개인의 행동을 "선택" 시킬 수 있다. 빅데이터 기술을 바탕으로 사람의 행동, 태도, 성격을 정량화하여 분석하고 처리하면, 사람들이 이른바 적합한 결혼 상대를 찾도록 예측하고 도울 수 있지만, 시스템이 개인을 위해 찾은 이 대상이 가장 적합한지 물어볼 수도 있다. 데이터의 양적 분석에 따라 이런 선택을 한다면 개인의 직관과 느낌을 버려야 하는가? 우리는 선택의 권리를 포기할 것인가, 아니면 제도를 따라 우리를' 선택' 시킬 것인가? 또 다른 관점에서 볼 때, 이것은 감성과 이성 관계에 대한 이해이다. 감각, 영감 등 감성적 요소는 인간의 생명 초창기의 유일한 것으로, 인류가 자연과 사회에 대한 가장 본능적인 직관이다. 이성은 감성을 바탕으로 점차 발전하기 시작했다. 사람들은 이성에 더 많은 관심을 기울이고 있는데, 주로 이성은 논리가 명확하고 엄격하기 때문에 쉽게 파악할 수 있고 감성은 불확실성으로 인해 쉽게 간과되기 때문이다. (윌리엄 셰익스피어, 이성, 이성, 이성, 이성, 이성, 이성) 하지만 이 때문에 이성은 한계가 있고 감성은 그 표현의 불확실성으로 무한히 뻗어나가고, 끊임없이 변화하는 세계에 가장 본능적으로 직관적으로 반응할 수 있다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 이성명언) 우리는 대데이터 분석을 바탕으로 소위 적합한 연애나 결혼 상대를 찾는 것에 대해 의심을 품고 있다. 인간의 뇌가 컴퓨터로 대체될 수 없는 것처럼 감성도 이성으로 대체될 수 없기 때문이다.
빅데이터 분석 예측의 대상은 좋은 선택일 수 있지만, 반드시 적합하거나 최선의 선택일 필요는 없다. 이런 예측은 실제로 개인의 선택의 자유에 어느 정도 영향을 미쳤다.
(3) 데이터 독재의 심화
양적 예측은' 데이터 독재' 를 악화시킨다. 디지털 사고의 핵심은 정량화 또는 "데이터로 말하기" 입니다. 정량 분석을 통한 성공 예측은 데이터 자산에 대한 의존도를 더욱 높일 수 있다. 월마트가' 맥주와 기저귀' 라고 부르는 성공 이야기는 경험적이다. 오늘날 기업과 정부는 특히 의사 결정 과정에서 데이터의 역할에 더 많은 관심을 기울이고 있습니다. 데이터 부족은 설득력을 크게 떨어뜨릴 것으로 보인다. 정부가 데이터에 근거하여 어떤 결정을 내리면, 반대의 결과를 초래할 수 있다. 예를 들어, 올해 GDP 는 6%, 작년은 6.3% 로 작년보다 0.3% 낮았는데, 올해 경제가 작년보다 반드시 나쁘다는 결론을 내릴 수 있을까? 분명히, 이 수치만을 근거로 이런 평가를 하는 것은 객관적이지 않다. 인터넷 철학자 예브게니 모로조프 (Yevgeny Morozov) 는 많은' 빅 데이터' 응용 프로그램 뒤의 이데올로기를 예리하게 비판하며' 데이터 폭정' 이 곧 발생할 것이라고 경고했다. "말은 의도가 없고 문맥에서 오는 것이다." 따라서 데이터 분석 및 예측은 해당 장면과 연관되어야 합니다. 그렇지 않으면 "모호함" 이 나타납니다.
(4) 프라이버시 엿보기 및 도덕적 고문
모든 것을 정량화하다' 는 것은 개인의 사생활을 더욱 폭로하고, 양적 예측은 때때로 도덕윤리에 위배되는 경우가 있다. 첫째, 개인 사생활이 햇빛에 노출된다. 웨어러블 도구, 스마트 칩 등 스마트 기기의 응용으로 모든 사람의 행동을 실시간으로 모니터링할 수 있다. 우리는' 세 번째 눈' 의 감시하에 한 점도 걸치지 않고' 투명인' 이 되었다. 예를 들어, 다양한 의료 센서는 개인의 생리적 변화를 실시간으로 모니터링할 수 있다. 둘째, 디지털 프라이버시의 유출은 사회적 차별을 심화시켰다. 개인 행위의 디지털화에 따라 데이터 이익의 지도 하에 프라이버시 유출이 발생하기 쉬우므로 사회의 차별도 심화될 수 있다. 예를 들어, 병원에서 개인 의료 데이터를 유출한 결과, 누군가가 에이즈 바이러스를 가지고 있다는 것을 알 수 있으며, 사람들은 색안경을 끼고 그 사람을 바라보면서 심리적 불균형, 생활 장애, 취업난 등을 초래하고 있다. 개인의 인권 침해 외에도 사회적 차별의 정도가 더욱 심화되고 있다. 마지막으로, 빅 데이터 예측은 때때로 인간 도덕에 위배됩니다. 모두 알다시피, Target 은 임산부 제품의 개인 브라우징과 구입에 기반한 데이터 분석을 통해 소녀의 임신 시기를 미리 예측하고 관련 임신제품 쿠폰을 여자에게 줄 수 있는 프로젝트 분석을 하고 있지만, 소녀의 아버지는 알지 못하여, 알고 나서 매니저를 욕했다. 이 일 뒤에는 두 가지 질문이 있다. 하나는 회사가 여자아이가 임신했다는 것을 어떻게 알게 되었는가? 개인 사생활은 어떻게 유출되었습니까? 반면에, 우리의 프라이버시는 엿보는 것이며, 개인이 알지 못하고 동의하지 않을 때 얻어지는 것이며, 이는 개인을 당황하게 할 뿐만 아니라 법을 어기게 한다. 둘째, 아버지는 여자아이로서 가장 가까운 사람으로서 아직 이 일을 알지 못했지만 회사는 이미 쿠폰을 알고 먼저 밀었다. 이것은 다른 사람에 대한 불경입니까? 도덕윤리에 어긋나는가? 관련 윤리 문제는 반성할 만하다.
3. 상관관계의 과도한 사용
빅 데이터의 핵심 사고는 연관 사고이지만, 연관 사고도 생활 관행에서 과도한 숭배의 문제를 야기한다. 사람들이 우상화 관련 사고를 하는 데에는 몇 가지 이유가 있다. 첫째, 대량의 데이터의 존재로 인해 사람들이 수많은 지저분한 데이터로부터 진정으로 가치 있는 것을 직접 발굴할 수 없기 때문에, 사람들은 통계적 관련성 분석을 통해서만 사물 간의 연관성을 얻을 수 있다. 그리고 배후의 진정한' 지식' 을 더 발굴할 수 있다. 둘째, 매우 복잡하고 불확실한 시대적 맥락에서 사람들이 사물 사이의 인과관계를 탐구하는 것은 더욱 어렵다. 복잡성 과학은 세상이 복잡하고 보편적이라는 것을 알려 주는데, 이를 통해 우리는 복잡한 사고방식으로 세상을 바라보고 인류 사회 전체를 하나로 파악하고 연구해야 한다. (존 F. 케네디, 과학명언) 연관 사고는 거시적인 관점에서 사물의 연관성을 파악함으로써, 연관 사고에 대한 숭배가 심화되었다. 마지막으로 급변하는 환경에서는 관련성 분석이 기업 경영의 논리에 더 적합합니다. 즉, 형식만 중시하고 원인은 찾지 않습니다. 실제 상업 활동의 경우 가장 짧은 시간 내에 가장 낮은 비용으로 최대의 이윤을 얻는 것을 추구함으로써 관련 사고에 대한 기업의 과도한 숭배가 더욱 심화되고 있다. "빅 데이터의 본질은 통계적 상관 관계입니다. 현상상으로 볼 때 고전 과학의 통계 법칙과 일치하며, 이것도 그들이 동일하거나 곤혹스러운 곳이다. "[2]. 그러나 종속성 분석을 사용할 때 주의해야 할 두 가지 문제가 있습니다. 첫째, 종속성 분석의 핵심은 "관련 대상" 을 찾는 것입니다. 데이터의 양이 증가함에 따라 데이터의 폭과 깊이도 지속적으로 확대되고 있으며, 무의미한 중복과 쓰레기 데이터가 많아지면서 더 많은 데이터 소음이 발생하고 진정한 가치 있는 데이터가 물에 잠기고 있습니다. 복잡한 데이터 소음에서 "상관 관계" 를 찾는 방법은 빅 데이터 분석에서 해결해야 할 중요한 문제입니다. 둘째, 의사 연관과 의사 연관의 객관적인 존재는 큰 데이터 분석의 난점이다. 통계학적으로는 여러 가지가 있는데, 양수 및 음수 관련, 강한 관련 및 약한 관련, 거짓 관련 및 거짓 관련 등이 있습니다. 허위 관계 등 관련 관계는 잘못된 분석 결과를 초래하고 심각한 결과를 초래할 수 있다. 구글 독감 시스템의 몇 가지 독감 예측 오류가 이를 증명한다. 허위 연관 등 관련 관계를 어떻게 식별하느냐가 빅 데이터 분석에서 돌파해야 할 난점이다. 사물을 찾는 인과 관계는 인류의 오랜 사유 정세와 습관이자 사물의 내면적 본질을 파악하는 데 필요한 수단이다. 유명한 과학 철학자 라이싱바흐는 "인과 관계 없이는 연관이 없다" 고 생각한다. 관련 사고에 대한 맹목적인 숭배를 방지하고, 빅 데이터 사고의 한계를 돌파하며, 보완 사고를 이용하여 빅 데이터 사고의 한계를 뛰어넘는 데 주의해야 한다.
2 상보성에서 빅 데이터 사고의 초월을 실현하다.
1. 총괄적으로 병행하다
전체와 부분은 객관적인 사물의 분리성과 통일성을 상징하는 철학적 범주로 중요한 인식론적 의의를 가지고 있다. 방법 론적 관점에서 볼 때, "전체 데이터 모델" 은 복원 방법보다는 전반적인 방법을 사용하여 사물을 파악하는 데 중점을 둡니다. 따라서' 전체 데이터 패턴' 의 한계를 극복하기 위해서는 전체와 시스템 파악에 집중해야 한다. 두 부분을 병행하여 이해를 깊게 하다. 전체 방법과 복원 방법의 통일을 실현하다.
첫째, 전체에주의를 기울이고 체계적으로 파악하십시오. 고전 시스템론은 모든 것을 하나의 유기적 전체로 보고 전체적인 특징과 기능을 파악해야 한다고 생각한다. 또한 복잡성 과학은 세계가 복잡하고 변화무쌍하다고 생각하는데, 이를 위해서는 복잡한 물체를 전체적으로 파악할 수 있는 전체적인 안목이 있어야 한다. 빅 데이터 시대에 우리가해야 할 일은 모든 데이터를 전체로 사용하고, 기계와 모델링을 사용하여 데이터 간의 연결을 찾고, "관련 대상" 을 찾고, 데이터 뒤에 반영된 것들의 전반적인 속성을 파악하고, 사물의 내부 요소 간의 구조와 관계를 더 분석하고, 요소 간의 인과 관계를 깊이 파고, 구체적으로 사물을 완전히 이해하는 것입니다.
둘째, 두 부분을 병행하여 이해를 깊게 한다. 전통적인 복원론은 사물이 서로 다른 부분으로 나뉘며, 전체에 대한 이해는 각 부분에 대한 이해와 통합을 통해 이뤄질 수 있다고 생각한다. 전통적인 환원론에도 사물의 각 부분 간의 상호 연결과 상호 작용을 무시하는 결함이 있지만, 그렇다고 환원론이 무용지물이라는 뜻은 아니며, 복원 방법은 사물에 대한 전반적인 인식을 없애지는 않는다. 연구 전략에서 복원론의 사상은 주로 층별 분석 전략에 나타난다. 그러므로 복잡한 시대에, 좋은 복원법을 사용하는 열쇠는 인지적 복원의 수준에 있다.
빅 데이터 시대에는 데이터가 크고 구조가 복잡하기 때문에 데이터 간의 인과 관계를 찾기가 어려웠습니다. 그래서 우리는 전체 데이터를 하나의 전체로 삼아 그 연관성을 파악하지만, 데이터 물화의 전체적인 본질은 무엇입니까? 그런 다음 내부 요소 간의 인과 논리를 더 분석해야 하는데, 이는 본질적으로 귀약 방법을 사용한다. 이런 의미에서 인과 논리 탐구는 귀약 방법의 구체적인 표현이지만, 이런 귀약 방법은 전통적인 귀약 방법과는 다르다. 따라서 "복원법과 전체법의 복잡한 관계는 결국' 상보성' 이어야 한다." 현대 과학의 발전은 또한 "복원론은 충분하지 않다, 복원론만으로는 충분하지 않다" 는 것을 보여준다. 전체주의도, 전체주의도 ... 과학적 태도는 환원론과 전체론을 결합하는 것이다. 전체와 부분 사이의 변증 관계를 충분히 이해하고, 전체적 방법과 복원 방법의 복잡한 관계를 충분히 이해해야만 이 도구로 세상을 인식하고 개조할 수 있다.
2. 양적 통합 및 질적 통합
정량 연구의 목적은 사물과 그 운동의 양적 속성에 대답하는 것이고, 질적 연구의 목적은 대상의 구체적인 특징이나 행동을 깊이 연구하고 그 원인을 더 탐구하는 것이다. 내용상 정성연구와 정량연구는 통일되고 보완적이어야 한다. 정성연구는 정량연구의 기초를 마련하고 정량연구의 기초이다. 정량 연구는 질적 연구의 구체화로, 질적 연구를 더욱 과학적이고 정확하게 하여 더욱 광범위하고 심층적인 결론을 도출한다. 양자는 서로 다른 각도에서 문제를 분석하는 데 장점이 있으며, 이 때문에 사물에 대한 더 포괄적인 인식을 얻을 수 있다. 따라서 과학 연구에서, 우리는 양자를 결합하고, 장점을 취하여 단점을 보완하고, 최대의 효과를 발휘해야 한다. 우선, 양에 대한 전반적인 파악은 질적 연구의 기초이다. 빅 데이터 환경에서 "모든 것을 정량화" 하는 중요한 역할은 주로 세 가지 이유에 기반을 두고 있습니다. 첫째, 대량 데이터는 "모든 것을 정량화" 할 수 있습니다. 다양한 지능형 장치의 응용 프로그램을 기반으로 사람들의 물리적 세계와 가상 세계를 정량화할 수 있습니다. 감성 객체에 대한 데이터 분석을 통해 양적 상관 계수가 나타내는 상관 관계에서 데이터 간의 상관 관계를 발견하고, 데이터 간의 상관 관계를 파악하며, 데이터의 물화 정도를 결정할 수 있습니다. 둘째,' 모든 것을 수량화' 하는 것은 우리가 양적으로 사물을 파악하는 데 도움이 된다. 정량 분석을 통해, 우리는 수량적으로 사물의 무결성에 대한 전반적인 인식을 가질 수 있는데, 이런 전체성의 인식은 질적 연구의 의미에서 사물에 대한 추상적인 일반적인 인식이 아니라, 구체적 사물에 대한 관련성이 있는 구체적 인식, 즉 완전히 새로운 전체적인 그림을 만들 수 있다. 셋째, 빅데이터의 본질 자체는 수량관계의 집합이며 현실적인 지도의 의미를 가지고 있다. 알베르트 라스로 바라바스 (Albert-laszlo Barabas) 는 "인류의 93% 는 예측할 수 있지만 과거에는 관련 자료도 없고 인간의 행동을 탐구할 방법도 없었다" 고 지적했다. 따라서 정량 연구는 사물 사이의 연관 추세를 파악하는 데 중요한 역할을 한다. 둘째, 질적 인과연구는 새로운 관계를 만들어 새로운 수요를 만족시켰다. 빅 데이터의 정량 분석을 통해 전체적으로 사물의 관련성을 파악할 수는 있지만 둘 사이의 인과 관계를 명확히 할 수는 없습니다. 인과 관계는 요소 간의 상호 작용 과정과 그 효과 사이의 관계이다. 따라서, 수량 차원에서 관련 사물을 파악하는 기초 위에서 사물의 내부 요소의 구조와 조합을 깊이 연구하고, 내부 요소의 인과관계를 탐구하고, 요소 간의 상호 작용을 바꾸고, 인간 발전의 필요를 결합하여 사람의 요구에 맞는 결과를 만들어야 한다. 한편, 내부 요소 간의 인과논리에서 발생하는 새로운 인과관계는 정량 연구에서 더 조사하거나 테스트할 수 있다. 이렇게 정량 연구는 질적 연구를 위해 감성 대상의 전체 수량 속성과 일반 구조를 제공한다. 이를 바탕으로 질적 연구는 요소 간의 상호 작용을 심도 있게 탐구하고 대표적인 결론을 도출한 다음, 양적 연구를 위해 전체 데이터를 넣어 실증하여 양적 및 질적 연구의 보완성을 달성한다.
3. 인과관계는 빅데이터 시대의 맥락에서 훈버그가 "무엇이 충분한지, 왜 그런지 알 필요가 없다" 고 제안했다. 그 이후로 사람들은 인과성보다는 관련성에 더 많은 관심을 기울였다. 그러나 인류 사회 전체가 상관관계에 적극적으로 관심을 갖는 동시에 인과관계의 중요성과 영향을 반성하고 재평가해야 하는 것은 불가피하다. 우리는 의문을 제기하지 않을 수 없다: 첫째, 세상에 인과 관계의 본체론 문제가 있는가? 둘째, 관련성과 인과 관계의 관계는 무엇입니까? 셋째, 과학 연구가 어떻게 상호 보완적인가? 인과관계의 본체론에 대하여 우리는 인과관계가 객관적으로 존재한다고 생각한다. 인과 사고는 인류가 오랫동안 형성해 온 사고 습관이자 우리가 세계의 본질을 이해하는 논리적 전제이다. 현대에서 자연과학과 인문사회과학의 연구 성과는 인과관계의 엄격한 수리논리추론을 바탕으로 하고, 자연과학의 중심 임무는 사물 사이의 인과관계를 밝히는 것이다. 인과관계와 상관관계의 관계에 대해 일부 학자들은 빅 데이터 시대의 맥락에서 과학기술 관계의 반영이라고 생각한다. 과학은 인과관계를 탐구하는 학문, 즉 인과율, 기술은 문제를 해결하는 방법과 기교다. 양자의 중점은 다르지만 결코 대립하지 않는다. 기술이' 어떻게 하는가' 를 해결하는 것처럼 과학은' 왜' 라고 대답하고, 상관관계는 우리가 실천에서' 어떻게 하는가' 를 지도할 수 있고, 인과성은' 왜 해야 하는가' 라고 대답할 수 있다. 빅 데이터 시대는 관련성에 더 많은 관심을 기울이더라도 인과적 추구와 불가분의 관계에 있다. 이는 사고의 본질적인 결정이다. 상관관계 분석에 치중하는 것은 인과관계 분석을 부정하는 것이 아니다. 인과관계가 중요하지 않다는 것을 의미하는 것이 아니라 인과관계의 심도 있는 분석에 더 유리하다. 둘 다 배척하는 것이 아니라 공존하기 때문이다. 우리는 과학 연구에서 우세를 보완할 수 있다. 첫째, 상관 관계는 인과 관계 연구의 기초입니다. 빅 데이터 시대에, 우리는 거 대 한 데이터를 기반으로 상관 관계 분석을 통해, 신속 하 고 편리 하 고 정확 하 게 사물의 상관 관계를 찾을 수 있습니다, 그래서 상관 관계의 인과 관계를 탐구 하 고 사물의 본질을 파악. 훈버그가 말했듯이, "연관이 있을 수 있는 것을 찾아내면 인과관계를 더 분석할 수 있고, 인과관계가 있다면 원인을 더 찾아낼 수 있다" 고 말했다. 피쳐 연관성을 찾는 과정에서 인과관계 분석도 있다.
둘째, 인과성은 관련성의 내재적 규정과 목표이다. 과학 연구 분야에서, 우리가 추구하는 것은 단지' 무엇' 의 연관성을 아는 것이 아니라, 더욱 중요한 것은 사물 사이의' 왜' 의 인과관계를 명확히 하여 이로부터 건립된 과학 이론이 실천의 검증을 견딜 수 있게 하는 것이다. 이런 의미에서 인과관계는 빅데이터 시대 관계관계의 내재적이고 본질적인 규정이자 관계관계 뒤에서 추구하는 목표로 결정적인 역할을 한다. 우리가 해야 할 일은 인과적 사고를 연구 기초로, 관련 사고를 연구 지향으로 삼고, 양자를 보완하고, 큰 데이터에 함축된 가치를 발굴하고, 큰 데이터 사고의 초월을 실현하는 것이다.
댓글을 환영합니다.
소환령
학술 묘기를 가지고 가능한 한 빨리 와라!
1, 학술 수준: 특정 전문 학술 수준이 필요합니다!
2, 독특한 견해를 가지고 있습니다: 깊이, 폭, 날카로운 것이 최고입니다!
3, 콘텐츠 클래스: 자연 과학, 사회 과학 등. 제한 없음!
4. 자료 또는 번역 문장: 위 조건을 충족하는 한 가능합니다.
학술 상담/제출 이메일 주소
선언: 저작권은 원작자가 소유합니다. 문장 관점은 본 기관의 입장을 대표하지 않는다.
"중국 전자과학연구원 학보" 는 전문가와 학자의 투고를 환영합니다! 링크 ki.net 을 제출합니다
정기 연락처 전화: 0 10-
저널 e-메일: