데이터 정의: 데이터는 문자, 이미지, 사운드, 비디오, 숫자 등 실제 환경에 대한 상징적인 설명입니다. < P > 빅 데이터 시대에 모든 사람들이 데이터에 대해 이야기하고 있습니다. 모두가 데이터가 전략적 자산이라고 말하고 있습니다. 그러나 데이터는 무엇입니까? 먼저 데이터의 정의와 개념에 대한 명확한 이해가 있어야 데이터가 개인, 기업 및 사회에 미치는 가치와 영향을 더 잘 이해할 수 있습니다. < P > 1, 데이터의 개념 < P > 데이터는 실제 (객체, 이벤트, 개념 등) 에 대한 상징적인 설명이며 텍스트, 이미지, 사운드, 비디오, 숫자 등을 설명합니다. < P > 이 정의에서 볼 수 있듯이 데이터는 먼저 텍스트, 숫자, 그래픽, 비디오 등을 포함하는 기호입니다. 둘째, 데이터가 기호이기 때문에 기호에는 적재된 전달체가 있어야 하고, 실제 세계에서 텍스트, 숫자, 그래픽 등을 실을 수 있는 전달체는 다양하다. 옛날에는 석두, 죽간, 종이 등 전달체가 포함돼 정보기술이 발달하면서 디스크, 광 디스크 등 디지털화된 전달체가 등장했다. < P > 데이터의 이러한 정의에 따르면 다음과 같은 일상 생활 곳곳에 데이터가 존재한다는 것을 알 수 있습니다.
(1) 책: 책의 내용은 일종의 데이터이고, 데이터의 전달체는 종이이고, 기호는 텍스트나 이미지이다.
(2) 문점의 상품가격표: 우리가 커피숍에 들어가면 작은 나무판에 각종 커피의 가격이 적혀 있는 것을 자주 볼 수 있습니다. 이것도 일종의 데이터입니다. 데이터의 전달체는 나무판자이고 기호는 텍스트, 숫자, 이미지입니다.
(3) 암석 벽화: 암벽에 새겨진 이미지도 일종의 데이터이고, 전달체는 석두, 기호는 이미지다.
(4) CCTV: CCTV (CCTV): CCTV 도 일종의 데이터이고, 캐리어는 디스크와 같은 디지털 장치이고, 기호는 비디오입니다.
(5) 데이터베이스의 내용: 데이터베이스 테이블에 저장된 데이터, 캐리어는 디스크와 같은 디지털 장치이고 기호는 숫자와 텍스트입니다. < P > 둘째, 데이터의 일반적인 분류 < P > 는 데이터의 호스팅 형식에서 디지털 데이터와 비디지털 데이터 (물리적 원자화 데이터) 로 나눌 수 있습니다. 디지털 데이터는 정보 기술을 사용하는 것을 의미하며, 밑바닥은 과 1 로 표현된 데이터이며, 현재 컴퓨터와 휴대폰에 저장된 데이터는 모두 디지털화된 데이터이다. 비디지털화된 데이터는 물리적 원자로 표현된 데이터 (예: 실제 책, 인쇄된 사진 등) 를 말합니다. 이러한 데이터는 비디지털화된 데이터입니다.
데이터의 구조와 형식을 보면 구조화된 데이터와 구조화되지 않은 데이터로 나눌 수 있습니다. 데이터베이스에 테이블에 저장된 데이터는 구조화된 데이터이며, 테이블의 각 행에 있는 각 열의 데이터는 특정 의미와 유형을 가집니다. 텍스트, 이미지, 오디오, 비디오 등은 모두 구조화되지 않은 데이터입니다. < P > 현재 우리가 이야기하고 있는 큰 데이터, 더 많은 것은 컴퓨터가 처리할 수 있는 디지털 데이터 (디지털 구조화 데이터 및 디지털 구조화되지 않은 데이터 포함) 입니다. < P > 3, 데이터의 본질에 대한 이해
1, 데이터의 본질은 기호이며, 실제 세계에 대한 설명 < P > 데이터는 본질적으로 표현, 인위적으로 창조된 기호 형태, 현실 세계에 대한 설명입니다. 데이터의 범위는 우리가 일반적으로 생각하는 것보다 훨씬 크며 데이터베이스에 저장된 숫자가 데이터라고 쉽게 생각할 수는 없습니다. 책의 내용, 광고판의 내용, 심지어 석두 내용까지 데이터의 범위에 속한다. 다만 데이터 처리 기술, 처리 비용 등을 감안하면 디지털화되지 않은 많은 데이터가 아직 처리 및 분석되지 않았을 뿐이다.
2, 데이터가 현실 세계와 같지 않음
데이터는 현실 세계에 대한 단순화된 설명이며, 현실 세계에 무한히 접근할 수 있을 뿐, 결코 세상을 완전히 반영하지 못한다. 예를 들어, 우리는 사람을 설명하기 위해 데이터를 사용합니다. 이름, 성별, 나이, 국적, 높이, 사진, 성격 설명 등의 정보를 사용하는 경우가 많습니다. 이 데이터를 통해 그 사람의 주요 특징을 반영할 수 있지만 모든 특징이 반영되는 것은 아닙니다. < P > 이 사람을 완벽하게 반영하려면 태어날 때부터 지금까지 경험한 모든 사람과 일을 기록해 머리부터 발끝까지 모든 특징을 묘사해야 한다. 이 상황은 불가능하므로 데이터는 객체를 설명하는 단순화 된 모델이며 무한히 접근 할 수 있습니다.
3, 데이터는 무한합니다. 문제를 해결할 수 있는 데이터는 좋은 데이터입니다. < P > 데이터가 현실 세계에 대한 단순화된 모델이므로 데이터를 기록하고 사용할 때 단순히 데이터의 크고 완전함을 추구하지 말고 문제 해결의 관점에서 어떤 데이터가 필요한지 고려해야 합니다. 문제를 해결할 수 있는 데이터만 좋은 데이터입니다.