1. 시스템 로그를 통해 큰 데이터를 수집합니다. 지도 정보 수집에 일반적으로 사용되는 도구는 ClouderaFlume, FacebookScribe, LinkedInKafka 등입니다. 이러한 도구는 초당 수백 메가바이트의 로깅 데이터 수집 및 전송 요구 사항을 충족하는 분산 아키텍처입니다.
2. 인터넷을 통해 지도 데이터를 수집합니다. 주로 웹 크롤러 또는 웹 사이트 오픈 API 를 통해 웹 사이트에서 대량의 데이터 정보를 얻고, 웹 사이트의 구조화되지 않은 데이터를 추출하고, 구조화되어 있으며, 로컬에 저장하기로 동의하며, 사진, 오디오, 비디오, 텍스트 등 다양한 형태의 자료 수집을 지원하는 방식을 말합니다.
다른 데이터 수집 방법을 통해. 생산 경영 데이터 또는 학술 연구 데이터 (예: 데이터 기밀 요구 사항이 높은 경우 기업 또는 연구 기관과의 협력을 통해 특정 시스템 인터페이스 등을 사용하여 수집할 수 있습니다.