"정보 수집" 정보 수집이란 컴퓨터 소프트웨어 기술을 사용하여 맞춤형 대상 데이터 소스를 실시간으로 수집, 추출, 마이닝 및 처리하여 다양한 정보 서비스 시스템에 데이터 입력을 제공하는 전 과정을 말합니다.
인터넷에서 특정 대상 데이터 소스 또는 비특정 대상 데이터 소스를 수집 및 모니터링하고, 정보를 구조화된 방식으로 추출하여 로컬 구조화된 데이터베이스로 저장한 다음 비즈니스 프로세스 요구 사항에 따라 다른 모듈과 결합하여 응용 프로그램을 가져오고 전자 산업 플랫폼에 서비스를 제공해야 합니다.
인터넷 데이터 수집 및 마이닝 기술은 컴퓨터 소프트웨어 기술을 활용하여 맞춤형 대상 데이터 소스를 실시간으로 수집, 추출, 마이닝 및 처리하여 다양한 정보 서비스 시스템에 데이터 입력을 제공하고 비즈니스 요구 사항에 따라 데이터를 게시 및 분석하는 전 과정을 말합니다.
시스템 특징
이 시스템의 가장 큰 특징은 수집 방식의 유연성과 데이터 수집의 정확성이다.
유연성: 모든 복잡한 쿼리 및 페이지 레이아웃을 유연하게 처리할 수 있습니다.
정확도: 결과 데이터 정확도가 높습니다 (99%- 100%).
대상 웹 사이트의 정보를 자동으로 캡처하여 텍스트 정보, URL, 숫자, 날짜, 그림 등 HTML 페이지에서 다양한 데이터 수집을 지원합니다.
사용자 정의 각 정보의 출처 및 분류.
사진과 각종 파일을 다운로드할 수 있습니다.
사용자 이름 및 암호 자동 로그인이 지원됩니다.
명령행 형식을 지원하므로 Windows 작업 스케줄러와 함께 대상 웹 사이트를 정기적으로 추출할 수 있습니다.
고유한 색인을 기록할 수 있으므로 동일한 정보를 반복적으로 체크 인하지 않아도 됩니다.
스마트 교체 기능을 지원하여 광고와 같이 내용에 포함된 모든 관련 부분을 제거할 수 있습니다.
다중 페이지 문장 컨텐츠의 자동 추출 및 병합을 지원합니다.
다음 페이지의 자동 탐색을 지원합니다.
직접 양식 제출 지원
시뮬레이션 제출 양식 지원
작업 스크립트 지원
한 페이지에서 여러 데이터 테이블을 추출할 수 있습니다.
다양한 데이터 후 처리 방법을 지원합니다.
데이터는 파일이 아닌 데이터베이스에 직접 들어가므로 데이터를 사용하는 웹 사이트나 데스크톱 프로그램과 결합되지 않습니다.
데이터베이스 테이블 구조의 완전한 사용자 정의를 지원하여 기존 시스템을 최대한 활용합니다.
다중 열 정보 수집을 지원하여 동일한 구성에서 일대다 처리를 수행할 수 있습니다.
정보의 무결성과 정확성을 보장하고, 절대 깨지지 않는다.
MS SQL Server, Oracle, DB2, MySQL, Sybase, Interbase, MS Access 등 모든 주요 데이터베이스를 지원합니다.