"웹 크롤러" 는 "웹 스파이더" 라고도 하며 웹 페이지를 자동으로 추출하는 프로그램입니다. 웹 크롤러의 기술 설정 프로그램을 사용하면 설정된 목표에 따라 관련 웹 페이지 정보를 보다 정확하게 선택하고 수집할 수 있어 인터넷의 방대한 정보에서 유용한 세금 관련 정보를 신속하게 얻을 수 있습니다.
2. "웹 크롤러" 응용 프로그램
웹 파충류 기술을 주도하는 세금 관련 정보 모니터링 플랫폼은 분류 수집, 실시간 모니터링, 지능비의 세 가지 주요 특징을 가지고 있습니다.
플랫폼은 주로 증권재경 웹 사이트에서 상장회사 공고, 상장회사 상위 10 대 주주 지분 감축, 주식 제한 해제 등의 정보를 수집합니다. 풍제어센터 전용 컴퓨터는 하루 종일 실시간으로 관련 정보를 캡처, 저장 및 정리합니다. 플랫폼은 인터넷에서 얻은 정보를 세금 징수 시스템 및 기타 제 3 자 정보와 자동으로 비교하여 세금 위험이 있는 세무사 정보를 선별합니다.
3. 웹 크롤러 프로세스 (자세한 내용은 Caihui.com 참조)
시스템에 들어가면 먼저 인터넷 위험통제센터의 컴퓨터에 연결하고,' 웹 파충류' 프로그램을 이용하여 각 사이트에 게시된 상장회사 공고 정보를 수집하여 인식 가능한 텍스트로 변환한다. 이날 주식시장이 파장하자 스캐너가' 웹 파충류' 가 잡은 공고내용을 스캔하기 시작했다.
스캔에서 국세청이 관리하는 기업명 또는 기타 유효한 정보가 나타나면 모니터링 플랫폼은 자동으로 공고를 국세청이 관리하는 기업과 연결시켜 다른 색상과 강조 표시로 컴퓨터 화면에 표시합니다. 위험 관리 센터 직원은 실시간으로 관련 정보를 볼 수 있습니다.