데이터를 캡처하기 전에 두 가지를 다운로드해서 설치해야 합니다. 하나는 urllib 이고 다른 하나는 python-docx 입니다.
그림 설명을 입력하려면 클릭하십시오.
그런 다음 파이썬 편집기에 가져오기 옵션을 입력하여 두 라이브러리에 대한 서비스를 제공합니다.
그림 설명을 입력하려면 클릭하십시오.
Urllib 는 주로 웹 페이지의 데이터를 수집하는 일을 담당합니다. 웹 페이지의 데이터를 간단하게 잡는 것은 사실 매우 간단하다. 그림과 같이 명령을 입력하고 그 뒤에 링크를 입력합니다.
그림 설명을 입력하려면 클릭하십시오.
잡은 것은 아니다. 반드시 읽어야 한다. 그렇지 않으면 무효이다.
그림 설명을 입력하려면 클릭하십시오.
다섯;오;5
다음은 코드를 뺏는 것이고, 코드를 뒤집지 않으면 보존할 수 없다. Read 함수를 디코딩합니다. 아무거나 하나 더 표기해 주세요. 예를 들면 XA 입니다.
그림 설명을 입력하려면 클릭하십시오.
여섯;육
마지막으로 세 마디 더 입력하겠습니다. 첫 번째 문장은 새로운 빈 word 문서를 만드는 것을 의미한다.
두 번째 문장은 문서에 텍스트 단락을 추가하여 변수 XA 가 캡처한 것을 설명하는 것을 의미합니다.
세 번째 문장은 문서 docx 의 의미를 저장하는 것입니다. 이름은 괄호 안에 있습니다.
그림 설명을 입력하려면 클릭하십시오.
일곱
소스 코드입니다. 필터링이 필요한 경우 다양한 일반 표현식을 직접 추가해야 합니다.