안녕하세요, 이번 포스팅에서는 웹페이지 수집을 자동으로 할 수 있는 Python 코드에 대한 내용을 작성하려고 합니다. 이전에 네이버 서치 어드바이저 웹마스터도구 웹페이지 수집에 대한 포스팅에 연장선이라고 생각하시면 됩니다.
네이버 유입을 위해서는 일일히 URL을 Copy / Paste 를 해야 합니다. 물론 포스팅 글의 수가 작으신 분들은 상관은 없겠지만, 글을 매일 올리고, 일주일이나 한 달에 한 번씩 요청을 하시는 분들 그리고, 저 처럼 잘 몰랐다가, 한꺼번에 올려야 하시는 분들에게는 나름대로 시간낭비가 되는 단순 작업입니다.
그래서 준비하였습니다. 웹페이지 수집을 자동으로 할 수 있는 Python 코드를 소개 해드리겠습니다. 혹시 제가 이전에 올렸던, 네이
버 서치 어드바이저 웹마스터도구 웹페이지 수집 관련 포스팅을 보시면 아래 포스팅 내용 이해하는데 더 도움이 되실 겁니다. 아래 Link 참조 하시면 됩니다.
1. 웹페이지 수집창 수집 URL 입력 좌표와 "확인" 버튼의 좌표를 알아내기
: 크롤링 같이 웹페이지에서 Data를 추출하는 것은 그 해당하는 class 와 id 를 가지고 구현이 가능하지만, 우리가 사용하는 윈도우 창에서는 윈도우에 위치한 좌표를 가지고 Automation 하는 게 가장 단순하면서, 가장 편리하다고 생각합니다. 그래서 그 단순 Automation 구현을 위해서 좌표를 알아내야 됩니다.
- 일단 네이버 웹페이지 수집 웹사이트를 Open 하고, Python코드를 통해서 좌표를 추출할 수 있는 Utility를 실행 합니다. Utility를 실행하는 코드는 아래와 같습니다.
==================================================================================
# Automation 코드를 작성하기 위해서 필요한 패키지인, time 과 pyautogui 를 선언함.
import time
import pyautogui
# pyautogui.mouseInfo Utility를 실행함.
pyautogui.mouseInfo()
==================================================================================
- 위 코드를 실행하면 아래와 같은 Utility 프로그램이 실행이 됩니다. 그 프로그램에서 "Copy XY (F2)" 를 클릭 해보시면, 3초정도의 유예시간을 주고, 마우스가 이동할 수 있게 줍니다. 그리고 3초 이후에 마우스가 위치한 좌표를 가져 오는 것이죠. 이것을 코드에 입력만 하시면 됩니다. 그리고 아래 2개의 좌표를 Copy 합니다.
2. 웹페이지 수집창에서 수집 URL 입력 좌표를 이용하여 Automation 작업 하기
: 1번 항목에서 수집한 좌표를 아래 코드에 입력을 합니다. 코드 입력 위치는 빨간색으로 표시하였습니다.
==================================================================================
# Automation 코드를 작성하기 위해서 필요한 패키지인, time 과 pyautogui 를 선언함.
import time
import pyautogui
# pyautogui.mouseInfo Utility를 실행함.
pyautogui.mouseInfo()
# 티스토리는 기본적으로 URL 뒷자리가 숫자로 입력해도, 인식을 함.
# 일단 첫 번째 포스팅부터 입력한다라고 간주하고, "1"로 설정을 함.
start = 1
# 반복문을 통해서 Automation 작업을 수행
for j in range(50): # 웹페이지 수집 요청 갯수는 하루에 50개로 한정
pyautogui.click('URL 주소를 입력하는 좌표') # 예제 - ('123', '345')
for i in range(10):
pyautogui.press('backspace') # 기존에 입력한 URL을 지우는 코드
pyautogui.typewrite(str(start))
pyautogui.click('확인 버튼 좌표')
start = start -1
time.sleep(3) # 잠깐의 Pause를 통해서, 컴퓨터가 수집요청 프로세스를 잘 마무리 하도록 함.
(인터넷 사정, 컴퓨터 사양이 다들 다르기 때문)
==================================================================================
- 위 코드를 구현을 해보면, 반복적으로 click과 URL 주소를 입력하면서 수집 요청을 하는 것을 확인 하실 수 있습니다. 저 처럼 늦게 인식하시고, 신청하시는 분들의 스트레스를 조금이나 덜어 드리는데, 도움이 됐으면 합니다.
이상입니다. 파이썬을 공부하다 보니까, 작업을 할 때마다, 이렇게 코드를 짜면 더 편할 텐데, 이렇게 구현하면 더 도움이 될텐데 라는 생각이 듭니다. 왠지 모르겠지만, 사람의 심리가 더 편하고, 더 정확하게 일하고 싶어하는 욕구가 있어서 그런가, 계속적으로 아이디어가 나오는 거 같습니다. 그래서 어떤 분들은 "사람들은 정말 창의적이다." 다른 말로, "잔머리가 정말 뛰어나다" 라고 애기하시는 분들도 계십니다. 저도, 일을 하다보면 더 쉽게, 정확하게 일하려고, 생각하고, 그 방법을 이용하는 편이라서, 이 말에 부분적으로 동의를 합니다. 역시 공부를 하든 기술이나 지식이 많아야, 손발이 편해지는 거 같습니다. 그럼 이만 마무리 하도록 하겠습니다. 항상 말씀 드리지만, 같이 공부하고, 같이 성장하시죠! 감사합니다.
제 Posting이 조금이나마 정보 전달에 도움이 되셨길 빌며, 되셨다면, 구독, 댓글, 공감 3종 세트 부탁 드립니다. 감사합니다.
[저작권이나, 권리를 침해한 사항이 있으면 언제든지 Comment 부탁 드립니다. 검토 후 수정 및 삭제 조치 하도록 하겠습니다. 그리고, 기재되는 내용은 개인적으로 습득한 내용이므로, 혹 오류가 발생할 수 있을 가능성이 있으므로, 기재된 내용은 참조용으로만 봐주시길 바랍니다. 게시물에, 오류가 있을때도, Comment 달아 주시면, 검증 결과를 통해, 수정하도록 하겠습니다.]
'파이썬 (Python) > 자동화 (Automation)' 카테고리의 다른 글
파이썬 Python Macro 구현 pyautogui 이미지 인식하여 마우스 컨트롤 하는 법 + opencv-python (0) | 2021.03.04 |
---|---|
파이썬 Selenium을 이용한 Web Macro Python 프로그램 만들기 (1) | 2021.03.03 |
파이썬 Python Macro pyautogui 패키지 + alert 이용하여 선택 창 구현하는 방법 (0) | 2021.03.01 |
파이썬 Python Macro 구현 pyautogui 패키지 설치 방법 (0) | 2021.02.20 |
댓글