본문 바로가기

HTML & CSS8

HTML (Hyper Text Markup Language) 의 정의 및 HTML 태그, W3 안녕하세요, Davey입니다. 지난번 포스팅에 이어서, 웹페이지 기본 지식에 대해서 알아보면서, 같이 공부하고 싶은 사항에 대해서, 포스팅하고 있습니다. 오늘은 HTML (Hyper Text Markup Language)와 그 문서에 나와있는 속성에 대해서 한 번 설명드리도록 하겠습니다. 일단 HTML (Hyper Text Markup Language)가 무엇인지부터 설명드리면서 시작하도록 하겠습니다. HTML(Hyper Text Markup Lanaguage) : HTML은 HyperText Markup Language의 약자라는 것은 눈치 채셨을 겁니다. 거의 모든 웹페이지는, HTML 문서로 이뤄져 있으며, 그 안에, HTML 태그들로 구성됩니다. 각 HTML의 태그들은, 웹페이지를 개발하는 개발자.. 2021. 3. 2.
웹페이지 크롤링 + re 정규 표현식을 이용하여 조건 속성 값 정의 하기 안녕하세요 Davey 입니다. 오늘 주요 다룰 내용은 re 정규 표현식을 이용하여 크롤링 할 때 사용하는 조건 속성 값을 정의하는 내용입니다. 기존에는 머리 문자와 끝 문자를 이용해서 조건 속성 값을 정의하는 것도 설명은 드렸습니다. 오늘 내용은 비슷하지만, 사용한 패키지가 re 정규 표현식 패키지를 이용한다라고 이해하시면 됩니다. re에 관한 포스팅 및 크롤링 조건 속성 값 정의 관련 포스팅을 을 먼저 보고 오시면, 더 이해하는데 도움이 되실 듯합니다. 아래 Link 참조 하세요. Python 파이썬 re, ravel, flatten 함수를 이용해보기 안녕하세요, Davey 입니다. 오늘은, "r" 로 시작하는 함수와 그와 관련된 함수를 설명 할 예정입니다. 오늘 설명할 함수는, re, ravel, f.. 2021. 3. 1.
웹 페이지 크롤링 작업 수행 위한 기초 지식 이해하기 - requests 라이브러리 안녕하세요, 이번 포스팅은 웹 페이지 크롤링 작업 수행 위한 기초 지식 중에 하나인 requests 라이브러리에 대해서 기재하려고 합니다. 이전 포스팅에 크롤링을 구현하는 법에 대해서 설명을 드린 내용을 이용하여 설명 드리도록 하겠습니다. 저도 사실, 그때 그냥 먼가 먼저 해보면서 배우는 게 더 나을거라고 생각했습니다. 지금도 그게 효율적인 방법 중에 하나라는 거에 대해서는 아직도 어느정도는 동의를 합니다. 하지만, 그런 예도 중요하지만, 기본적인 지식에 대해서 알아야 될 거 같아서 이렇게 크롤링 작업을 위한 기초 지식에 대해 서 포스팅 하려고 합니다. 그럼 제가 나름대로 이해하고 공부한 내용을 기반으로 웹 페이지 크롤링 작업 수행 위한 기초 지식 중에 하나인 requests 라이브러리를 설명 드리도록 .. 2021. 2. 27.
웹 페이지 기본 지식 이해하기 - HTTP (Hyper Text Transfer Protocol) 과 웹페이지 호출 Method GET & POST 안녕하십니까, Davey 입니다. 오늘은 기초부처 다지는 시간도 갖자라는 생각으로, 크롤링을 학위 해서 기초적으로 알아야 할 내용에 대해서 다룰려고 합니다. 그래서 오늘은 HTTP (Hyper Text Transfer Protocol)과 그에 관련된 내용을 하나 하나 포스팅 하도록 하겠습니다. 그럼 제 나름대로, 자세하게 설명 드리도록 하겠습니다. 일단, HTTP (Hyper Text Transfer Protocol)에 대해서 먼저 설명 드리면서 시작하겠습니다. 1. HTTP (Hyper Text Transfer Protocol) 이란? : HTTP는Hyper Text Transfer Protocol의 Full Name을 줄여서 말하는 것으로, 인터넷에서 데이터를 주고받을 수 있는 프로토콜입니다. 프로토.. 2021. 2. 20.
BeautifulSoup 패키지를 이용해서 HTML 내용 가져오기 안녕하세요, Davey 입니다. 오늘 포스팅할 내용은 웹 크롤링에서 정말 중요한 패키지인 BeautifulSoup를 이용하여, HTML 내용을 가져오는 방법에 대한 것입니다. 이전에 request 패키지는 그 웹페이지를 호출하여, 호출한 그 페이지의 내용을 가져오는 것이라면, BeautifulSoup는 그 가져온 내용에서 우리가 원하는 내용을 추려서, 출력하는 패키지라고 생각하시면 됩니다. 그럼 BeautifulSoup에 대한 정의를 먼저 설명 드리면서 포스팅 시작하도록 하겠습니다. 1. BeautifulSoup 패키지 : 뷰티플 수프는 HTML과 XML 문서를 파싱하기위한 파이썬 패키지입니다. 웹 스크래핑에 유용한 HTML에서 데이터를 추출하는 데 사용할 수있는 구문 분석 된 페이지에 대한 구문 분석 .. 2021. 2. 13.