반응형
파이썬 크롤링 (crawling)
파이썬 크롤링에 대한 기본적인 내용은 이전 글을 참고하자
2020/03/27 - [Data Analysis] - 파이썬 크롤링 (crawling)
html의 id 속성을 이용하여 찾기
soup.select('#id명')
html의 class 속성을 이용하여 찾기
soup.select('.class명')
자손 태그는 혼합해서 찾기
soup.select('#id명 p')
자식 태그를 찾고 싶다면 > 키워드를 붙여야 함 (p 태그가 자손이 아니라 자식 태그라면)
soup.select('#id명 > p')
h3 태그의 특정 class 가져오기
soup.select('h3.class명')
속성값을 이용하여 찾기(class 예제)
soup.select('h3[class="class명"]')
정규표현식 같이 사용하기 (h* 태그 )
soup.find_all(re.compile('h\d'))
반응형
'Data Analysis' 카테고리의 다른 글
엑셀 빈 셀에 한 번에 특정 값 입력하기 (0) | 2020.11.12 |
---|---|
파이썬 openpyxl (차트) (0) | 2020.11.11 |
파이썬 openpyxl (0) | 2020.11.11 |
파이썬 크롤링 (crawling) (0) | 2020.03.27 |
엑셀 분수 입력 방법 (0) | 2018.11.11 |