Data Analysis 9

파이썬 openpyxl

파이썬 openpyxl 파이썬으로 엑셀 자동화 작업하는 경우가 많은데, 잊지 않기 위해 기록해본다. 파이썬 엑셀 관련 패키지들은 다양하게 있지만 최근에 openpyxl로 많이 쓰는 추세인듯.. 우선 파일을 작성하는 방법은 아래와 같다. import openpyxl # workbook(엑셀파일) activate wb = openpyxl.Workbook() sh1 = wb.active # 시트 추가하는 방법 sh1.title = 'Sheet1' sh2 = wb.create_sheet('Sheet2') # 셀에 값 입력하는 방법 sh1['A1'] = 10 sh1['A2'] = 20 sh2['B1'] = 'python' sh1['A3'] = '=sum(A1:A2)' # 파일 저장 wb.save('file.xls..

Data Analysis 2020.11.11

파이썬 크롤링 (crawling) - id, class, 정규표현식, 속성으로 찾기

파이썬 크롤링 (crawling) 파이썬 크롤링에 대한 기본적인 내용은 이전 글을 참고하자 2020/03/27 - [Data Analysis] - 파이썬 크롤링 (crawling) 파이썬 크롤링 (crawling) 크롤링(crawling) 또는 스크랩핑(scraping)은 웹 페이지에서 필요한 데이터를 추출하는 행위를 말함 파이썬 라이브러리(Beautiful Soup)를 이용하여 크롤링하는 방법을 기술하고자 함. 네이버 인기검색어 hungc.tistory.com html의 id 속성을 이용하여 찾기 soup.select('#id명') html의 class 속성을 이용하여 찾기 soup.select('.class명') 자손 태그는 혼합해서 찾기 soup.select('#id명 p') 자식 태그를 찾고 싶다..

Data Analysis 2020.07.12

파이썬 크롤링 (crawling)

파이썬 크롤링(crawling) 크롤링(crawling) 또는 스크랩핑(scraping)은 웹 페이지에서 필요한 데이터를 추출하는 행위를 말한다. 파이썬 라이브러리(Beautiful Soup)를 이용하여 크롤링하는 방법에 대해 알아보자. 네이버 인기검색어 추출 네이버 사이트에서 개발자 도구를 활용하여 인기검색어 요소를 확인해보자. 아래 이미지처럼 임을 확인할 수 있다. 따라서 이 부분을 파싱해야 한다. Beautiful soup을 사용하여 파싱하는 코드 구조는 아래와 같다. url = "http://www.naver.com" soup = BeautifulSoup(urllib.request.urlopen(url).read(), "html.parser") # resp = requests.get(url) # ..

Data Analysis 2020.03.27