본문 바로가기

스파르타코딩56

3-8 웹스크래핑 연습 웹스크래핑으로 (순위 제목 별점) 출력 웹사이트 : 결과 : 완성코드: import requests from bs4 import BeautifulSoup headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'} data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie.naver?sel=pnt&date=20210829',headers=headers) soup = BeautifulSoup(data.text, 'html.parser') #old_cont.. 2022. 5. 16.
3-7 웹스크래핑 (크롤링)기초_ beautifulsoup / select & select_one 웹크롤링/스크래핑 이 뭔지 감이 너무 안와서, 인터넷 뒤져봄... 내가 이해한것: 코딩하기 위해 필요한 데이터를 수집해서 (크롤링) 추출해 가져오는것(스크래핑). 뉴스기사 분석 / 음악 & 영화 차트 순위 자료 등등을 위해 사용 ----나중에 정확한 개념을 알게 되면 다시 수정하러 와야지...ㅎ 사용한 웹크롤링 모듈: BeautifulSoup ▶ 기본 세팅 코드 import requests from bs4 import BeautifulSoup headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'} data .. 2022. 5. 16.
3-6 패키지 사용해보기_ Requests 라이브러리 + list/dict/함수/if/for문 Requests 라이브러리 기본 코드 import requests # requests 라이브러리 설치 필요 r = requests.get('URL') rjson = r.json() # 라이브러리들 마다 정리된 방식이 다름 응용 import requests r = requests.get('http://spartacodingclub.shop/sparta_api/seoulair') rjson = r.json() gus = rjson['RealtimeCityAir']['row'] # API 에서 row를 'gus'라는 이름으로 불러옴 for gu in gus: # row == gu if gu['IDEX_MVL'] < 60: print (gu['MSRSTE_NM'], gu['IDEX_MVL']) 👉파이썬에서는 들.. 2022. 5. 16.
3-5 파이썬 패키지 / 라이브러리 💡패키지/라이브러리? 파이썬에서의 패키지는 모듈(일종의 기능들 묶음)을 모아 놓은 단위. 라이브러리는 패키지의 묶음 ▶ 가상 환경(virtual environment) 프로젝트 별로 패키지들을 담을 가상환경에서의 공구함. 같은 시스템에서 실행되는 다른 파이썬 응용 프로그램들의 동작에 영향을 주지 않기 위해, 파이썬 배포 패키지들을 설치하거나 업그레이드하는 것을 가능하게 하는 격리된 실행 환경 예 ) 회사에서는 패키지 A, B, C를 설치해서 쓰고, 개인 프로젝트에서는 패키지 B, C, D, E를 설치해서 쓰고 있음 그런데 회사에서 B를 이전 버전인 B' 로 쓰자고 하심. 하지만 그렇게 되면, 같은 컴퓨터에 깔려 있는 개인 프로젝트에서는 B'로 쓰면 코드를 다 바꿔야 함. -----> 공구함을 2개 만들어.. 2022. 5. 16.