본문 바로가기

웹크롤링2

웹 크롤링 - [Python]파이썬으로 네이버 블로그 우클릭 뚫기(selenium, iframe) 오늘 포스팅은 우클릭을 막은 네이버 블로그, 혹은 카페에 있는 글을 가져오는 것입니다. 기본적으로 네이버 블로그나, 카페를 크롤링 할 경우 BeautifulSoup를 이용하기보다 Selenium으로 하길 추천드립니다. 오늘 가져와볼 네이버 블로그는 https://blog.naver.com/ssagazyzzang/40000359630 입니다. 저는 영어로 된 색상표를 한글로 번역을 하고 싶은데요, 여기 네이버 블로거 한 분이 영어로된 색상을 한글로 번역해주셨네요.(무려 2003년 글...) 대략 개수를 세어봐도 60개가 넘어보이는데요, 영어로 된 색 이름과 한글로된 색이름을 같이 가져와 엑셀에 저장하겠습니다! 물론 우클릭이 안 됩니다. 그럼 시작하겠습니다. 1. 셀레니움으로 가져오기 from seleniu.. 2021. 6. 7.
웹 크롤링 - 네이버 금융 기사 가져오기(정적 페이지 응용) 오늘은 네이버 금융 기사를 가져오려고 합니다. 그 중에서 한국콜마라는 기업에 대한 뉴스기사를 가져올 거에요. 며칠 전에 교양 수업에 한국콜마 대표님이 오셔서 강의하신 기억이 나서, 어떤 기업인지 궁금하니까 크롤링 해보겠습니다. ㅋ 참고로 코딩은 주피터로 하는 것을 추천드리며, 크롤링은 기본적으로 코랩에서는 작동하지 않는 점 참고하시면 될 것 같습니다. 주소 : finance.naver.com/item/main.nhn?code=161890 한국콜마 - 네이버 금융 : 네이버 금융 관심종목의 실시간 주가를 가장 빠르게 확인하는 곳 finance.naver.com 오늘도 떨어졌군요... 아무튼 시작해보겠습니다. 1. 명확한 주소 찾아내기 일단 가운데 뉴스공시에 한국콜마에 대한 기사가 있습니다. 여기를 클릭해보.. 2021. 3. 20.