파이썬:: 웹크롤링 해보기 (일간 노래순위 가져와보기)

Notice

Recent Posts

Recent Comments

Link

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

박미미의 지식에서 쌓는 즐거움

파이썬:: 웹크롤링 해보기 (일간 노래순위 가져와보기) 본문

IT 공부/파이썬 공부

파이썬:: 웹크롤링 해보기 (일간 노래순위 가져와보기)

낑깡좋아 2019. 7. 13. 00:00

html 페이지 전체를 크롤링하는것까지 배웠다. (하단링크 참고)

파이썬:: 웹크롤링 준비하기(1편)

https://parkmimi.tistory.com/23

그러면 이제 특정페이지에 내가 원하는 데이터를 가져와보자.

지금 예로 들건 '네이버 뮤직' 에서 일간 top100 하는 노래 제목, 가수 이름 등을 알기 위한 작업이다.

(https://music.naver.com/listen/top100.nhn?domain=TOTAL&duration=1d&page=1)

f12를 눌러 html 코드를 확인해보자.

난 top100의 노래제목을 가져오고 싶다. 노래제목 부분의 <td>를 확인해서 한 행을 보자.

내가 필요한 부분을 아래 소스.

</a>

</td>

</td>

html코드가 조금 길다고 당황하지 말고 내가 필요한부분, 주황색으로 표시된 부분만 확인하면 됩니다.

#웹서버에 요청

import urllib.request

#검색에 요청

from bs4 import BeautifulSoup

data = urllib.request.urlopen("https://music.naver.com/listen/top100.nhn?domain=TOTAL&duration=1d&page=1")

soup = BeautifulSoup(data, "html.parser") #html을 가져와서 soup 이라는 객체에 저장한다.

songtitle = soup.find_all("td", class_="name") #<td class="name"> 부분을 찾는다

title = songtitle[0].find("span").text #<td class="name"> 부분 중 <span class="ellipsis">술이 문제야</span> 부분찾기

for item in songtitle:

print( item.text.strip() )

결과

술이 문제야

헤어져줘서 고마워

Snapping

너에게 못했던 내 마지막 말은

Speechless (Full)

사랑에 연습이 있었다면 (Prod. 2soo)

솔직하게 말해서 나

2002

작은 것들을 위한 시 (Boy With Luv) (Feat. Halsey)

bad guy

A Whole New World

FANCY

여기서의 코드 한계가 있다.

한 페이지에 노래 순위 1~50위까지 되어있어서 51~100위는 가져오기 힘들다는 것.

이걸 다음 포스트에서 정리해보겠다.

저작자표시 (새창열림)

'IT 공부 > 파이썬 공부' 카테고리의 다른 글

파이썬:: Pycharm + Python virtualenv 설치 (0)	2019.07.23
[Pycharm + mysql] MYSQL 설치하기 (0)	2019.07.22
파이썬:: 웹크롤링 준비하기 (0)	2019.07.12
파이선:: 예외처리 (try, 강제예외) (0)	2019.07.11
파이썬:: 사전(Dictionary)의 개념 (0)	2019.07.10

'IT 공부/파이썬 공부' Related Articles

Comments

박미미의 지식에서 쌓는 즐거움

파이썬:: 웹크롤링 해보기 (일간 노래순위 가져와보기) 본문

파이썬:: 웹크롤링 해보기 (일간 노래순위 가져와보기)

'IT 공부 > 파이썬 공부' 카테고리의 다른 글

티스토리툴바