웹 크롤링을 위해서 먼저 해당 페이지가 웹 크롤링을 해도 되는 페이지인지 확인하기 위해 사이트 주소 뒤에 /robots.txt 붙여 확인한다.

Untitled

https://www.melon.com/robots.txt

chart 크롤링이 허용되어 있다. Disallow로 명시되어 있으면 크롤링을 할 수 없다.

<http://localhost:8080/melon/collectMelonSong>

멜론 차트 탑 100을 수집하고 저장한다.

<http://localhost:8080/melon/getSongList>

저장한 차트를 조회한다.

<http://localhost:8080/melon/getSingerSongCnt>

가수별 차트에 등록된 노래 수를 카운트한다.

Untitled

MongoDB 저장 데이터

Online JSON Viewer