본문 바로가기

카테고리 없음

[EDA] 카카오아레나 melon-playlist-continuation 데이터

1. 곡 장르 코드 데이터 : genre_gn_all.json

대분류 장르코드(gnr_code변수에 저장)

  • 대분류 장르코드는 장르코드(gnr_code)에서 숫자 네 자리 중 뒷자리 두 자리가 00인 코드로 분류할 수 있습니다.
  • 대분류 장르는 총 30개가 있습니다

상세 장르코드(dtl_gnr_code변수에 저장)

  • 상세 장르코드는 장르코드(gnr_code)에서 숫자 네 자리 중 뒷자리 두 자리가 00이 아닌 나머지 코드로 분류할 수 있습니다.
  • 상세 장르는 총 224개가 있습니다

장르 코드 트리(gnr_code_tree변수에 저장)

  • 위에서 구분한 대분류 장르코드와 상세 장르코드 앞자리 네 자리를 활용하여 장르 코드 트리도 구성해볼 수 있습니다.

 

2. 곡 별 메타 데이터 : song_meta.json

총 707,989곡의 메타 정보가 담겨 있으며 포함하는 값은 아래와 같습니다.

  • song_gn_dtl_gnr_basket : 상세 장르 코드
  • issue_date : 곡 발매 일자 (yyyymmdd)
  • album_name : 앨범 명
  • album_id : 앨범 아이디
  • artist_id_basket : 아티스트 아이디 (복수일 경우 띄어쓰기로 구분)
  • song_name : 곡 명
  • song_gn_gnr_basket : 대분류 장르코드
  • artist_name_basket : 아티스트 명 (복수일 경우 띄어쓰기로 구분)
  • id : 곡 아이디

 

3. 학습 데이터 : train.json

학습 데이터에는 총 115,071개 플레이리스트 정보가 담겨져 있으며 포함하는 값은 아래와 같습니다.

  • tags : 플레이리스트에 매핑된 태그
  • id : 플레이리스트 아이디
  • plylst_title : 플레이리스트 명
  • songs : 플레이리스트 내 수록된 곡 아이디
  • like_cnt : 플레이리스트 좋아요 횟수
  • updt_date : 플레이리스트 업데이트 일시

출저 :https://arena.kakao.com/forum/topics/191