1. 곡 장르 코드 데이터 : genre_gn_all.json
대분류 장르코드(gnr_code변수에 저장)
- 대분류 장르코드는 장르코드(gnr_code)에서 숫자 네 자리 중 뒷자리 두 자리가 00인 코드로 분류할 수 있습니다.
- 대분류 장르는 총 30개가 있습니다
상세 장르코드(dtl_gnr_code변수에 저장)
- 상세 장르코드는 장르코드(gnr_code)에서 숫자 네 자리 중 뒷자리 두 자리가 00이 아닌 나머지 코드로 분류할 수 있습니다.
- 상세 장르는 총 224개가 있습니다
장르 코드 트리(gnr_code_tree변수에 저장)
- 위에서 구분한 대분류 장르코드와 상세 장르코드 앞자리 네 자리를 활용하여 장르 코드 트리도 구성해볼 수 있습니다.
2. 곡 별 메타 데이터 : song_meta.json
총 707,989곡의 메타 정보가 담겨 있으며 포함하는 값은 아래와 같습니다.
- song_gn_dtl_gnr_basket : 상세 장르 코드
- issue_date : 곡 발매 일자 (yyyymmdd)
- album_name : 앨범 명
- album_id : 앨범 아이디
- artist_id_basket : 아티스트 아이디 (복수일 경우 띄어쓰기로 구분)
- song_name : 곡 명
- song_gn_gnr_basket : 대분류 장르코드
- artist_name_basket : 아티스트 명 (복수일 경우 띄어쓰기로 구분)
- id : 곡 아이디
3. 학습 데이터 : train.json
학습 데이터에는 총 115,071개 플레이리스트 정보가 담겨져 있으며 포함하는 값은 아래와 같습니다.
- tags : 플레이리스트에 매핑된 태그
- id : 플레이리스트 아이디
- plylst_title : 플레이리스트 명
- songs : 플레이리스트 내 수록된 곡 아이디
- like_cnt : 플레이리스트 좋아요 횟수
- updt_date : 플레이리스트 업데이트 일시