본문 바로가기

카테고리 없음

[kaggle] TPU사용 colab에서는 잘 되는데 kaggle에서는 잘 안되는이유

데이터 병목현상인가 싶은데..

 

안녕하세요. 캐글코리아 여러분.

어제 대전 딥러닝 컨퍼런스에서 제 세션으로 발표했던 TPU 알아보기 발표자료와 3차대회 예제 소스코드를 깃허브로 공유합니다.


반드시 기억하셔야 할것은, GCS 버킷은 us-central1 입니다.

  • TPU 사용은 무료입니다만 GCS 저장 비용이 나올 수 있습니다. 하지만 100기가 이하로 저장한다면 한달에 1달러 겨우 나올까말까입니다. GCS 스토리지 비용이 과금될 수 있다는 사실 기억하세요!

  • 버킷은 Regional로 만드시는걸 추천드립니다.


3차 대회 제 베이스라인 커널(P100)기준 8천개 데이터 학습 1에폭에 약 160초 소요되는 반면에

코랩 TPU기준 1만개 데이터 학습 1에폭 당 39초임을 보실 수 있습니다. 멋지죠?

혹시 자료 내부에 잘못된 내용이 있거나 궁금한게 있으시면 언제든지 말씀 부탁드립니다.

https://cs-cz.facebook.com/groups/KaggleKoreaOpenGroup/permalink/444368902961881/