본문 바로가기

전체 글

(108)
[I2S]tokenizer를 어떻게 하는 것이 좋을까? 논문과 baseline 코드 모두 SMILES 식을 예측할 때 하나의 캐릭터씩 순서대로 예측하는 방법을 제시하고 있습니다. dict_keys(['C', '(', '=', 'O', ')', '[', '-', ']', 'N', '+', '1', 'P', 'c', 'l', 'n', '2', '3', '4', 'S', '#', 'H', 'A', 's', 'B', 'r', 'a', '5', 'o', 'e', '.', 'g', 'I', 'K', 'M', 'i', 'W', 'F', '6', 'T', 'd', 't', 'L', '7', 'Z', '@', 'u', 'b', 'U', 'R', 'G', 'h', 'V', 'p', '/', 'D', 'y', 'E', 'm', 'k', 'f', 'X', 'Y', '\\', '0..
[I2S]create_image 약 45만개의 이미지를 생성했다. . 근데.. drive와 병목이 있어서.. 생성하는 코드는 이미 실행 완료가 되었는데 이미지는 저장이 아직 다 안되었다. 천천히 되고 있다.. --> 잘 되었는지 확인해보자. 100만개의 이미지를 멀티프로세싱을 이용해서 희선 계정에 생성했는데 중간에 런타임이 종료되고 컨테이너가 사라져서그런지 33만개밖에 드라이브에 저장이 되지 않았다.... ㅜㅜ 다시 나머지를 생성하기 위해 코드를 실행시키고 런타임이 종료되지 않기 위해 무한 루프문을 실행시켜주었다. david 계정에 생성한 이미지도..23만개밖에 생성(정확이 말하면 생성명령은 주었는데 업로드가 되지 않은것 컨테이너에서 구글 드라이브로 옮기지 못한것이다.)되지 않아서 또 생성해 주었다. 현재시간 9.16.5:54 계속 업..
[I2S]Basline baseline코드에서는 뭐가 문제인가? deepsmiles로 변형해서 학습했다. 그 모델로 예측했더니 decoding이 안되는 deepsmiles가 꽤나 발견되었다. 성능은 다음과 같았다. val_accuracy : 0.1897557218309859 val_similarity : 0.5036391507181318 소요시간은 다음과 같았다. Time taken for 1 epoch 733.6990127563477 sec Time taken for 1 epoch 495.8985216617584 sec kaggle에서 학습시켜보자. deepsmiles로 변경하지 말고! kaggle tpu가 안써지고.. --> 질문을 올렸으니 답변을 기다려보자.--> 답변은 안올라오고... 기본 모델도 tpu로 돌아가지가 않..