[I2S]tokenizer를 어떻게 하는 것이 좋을까?
논문과 baseline 코드 모두 SMILES 식을 예측할 때 하나의 캐릭터씩 순서대로 예측하는 방법을 제시하고 있습니다. dict_keys(['C', '(', '=', 'O', ')', '[', '-', ']', 'N', '+', '1', 'P', 'c', 'l', 'n', '2', '3', '4', 'S', '#', 'H', 'A', 's', 'B', 'r', 'a', '5', 'o', 'e', '.', 'g', 'I', 'K', 'M', 'i', 'W', 'F', '6', 'T', 'd', 't', 'L', '7', 'Z', '@', 'u', 'b', 'U', 'R', 'G', 'h', 'V', 'p', '/', 'D', 'y', 'E', 'm', 'k', 'f', 'X', 'Y', '\\', '0..