[I2S]effb1 layers
, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ]
[I2S] 9300만개 학습, char 개수 세기
CID-SMILES에는 총 111325461개(1억 1천 1백만개)가 존재한다. 그중 smiles길이가 70이하이고 빈도가 낮은 char의 하위 절반에 속한 문자들을 포함하지 않는 smiles만 택했더니 약 9300만개가 나왔다. 총 1억 1천만 개 중에 9300만(93248512)개면.. 상당수. 약 0.84 정도를 포함하는 수치 111325461개 smiles를 집합에는 총 68개 의 문자가 있다. ['L', ')', 's', 'c', 'd', '4', '=', '5', '0', 'm', '(', 'G', 'F', 'r', 'R', 'b', 'y', '1', 'f', 'i', 'u', 'M', 't', '8', '9', 'n', 'U', 'C', 'N', '/', '6', 'a', 'k', 'T', ..