ch2. Text classification # BPE1.1 유형1) Byte-Pair Encoding(BPE)를 사용해 주어진 코퍼스에서 #n-size의 vocabulary 만들기. Sol)순서1) 코퍼스 안에서 유니크한 word 하나 뽑기vocab = {a, b, c} 순서2) 첫 번째 반복: 띄어 쓰기를 기준으로 코퍼스를 나누고, 한 칸씩 이동하면서 2 word 묶음 개수 카운팅.> abc / ccba / abbccc/ aaabbbccaai) abc -> ab, bcii) ccba -> cc, cb, baiii) abccc -> ab, bc, cc, cciv) aaabbbccaa -> aa, aa, ab, bb, bb ,bc, cc, ca, aa> ab: 3개, bc: 3개, cc: 4개, cb: ..