한국어띄어쓰기1 한국어 전처리 패키지(Text Preprocessing Tools for Korean Text) PyKoSpacing !pip install git+https://github.com/haven-jeon/PyKoSpacing.git PyKoSpacing는 전희원님이 개발한 오픈소스 라이브러리로 한국어 띄어쓰기 패키지로 띄어쓰기가 되어있지 않은 문장을 띄어쓰기를 한 문장으로 변환해주는 패키지다. PyKoSpacing은 대용량 코퍼스를 학습하여 만들어진 띄어쓰기 딥 러닝 모델로 준수한 성능을 가지고 있다고 한다. 예시는 다음과 같다. 위의 패키지를 먼저 다운로드하자. sent = '김철수는 극중 두 인격의 사나이 이광수 역을 맡았다. 철수는 한국 유일의 태권도 전승자를 가리는 결전의 날을 앞두고 10년간 함께 훈련한 사형인 유연재(김광수 분)를 찾으러 속세로 내려온 인물이다.' new_sent = sen.. 2021. 4. 28. 이전 1 다음