
자연어처리를 항상 공부하고 싶었다. 내 분야에서 사업화할 수 있는 아이템은 자연어처리 기반의 서비스라고 생각했기 때문이다. 좋은 기회가 되어 사내 교육을 듣게 되었고 대충 맥락은 파악할 수 있게 되었다. 자연어를 분석하기 위해서는 긴 자연어를 분석을 위한 작은 단위로 나누는 작업을 수행해야 한다. 교육을 받은 후 내 것으로 만들기 위해 직접 NLTK 라이브러리를 활용하여 자연어를 분석의 단위, 토큰으로 쪼개는 과정인 "Tokenization" 과정을 수행해보려고 한다. 토큰화 (Tokenization) [1] 단어 토큰화 (Word Tokenization) - 토큰화 대상 : "Don't be fooled by the dark sounding name, Mr. Jone's Orphanage is as c..
Python
2020. 12. 8. 08:00
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- task실행
- rustwindow
- DB
- 맛집
- 데이터프레임메모리
- rust공부
- nosql
- 데이터프레임사이즈
- 곱창맛집
- 곱창
- 빅데이터
- task실패
- dag실패
- rust설치
- 사당역맛집
- 데이터베이스
- 대창
- windowrust
- pandas데이터프레임
- rust설치방법
- python
- rust스터디
- 막창
- 파이썬
- windows에서rust설치
- 데이터프레임용량
- 사당맛집
- pandas
- 배치실패
- rust설치하는방법
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
글 보관함