본문 바로가기
IT/Python

problem using nltk.pos_tag() in nltk

by Jang HyunWoong 2014. 12. 19.

www.nltk.org 에서 nltk nltk-3.0.0.win32.exe (md5) 버전을 다운 받고

 

>>> import nltk

>>> text = nltk.word_tokenize("And now for something completely different")

>>> text

['And', 'now', 'for', 'something', 'completely', 'different'] 


실행 결과 잘 나왔다. 


하지만 


nltk.pos_tag(text) 를 했을 때, 다음과 같은 에러가 나왔다. 


 UnicodeDecodeError: 'ascii' codec can't decode byte in position 0: ordinal not in range(128)


쉬운 해결방법:http://www.nltk.org/nltk3-alpha/ 여기에서 

를 다운 받는다. 

 

다시 설치하면 

 

>>> nltk.pos_tag(text)

[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'), ('completely', 'RB'), ('different', 'JJ')] 

 

제대로 나온다!

반응형