본문 바로가기
Data Science/NLP

한국어 텍스트 분석기 KoNLPy 쉽게 설치하기 (간단 방법 완벽 정리)

by 루크 Luke 2022. 12. 6.
반응형

 

이번 포스팅에서는 매번 겁부터 나던 KoNLPy 패키지 설치에 대해서 알아본다.

설치 방법이 공식 페이지에도 나와 있지만, 왠지 모르게 이해하기 힘들다..

https://konlpy.org/ko/latest/index.html

 

KoNLPy: 파이썬 한국어 NLP — KoNLPy 0.6.0 documentation

KoNLPy: 파이썬 한국어 NLP KoNLPy(“코엔엘파이”라고 읽습니다)는 한국어 정보처리를 위한 파이썬 패키지입니다. 설치법은 이 곳을 참고해주세요. NLP를 처음 시작하시는 분들은 시작하기 에서 가

konlpy.org

 

 

그래서, 설치 과정을 단계별로 쉽게 써 놓으려고 한다.

나중에 내가 보는 용도로 사용하고 싶어서..

- 회사에서 설치했었던지라, 보안 관련된 부분도 문제가 있었던 부분을 추가했다.

 

 

[1] jpype1 설치하기

 

1) Anaconda Prompt 실행 (윈도우10은 관리자 권한으로 실행)
2) conda install -c conda-forge jpype1

3) 터미널(Prompt) 끄지 말기!

 

 

이 때,  위 처럼 2) conda~ 에서 오류가 뜨는 경우가 있다. (사내 보안 관련해서)

CondaHTTPError로 시작하는 오류인데, 보통 보안 때문에 그런 경우이다.

이런 경우에는 ssl_verify를 no로 설정해주면 되는데, 해당 터미널에 아래와 같은 명령어를 날리면 해결된다.

conda config --set ssl_verify no

 

 

 

 

[2] JDK 또는 JDE 설치 및 환경 변수 설정

 

1) 자바 파일 다운로드 (JDK, JDE 둘 중 선택, 일반 분석가라면 JDE, 찐 개발자라면 JDK 추천)

  - JDK(www.oracle.com/kr/java/technologies/javase-downloads.html) 또는 JRE(www.java.com/ko/download/) 설치

 

2) 경로 확인 및 복사

  - "C 드라이브 >> Program Files >> Java >> jdk-15.0.1 >> bin >> server"

   - jde를 설치했다면, jdk가 아니라 다른 폴더로 되어 있다.

  - 직접 이 경로로 들어가서 server 폴더 안에 jvm.dll 파일이 있으면 잘 설치된 것이다.

  - C:\Program Files\Java\jre1.8.0_351\bin\server <<<<< 이 경로를 복사해준다.

 

3) 환경 변수 설정

  - 제어판 >> 시스템 및 보안 >> 시스템 >> 맨 아래 스크롤하면 고급 시스템 설정

  - 고급 탭에서 '환경 변수' 클릭

  - 새로 만들기 후에 변수 이름 'JAVA_HOME', 변수 값 'C:\Program Files\Java\jre1.8.0_351\bin\server'으로 입력

  - 변수 값에 복사해준 본인의 경로 값으로 입력해주어야 함

 

 

시스템 속성 >> 고급 탭

 

 

환경 변수 화면

 

 

환경변수를 위와 같이 만들어준다.

 

 

 

 

[3] pip install konlpy

- KoNLPy 패키지를 아까 켜둔 터미널(Prompt)에서 pip install konlpy를 치면 설치됨

- 만일 여기서도 SSL 관련 보안 문제가 터진다면,

- 아래와 같은 코드를 추가해준다.

- "--trusted-host pypi.python.org --trusted-host files.pythonhosted.org --trusted-host pypi.org"

 

pip install konlpy --trusted-host pypi.python.org --trusted-host files.pythonhosted.org --trusted-host pypi.org

 

 

여기까지 무리없이 완료 되었다면,

VS Code 상에서 이제 패키지가 임포트될 것이다.

 

 

 

반응형

'Data Science > NLP' 카테고리의 다른 글

Neural N-Gram Language Model  (0) 2022.03.30
Language Modeling  (0) 2022.03.30
CBoW & RN & CNN & Self Attention & RNN  (0) 2022.03.28
How to represent sentence & token  (0) 2022.03.28
Text classification Overview  (0) 2022.03.28

댓글