본문 바로가기

한국어2

Mecab 오류 (NameError: name 'Tagger' is not defined) 처리 방법 KoNLPy https://konlpy-ko.readthedocs.io/ko/v0.4.3/ Mecab 이 참 괜찮은데, 설치 때문에 사람들을 힘들고 어렵게 한다. 심지어 윈도우에서는 설치도 안된다. (찾아 보면 있을지도?) 몇번 설치해본 경험이 나름 있어서 이번에 새로 도커로 우분투를 올려서 처음부터 설치해보려고 했는데, 덜컥 하고 오류가 나서 여러가지로 찾아보면 고생을 좀 했다. sudo pip3 install konlpy 보통 위와 같이 설치하고, 파이썬을 실행시켜 Mecab 을 사용해보면 > python3 Python 3.6.9 (default, Nov 7 2019, 10:44:02) [GCC 8.3.0] on linux Type "help", "copyright", "credits" or "lic.. 2020. 1. 6.
한국어 dataset 모음 한국어를 가지고 실험을 해보기 위해 구글링을 해보았지만 생각보다 한국어 데이터가 많지 않았다. 공개되어 있는 한국어 dataset 을 링크로 남겨두고, 새로 추가 될 때 마다 갱신할 예정이다. ※ 혹시라도 댓글로 추가할 dataset 알려 주시면 추가하도록 하겠습니다. 코퍼스 명 용도 설명 링크 Naver sentiment movie corpus v1.0 분류 네이버 영화 리뷰 (긍정, 부정) 분류 라벨링 됨 https://github.com/e9t/nsmc Chatbot_data 분류 채팅 대화 (일상,긍정,부정) 분류 라벨링 됨 https://github.com/songys/Chatbot_data 청와대 국민청원 사이트의 만료된 청원 데이터 모음 RAW 일자,카테고리,제목,내용 등 만료된 청원 Raw.. 2020. 1. 2.