Giter Club home page Giter Club logo

blueprints-text's Introduction

파이썬 라이브러리를 활용한 텍스트 분석

텍스트에서 통찰을 이끌어내는 98가지 자연어 처리 전략

표지

오류 신고

코드에서 오류를 발견한다면 저자들의 깃허브에서 이슈를 남겨주세요.

스페이시 3.0과 젠심 4.0 이 도서의 코드는 스페이시(spaCy) 2.3.2과 젠심(gensim) 3.8.3을 기준으로 작성되어 있습니다. 하지만 현재 스페이시는 3.0이 릴리즈 되었으며 이에 따라 API도 변화되었습니다. 저자들 또한 실습 코드를 스페이시 3.0에 맞춰 업데이트 했습니다. 하지만 textacy는 스페이시 3.0을 지원하지 않으므로 저자들이 수정을 가한 파일을 제공하고 있습니다.

노트북 실행법

각 노트북은 세 가지 링크를 제공합니다.

  • "git" 링크는 깃허브에서 노트북을 확인합니다.
  • "nbviewer" 링크는 nbviewer.ipython.org에서 노트북을 확인합니다.
  • "colab" 링크는 구글 콜랩에서 노트북을 확인합니다(저자들은 콜랩 사용을 권장합니다).

노트북을 콜랩이나 로컬 환경에서 실행할 경우, Shift + Enter 키를 눌러 셀을 실행할 수 있습니다. 첫 셀부터 차례로 모든 셀을 실행하세요.

로컬 환경 설정법

git clone 명령어를 사용해 저장소를 내려받습니다.

git clone https://github.com/blueprints-for-text-analytics-python/blueprints-text.git
cd blueprints-text

로컬 환경을 구성하기 위해 Miniconda를 추천합니다. Miniconda 공식 홈페이지에서 제공하는 설치 방법을 따라 Miniconda를 설치합니다.

Miniconda의 설치를 마쳤다면 프로젝트 디렉터리에서 아래 명령어를 실행합니다.

conda env create --name blueprints --file blueprints.yml
conda activate blueprints

환경이 실행되면 프롬프트에 blueprints 라는 문구가 출력됩니다. 환경 설정 파일에 추가되어있는 주피터 노트북용 확장기능들을 활성화합니다.

jupyter nbextension enable toc2/main
jupyter nbextension enable execute_time/ExecuteTime
jupyter nbextension enable varInspector/main

이제 주피터 노트북 서버를 실행합니다.

jupyter notebook

만약 WSL 환경이라면 --no-browser 옵션을 추가하세요.

이제 각 장마다 있는 .ipynb를 열어 노트북을 확인합니다.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.