Giter Club home page Giter Club logo

langcomp2021's Introduction

언어와 컴퓨터 (2021학년도 2학기, 서울대학교 인문대학 언어학과)

개요

목표

언어와 컴퓨터(100.130)는 컴퓨터언어학(108.413A)의 선수과목으로, 심층학습(딥러닝, 인공신경망)을 사용한 자연언어처리 기법을 학습하기 위해 필요한 컴퓨터언어학의 기본 지식을 습득하는 것을 목표로 한다. 이 과목을 이수함으로써 학생들은 인공신경망 모형이 도입되기 전까지 자연언어처리 분야에서 전통적으로 어떤 기법을 사용하고 어떤 과제를 처리했는지를 이해하고 파이썬으로 구현할 수 있게 될 것이다. 이 강좌의 전반부에서는 파이썬의 기초와 정규표현식에 대해 배우며, 이를 통해 최초의 규칙 기반 챗봇인 ELIZA를 구현한다. 후반부에서는 기계학습과 벡터 의미론에서 대해 배우며, 이를 활용하여 주어진 트위터 데이터가 악성 트윗인지 아닌지를 자동으로 예측하는 모형을 개발한다.

이 강좌에서는 수강생을 대학 입학 후 수학을 따로 공부하지 않은 인문대학 1–2학년생으로 가정하고, 후반부 수업은 조건부확률, 로그함수, 지수함수 등 기초적인 내용을 복습하는 데서 시작할 것이다.

일정

회차 날짜 제목 슬라이드 실습 자료
1강 2021-09-01(수) 강의 소개 및 파이썬 시작 - - [Eliza, Computer Therapist]
[Sentiment Analysis - AllenNLP - Demo]
[Korean Word2Vec]
[Google Colaboratory]
2강 2021-09-06(월) 파이썬 기본 문법 [Slides] - [Automate the Boring Stuff with Python: Chapter 1 – Python Basics]
3강 2021-09-08(수) 반복 가능한 자료형 [Slides] - -
4강 2021-09-13(월) 반복문 [Slides] - [Automate the Boring Stuff with Python: Chapter 4 – Lists]
5강 2021-09-15(수) 조건문 [Slides] - [Automate the Boring Stuff with Python: Chapter 2 – Flow Control]
6강 2021-09-27(월) 함수와 모듈 [Slides] - [Automate the Boring Stuff with Python: Chapter 3]
7강 2021-09-29(수) 예외 처리 [Slides] - [국어 정보화의 방향: 문자 코드를 중심으로]
[‘설믜를 설믜라 못 부르는 김설믜씨’ “제 이름을 지켜주세요”]
8강 2021-10-06(수) 정규표현식 (1) - - [SLP3 Ch. 2]
[Slides: Basic Text Processing]
[RegExr: Learn, Build, & Test]
[단어 임베딩과 음성적 유사도를 이용한 트위터 ‘서치 방지 단어’의 자동 예측]
9강 2021-10-13(수) 정규표현식 (2) [Slides] - [SLP3 Ch. 2]
[ELIZA—a computer program for the study of natural language communication between man and machine]
10강 2021-10-18(월) 파일 처리 (1) [Slides] ["음식의 언어" Colab] [식품영양성분 데이터베이스]
[The Unicode Standard, Version 14.0 - Hangul Jamo]
11강 2021-10-20(수) 파일 처리 (2) [Slides] - [Project Gutenberg: Free eBooks]
12강 2021-10-25(월) ELIZA 개발 관련 토의 - - -
13강 2021-10-27(수) 벡터, 통계, 데이터 시각화 (1) [Slides] - ["밑바닥부터 시작하는 데이터 사이언스" 예시 코드]
14강 2021-11-01(월) 벡터, 통계, 데이터 시각화 (2) [Slides] - -
15강 2021-11-03(수) N그램 언어 모형 (1) [Slides] - [SLP3 Ch. 3]
16강 2021-11-08(월) N그램 언어 모형 (2) [Slides] [Colab] [SLP3 Ch. 3]
[The Berkeley Restaurant Project (BeRP) Transcripts]
[NLTK :: Sample usage for corpus]
17강 2021-11-10(수) N그램 언어 모형 (3) [Slides] - [SLP3 Ch. 3]
18강 2021-11-15(월) 단순 베이즈 분류기와 감정분석 (1) [Slides] - [SLP3 Ch. 4]
19강 2021-11-17(수) 단순 베이즈 분류기와 감정분석 (2) [Slides] [Colab] [SLP3 Ch. 4]
20강 2021-11-22(월) 로지스틱 회귀분석 (1) [Slides] - [SLP3 Ch. 5]
[Frequency of word-use predicts rates of lexical evolution throughout Indo-European history]
21강 2021-11-24(수) 로지스틱 회귀분석 (2) [Slides] [Colab] [SLP3 Ch. 5]
[IMDb-Review-Analysis]
[VADER-Sentiment-Analysis]
22강 2021-11-29(월) 로지스틱 회귀분석 (3) [Slides] [Colab] [SLP3 Ch. 5]
23강 2021-12-01(수) 벡터 의미론 (1) [Slides] [Colab] [SLP3 Ch. 6]
24강 2021-12-08(수) 벡터 의미론 (2) [Slides] [Colab] [SLP3 Ch. 6]
[Automated Hate Speech Detection and the Problem of Offensive Language]

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.