Mission2 : Neural Networks and Deep Learning 후반부 수강

수강 기간 : 8월 16일 ~ 8월 23일

Week 3. Shallow neural networks
Week 4. Deep Neural Networks

강의 참고 자료 모음 (논문, 깃헙 레포, 블로그 글 등)

Lecture 1 Reference

Week 2:

Implementing a Neural Network from Scratch in Python – An Introduction (Denny Britz, 2015)
Why normalize images by subtracting dataset's image mean, instead of the current image mean in deep learning? (Stack Exchange)

Week 3:

Week 4:

Autoreload of modules in IPython (Stack Overflow)

Lecture 2 Reference

Week 3:

Lecture 4 Reference

Week 1:

Week 2:

Week 3:

Week 4:

Lecture 5 Reference

Week 1:

Week 2:

Week 4:

Mission 8 : 5th course: Sequence Models 마무리 & Coursera 강의 종료

수강 기간 : 9월 27일 ~ 10월 4일
Week 2 : Natural Language Processing & Word Embeddings
Week 3 : Sequence models & Attention mechanism
Week 4 : Transformer Network

[Assignment Error] Course 4, Week 3: variable parameter name error in unet_model function

Error Explanation : conv_block(cblock3[0], n_filters * 8, dropout=0.3)에서 dropout이 기존의 과제 초기화 시, dropout_prob으로 표기되어 에러가 발생함.

def unet_model(input_size=(96, 128, 3), n_filters=32, n_classes=23):
    
    ...

    cblock4 = conv_block(cblock3[0], n_filters * 8, dropout=0.3) # Include a dropout_prob of 0.3 for this layer
    # Include a dropout_prob of 0.3 for this layer, and avoid the max_pooling layer
    cblock5 = conv_block(cblock4[0], n_filters * 16, dropout=0.3, max_pooling=False) 

    ...

가벼운 오타 표기로 위의 매개변수 명칭을 dropout으로 표기해주면, 해당 에러를 해결할 수 있음.

[Kaggle Project] Google ML Bootcamp 캐글 프로젝트 후보군 모음

구글 머신러닝 부트캠프 캐글 미션 수행을 위한 프로젝트 후보군 3가지

1. Titanic - Machine Learning from Disaster

사유 : 해당 프로젝트에 대해 참고할 수 있는 자료가 많고, 다른 사람의 코드로 먼저 한 번 학습 후 프로젝트를 이해하면 내 코드로 변환하는 것이 매우 용이하다.

예상 프로젝트 수행 기간 : 3일 예정

2. House Prices - Advanced Regression Techniques

사유 : 학교에서 머신러닝 프로젝트로 Beginning 프로젝트를 해봤고, 해당 프로젝트의 심화 과정으로 보인다. 마찬가지로 내 코드로 이해하고 작업하는 과정이 매우 용이해질 것으로 보인다.

예상 프로젝트 수행 기간 : 3일 예정

3. Digit Recognizer

사유 : 컴퓨터 비전 관련 프로젝트는 수행해 본 적이 없고, CNN을 활용한 프로젝트 경험을 시작 단계로 해보기 좋을 것 같아 프로젝트 후보 중 하나로 선발

예상 프로젝트 수행 기간 : 7일 예정 (CNN 학습을 제외한 사전 지식이 없는 상태)

우선 시작하는 프로젝트 후보는 이렇게 잡을 수 있을 것 같고, 이후에 위의 프로젝트들을 수행하고 나면 프로그래머스에서 제공하는 기업 실습 머신러닝 문제도 한 번 풀어보자.

생각보다 어려울 것 같다는 생각이 많이들지 않는다.

[TF Env Set in M1 Error] python 3.8.0 환경에서 scipy가 M1 맥에서 설치가 안되는 상황 & python 3.9.7에서 Tensroflow가 M1 맥에서 설치가 안되는 상황에 대한 대처

어제 저녁 -> 오늘 오전까지 윈도우의 CPU를 사용해서 딥러닝 훈련을 시켜봤고, epoch이 15번 밖에 안되고 배치 사이즈도 250 밖에 안되는데 해당 코드를 돌릴 때마다 3시간의 시간이 소요되는 말도 안되는 상황을 겪으면서 이건 도저히 시험을 볼 수 있는 환경이 아니다 싶어 결국 다시 M1 맥북으로 돌아와 환경 설정을 하는 것을 진행하게 되었다.

총 소요 시간은 8시간 남짓이고 시도한 것은 다음과 같다.

1. python 3.8.0 환경에서 다음과 같은 환경을 세팅

tensorflow==2.4.0rc
tensorflow-datasets==4.3.0
Pillow==8.2.0
pandas==1.2.4
numpy==1.19.5
scipy==1.7.0

발생한 에러 : scipy를 제외하고 모두 설치되었으나 scipy가 파이썬 3.8 버전에서 M1 맥북을 지원하지 않는 게 가장 큰 문제였다.

로제타2처럼 번역기를 사용해서 설치하는 것도 찾아봤으나 도저히 자료가 없었고, 결국 돌아온 것은 scipy는 아직 3.8 버전에서 M1 Apple Sillicon을 지원하지 않는다는 글들 뿐이었다.

여기서 문득 떠오른 게, "아니, 어차피 정확하게 텐서플로우에서 요구하는 환경만 쓰는 건 절대 아닐꺼고 파이썬 언어 버전을 높이면 설치가 되는 거 아닌가?" 싶어서 찾아보니 M1 맥에 공식적으로 scipy가 지원하기 시작하는 파이썬 버전은 3.9부터라는 것을 알게 되었다.

2. python3.9.7 환경에서 다음과 같은 환경을 세팅

tensorflow==2.5.0
tensorflow-datasets==4.3.0
Pillow==8.2.0
pandas==1.2.4
numpy==1.19.5
scipy==1.7.0

발생한 에러 : 파이썬 3.9 버전을 설치하고 파이참에서 해당 파이썬 버전으로 가상 환경을 다시 조성한 다음에 위 모듈들을 설치하니, 하나도 에러 없이 설치가 되었다.

그런데 설치만 성공했지, 정상적으로 작동한다고는 말 안했다.

텐서플로우 코드 예제를 돌려보니, illegal hardware instruction tensorflow라는 에러를 목격하게 되었다.

찾아보니 인텔 칩이 아닌 반도체 칩에서 작동 안한다는 뜻이다.

즉, 텐서플로우에서 자체적으로 번역기를 사용해서 M1 실리콘 칩을 인식해야하는 상황인 것이다.

그래서 결국 1번째 시도에서 진행했던 tensorflow 2.4.0rc를 설치하고자 했는데,,, 호환되는 버전이 3.8 이다.

scipy를 얻고, tensorflow를 버린 것이다.

이건 도저히 해결이 안되겠다 싶어서 노트북을 누구한테 빌려야되나 싶었는데, 모든 걸 포기한 상황에서 유튜브에 시험 후기를 보는데 하단의 링크를 발견하게 되었다.

(이건 신이 나를 도운 게 틀림 없다)

3. 실제 시험 환경에 대한 영상

텐서플로우 시험을 보는 과정을 담은 유튜브 영상

이 영상을 보면 텐서플로우 시험 응시부터 시험 결과물 제출까지 모든 게 다뤄지고 있다.

보면 .h5 파일을 생성해서 제출하는 방식이다.

심지어 살짝살짝 시험 문제도 보이는데 코세라에서 배운 시험 문항과 거의 동일하다.

즉, .h5 파일을 제출하고 이 모델 파일을 플러그인에서 평가하는 것이지 모듈이 모두 필요한 것은 아닌 것으로 보인다.

다시 말해, 가상 머신에서 GPU를 돌려서 모델 생성 후, .h5 파일로 저장해서 그 코드만 제출해도 된다는 뜻이다.

총평 : 이걸로 오늘 하루의 33% (8시간)를 날렸다.

덕분에 딥러닝 필수 모듈들 중에 M1 맥에서 작동하는 것과 작동 안하는 것에대해 깊이 분석해 볼 시간을 가진 것 같은데, 말이 좋아서 깊은 분석이지 나쁜 말로는 삽질 기가 막히게 한거다.

금요일 시험치를 예정인데 미리 해보길 잘했다.

아, 진짜 구글 측에서 설명 좀 잘 해놓지, 괜히 로컬에서 안해도 되는 고생만 엄청한 느낌이다.

[Memo] 인공 신경망의 학습 구조

이미지가 포함된 과제 링크

위 인공 신경망의 학습 과정은 다음과 같습니다.

가중치와 편향을 초기화 시킨 후 --> 인공 신경망은 입력에 대해서 순전파(forward propagation) 연산 진행 --> 순전파 연산을 통해 나온 예측값과 실제값의 오차를 손실 함수(loss function)을 통해 계산 --> 이 손실(loss)을 미분을 통해서 기울기(gradient)를 구하고 --> 이를 통해 역전파(back propagation)를 수행

인공 신경망의 학습은 오차를 최소화하는 가중치를 찾는 목적으로 순전파와 역전파를 반복하는 것을 말합니다.

Mission 7 : 4th course: Convolutional Neural Networks 마무리 & 5th course: Sequence Models 1주차 수강

수강 기간 : 9월 20일 ~ 9월 27일
Week4 : 4th course: Convolutional Neural Networks, Special applications: Face recognition & Neural style transfer
Week1 : 5th course: Sequence Models, Recurrent Neural Networks

Mission 4 : Improving Deep Neural Networks: Hyper parameter tuning, Regularization and Optimization

수강 기간 : 8월 30일 ~ 9월 6일

Week 2. Optimization algorithms
Week 3. Hyper parameter tuning, Batch Normalization and Programming Frameworks

[Certificate] Tensorflow Developer Certificate 준비

시험 예정일 : 9월 24일

해당 시험을 빠르게 치르고 10월 15일 전에 조기 수료할 경우, GCP Data Engineer 시험 지원비까지 제공받는다.

시험은 Tensorflow in Practice 하나로 준비하면 되고, 시험이 쉽다고 하니 추석이 낀 것을 감안해서 3주내로 공부해서 마무리지어야겠다.

GCP Data Engineer가 보통 2달 정도 공부하는 시간이 필요하다고 하니, 하반기 한 번 힘차게 마무리해보자.

이전 기수 수강생 현황을 살펴보니 GCP 데이터 엔지니어 수료증 학습을 위한 문제 은행이 있다고 한다. 그걸 중심으로 살펴보면 좋을 것 같다.

Tensorflow-in-Practice 코세라 강의 완강
텐서플로우 시험 보기 (9월 15일 예정)

Mission 1 : Coursera Deep Learning Specialization, Neural Networks and Deep Learning 수강

수강 기간 : 8월 6일 ~ 8월 16일 오전 9시 까지

수강 완료 시점이 아닌 인증서 제출까지 포함한 시간입니다.

수강 범위

1st course: Neural Networks and Deep Learning

Week 1. Introduction to deep learning
Week 2. Neural Networks Basics

수강 완료 인증 기간 : 8월 16일 오전 9시 까지 인증 양식에 제출

인증 시간을 1분이라도 넘긴 경우는 미션 실패 처리가 되니 수강하시고 바로 제출하시기 바랍니다.

파일명 : 본인이름_코세라 1주

다음 미션 안내: 8월 16일 오전 메일로 안내 혹은 권장 진도표에서 사전에 확인

[Assignment Error] Course 5, Week 1: AttributeError in music_inference_model(LSTM_cell, densor, Ty=100)

Error Explanation

AttributeError: The layer “lstm” has multiple inbound nodes, with different output shapes. Hence the notion of “output shape” is ill-defined for the layer. Use get_output_shape_at(node_index) instead.

# UNQ_C2 (UNIQUE CELL IDENTIFIER, DO NOT EDIT)
# GRADED FUNCTION: music_inference_model

def music_inference_model(LSTM_cell, densor, Ty=100):
    """
    Uses the trained "LSTM_cell" and "densor" from model() to generate a sequence of values.
    
    Arguments:
    LSTM_cell -- the trained "LSTM_cell" from model(), Keras layer object
    densor -- the trained "densor" from model(), Keras layer object
    Ty -- integer, number of time steps to generate
    
    Returns:
    inference_model -- Keras model instance
    """
    
    # Get the shape of input values
    n_values = densor.units
    # Get the number of the hidden state vector
    n_a = LSTM_cell.units
    
    # Define the input of your model with a shape 
    x0 = Input(shape=(1, n_values))
    
    
    # Define s0, initial hidden state for the decoder LSTM
    a0 = Input(shape=(n_a,), name='a0')
    c0 = Input(shape=(n_a,), name='c0')
    a = a0
    c = c0
    x = x0

    ### START CODE HERE ###
    # Step 1: Create an empty list of "outputs" to later store your predicted values (≈1 line)
    outputs = []
    
    # Step 2: Loop over Ty and generate a value at every time step
    for t in range(Ty):
        # Step 2.A: Perform one step of LSTM_cell. Use "x", not "x0" (≈1 line)
        a, _, c = LSTM_cell(inputs=x, initial_state=[a,c])
        
        # Step 2.B: Apply Dense layer to the hidden state output of the LSTM_cell (≈1 line)
        out = densor(a)
        # Step 2.C: Append the prediction "out" to "outputs". out.shape = (None, 90) (≈1 line)
        outputs.append(out)
        
        # Step 2.D: 
        # Select the next value according to "out",
        # Set "x" to be the one-hot representation of the selected value
        # See instructions above.
        x = tf.math.argmax(out, axis= -1) # 여기서 차원 변환 에러 발생
        x = tf.one_hot(x, depth=n_values)
        # Step 2.E: 
        # Use RepeatVector(1) to convert x into a tensor with shape=(None, 1, 90)
        x = RepeatVector(1)(x)

    # Step 3: Create model instance with the correct "inputs" and "outputs" (≈1 line)
    inference_model = Model(inputs=[x0, a0, c0], outputs=outputs)
    
    ### END CODE HERE ###
    
    return inference_model

Error Solution

        x = tf.math.argmax(out, axis= -1) # 여기서 차원 변환 에러 발생
        x = tf.one_hot(x, depth=n_values)

이 2개의 코드에서 차원 변환하는 게 상당히 애먹어서 deeplearning.ai에서 수강생들이 남긴 에러를 보고 해결할 수 있게 되었다.

주어진 Tensor를 (None, 90)으로 변경하고 (axis = -1) 그 후, one hot encoding 기법으로 (None, 90,90)으로 변경한다.

최종적으로 RepeatVector(1)(x)를 사용해서 (None, 1, 90) 텐서로 변경하는데 계속 결과 값이 (90, 1, 90)이 나와서 어떤 에러인지 해멨다.

구글에 올라온 다른 사람들 주피터 노트북 답을 보고 해결하려고 했는데, 정답이 아닌 경우가 대다수였고 (특히 axis 값이 최신화되면서 답이 달랐다)

주피터 노트북 커널이 반응이 느려서 그런지 고친 값이 빨리 반영 안되서 해멘 것도 한 몫했다.

이걸로만 한 시간 잡아먹은 듯 싶다.

[Interview] 하루에 5개씩 답변 준비하는 데이터 사이언티스트 면접 질문지 모음

--> 질문지 원본 레포

공통 질문

왜 해당 직군으로 지원했나요?
왜 저희 회사에 지원하셨나요?
해당 직군의 매력이 무엇이라고 생각하나요?
해당 직군에서 본인의 장점은?
해당 직군을 하면서 이루고자 하는 목표는?
해당 직군을 하기 위해 어떤 노력을 했나요?
왜 저희가 지원자를 뽑아야 하나요?
지원자의 단점은 무엇인가요?

ryankor / 2021-google-ml-bootcamp Goto Github PK

2021-google-ml-bootcamp's Introduction

Google Machine Learning Bootcamp 2021

1. Application Quiz Answer

2. Coursera Deep Learning Specialization

3. Tensorflow Developer Certificate

4. Kaggle Project

5. GCP Professional Data Engineer Certificate

(Optional) 6. Programmers Dev-Match 미술작품 분류하기

2021-google-ml-bootcamp's People

Contributors

Stargazers

Watchers

2021-google-ml-bootcamp's Issues

Lecture 1 Reference

Lecture 2 Reference

Lecture 4 Reference

Lecture 5 Reference

구글 머신러닝 부트캠프 캐글 미션 수행을 위한 프로젝트 후보군 3가지

1. Titanic - Machine Learning from Disaster

사유 : 해당 프로젝트에 대해 참고할 수 있는 자료가 많고, 다른 사람의 코드로 먼저 한 번 학습 후 프로젝트를 이해하면 내 코드로 변환하는 것이 매우 용이하다.

예상 프로젝트 수행 기간 : 3일 예정

2. House Prices - Advanced Regression Techniques

사유 : 학교에서 머신러닝 프로젝트로 Beginning 프로젝트를 해봤고, 해당 프로젝트의 심화 과정으로 보인다. 마찬가지로 내 코드로 이해하고 작업하는 과정이 매우 용이해질 것으로 보인다.

예상 프로젝트 수행 기간 : 3일 예정

3. Digit Recognizer

사유 : 컴퓨터 비전 관련 프로젝트는 수행해 본 적이 없고, CNN을 활용한 프로젝트 경험을 시작 단계로 해보기 좋을 것 같아 프로젝트 후보 중 하나로 선발

예상 프로젝트 수행 기간 : 7일 예정 (CNN 학습을 제외한 사전 지식이 없는 상태)

1. python 3.8.0 환경에서 다음과 같은 환경을 세팅

2. python3.9.7 환경에서 다음과 같은 환경을 세팅

3. 실제 시험 환경에 대한 영상

Error Explanation

Error Solution

Contents

공통 질문

프로젝트

통계 및 수학

분석 일반

머신러닝

딥러닝

딥러닝 일반

컴퓨터 비전

자연어 처리

강화학습

GAN

추천 시스템

데이터베이스

데이터 시각화

시스템 엔지니어링

분산처리

웹 아키텍쳐

서비스 구현

대 고객 사이드

개인정보

Reference

에러 개요

에러 원인

해결법

내가 따라해 볼 수 있는 기술 블로그 모음

에러 설명

Exercise 2를 해결하는 과정에서 에러 발생

해결

경과

서비스 제작에 대한 전반적인 프로세스

백엔드 애플리케이션에 머신러닝 모델을 함께 얹어서 배포하지 않는 이유?

1. 에러 발생 경위 : 연습문제 3번의 one_hot_matrix문제를 해결하는 과정에서 발생

2. 연쇄 에러 : new_y_test / new_y_train 변수 지정

3. 연쇄 에러 : Exercise 6 - compute_cost

4. 결과 예측 그래프 이미지

5. 경과

Recommend Projects

Recommend Topics

Recommend Org

1. 에러 발생 경위 : 연습문제 3번의 `one_hot_matrix`문제를 해결하는 과정에서 발생

2. 연쇄 에러 : `new_y_test / new_y_train` 변수 지정

3. 연쇄 에러 : `Exercise 6 - compute_cost`