전체 글
1. Deep Learning == Representation Learning ? 인공지능은 사람이 직접 프로그래밍 한 내용이 아니라 기계가 자체 규칙 시스템을 구축하는 과학을 말한다. 그 중에서도 머신러닝은 데이터를 통해 스스로 학습하는 방법론을 말한다. 데이터를 분석하고, 데이터 안에 있는 패턴을 학습하며, 학습한 내용을 토대로 판단이나 예측을 한다. 머신러닝의 하위 집합인 딥러닝은 학습하는 모델의 형태가 신경망인 방법론을 말한다. Representation Learning 이러한 꽃이라는 데이터를 표현하는 방법은 여러가지가 있다. 이러한 표현방법은 계층적인 관계를 가지고 있다. 위에서 아래로 갈 수록 점점 사람이 더 많이 개입한다는 것이다. 물론 딥러닝 모델이 아무리 잘 학습되어도 '꽃잎의 색'은 ..
1. Baseline 세팅하기 Baseline은 기본적으로 문제 해결을 시작할 때 쉽게 사용해볼 수 있는 샘플이다. 보통 대회에서 Baseline은 제공이 되는 경우도, 아닌 경우도 있는데 이번 대회는 특히 교육적인 성격도 있어서 제공이 되었다. 다음과 같은 페이지에서 ipynb파일을 다운 받아 로컬에 저장하자. # 데이터 시각화를 위한 import import matplotlib.pyplot as plt %matplotlib inline %config InlineBackend.figure_format = 'retina' 2. 라이브러리, 데이터 가져오기 # 필요한 라이브러리 import import warnings warnings.filterwarnings("ignore") import os from ..
1. 디지털 이미지 디지털 화면은 수많은 점들로 이루어져 있으며, 색상을 가지는 점 하나를 화소(pixel, picture element)라고 한다. 각 화소는 RGB(Red, Green, Blue) 세 개의 단일 색의 강도를 각각 조절하여 색상을 표현한다. 왜 RGB 3개의 영역으로 이루어져 있을까? 그 이유는 인간의 눈의 망막에 있는 시세포가 인간의 경우 대부분 세 가지로 이루어져 있기 때문이다. 💡 래스터(raster) or 비트맵(bitmap) 방식 빨강, 초록, 파랑 세 가지 색의 강도로 표현되는 점들로 구성된 디지털 화면에 표시될 이미지를 저장하는 방법, 보통 한 점마다 각 색상별로 8비트를 사용하여 0~255 사이의 값으로 해당 생의 감도를 표시한다. 💡 벡터(vector) 방식 상대적인 점..
Lecture 3 | Loss Functions and Optimization Loss fuction loss function을 설명하기 위해 몇 가지 가정을 두었다. 가정 : 3개의 training 이미지가 있고 f(x,W) = Wx라는 분류기에 넣어 3개의 class로 분류하여 3개의 score를 계산하였다. 주어진 데이터의 수식은 다음과 같다. 여기서 x_i는 입력 데이터 (여기서는 3장의 이미지), y_i는 정답 라벨 (여기서는 고양이, 차, 개구리)를 나타낸다. 일반적인 최종loss를 구하는 수식은 다음과 같다. loss는 각각의 이미지에 score값, 정답라벨을 가지고 loss fuction을 구한 뒤 그것들의 합을 구하고 전체 N개로 나눈 것이다. Multiclass SVM loss loss..
Lecture 2 | Image Classification Image Classification (이미지 분류) Image classification concept 이미지 분류는 컴퓨터 비전에서 중요한 과업이다. 컴퓨터 비전에서 이미지분류 과정은 다음과 같다. 이미지를 입력 데이터로 넣는다. 카테고리가 담긴 것들 중 하나를 골라 낸다. The Problem 하지만 이러한 과정에는 문제점들이 있다. 위와 같이 컴퓨터는 사람과 달리 이미지를 일련의 숫자들로 인식한다. Challenges 이미지 분류에서는 위의 문제점말고도 많은 문제점들이있다. Viewpoint variation (객체를 보는 각도) Illumination (조명) Deformation (객체의 형태 변환) Occlusion (객체가 가려짐)..
이번에 Study&Post의 주제는 스텐포드 대학의 딥러닝 강의인 CS231n이다. 나는 밑바닥부터 시작하는 딥러닝을 읽고 딥러닝에 대한 개념이 얼추(?) 잡힌 상태이다. 하지만 이것에 픽스하지 않고 이해한 내용들을 바탕으로 다른관점에서 바라보는 것도 중요하다고 생각하여 다시 한 번 딥러닝에 대한 스터디를 선택하였다. 다행히 지금 교육받고 있는 Aiffel의 풀잎스쿨에서 CS231n을 진행한다 하여 이번에는 단체 스터디 형식으로 진행될 것 같다. 하지만 Aiffel에서는 한 주의 한 강씩 해서 총 6주동안 6강의 강의를 진행할 것 같아 나머지는 따로 혼자 진행할 예정이다. 또한 1강은 introdution이기 때문에 2강부터 진행할 것이다. 그럼 시작! 🔥 Syllabus http://cs231n.sta..
포켓몬, 그 데이터는 어디서 구할까 1) 안녕, 포켓몬과 인사해! 오늘은 이상해씨, 피카츄, 파이리, 꼬부기 등 .. 일반 포켓몬이랑 칠색조와 같은 전설의 포켓몬을 공격력, 방어력 등의 스탯으로 분류해 볼 것이다. 이러한 과정을 탐색적 데이터 분석 (Exploratory Data Analysis 이하 EDA)이하고 한다. 2) 포켓몬, 그 데이터는 어디서 구할까 포켓몬 dataset은 케글에 업로드되어 있는 ‘’Pokemon with stats’’라는 데이터 셋이다. 데이터의 구성은 다음과 같다. #: ID for each pokemon Name: Name of each pokemon Type 1: Each pokemon has a type, this determines weakness/resistanc..
1. 시퀀스? 스퀀스!I 파이썬에서의 시퀀스 자료형 값이 연속적으로 이어진 자료형들을 총칭하여 ‘시퀀스 자료형(sequence type)’이라고 한다. 인공지능이 예측을 하기위해서는 어느 정도는 연관성이 있어야한다. 2. 다음 am을 쓰면 반 이상은 맞더라 순환신경망(RNN) 우리는 ‘나는 밥을’이라는 input을 가지고 ‘먹었다’라는 output을 예측할 수 있다. 그러면 ‘나는’ 이라는 output을 내려면 어떻게 할까? 순환신경망에서는 output을 다시 input으로 사용해 이러한 문제를 해결한다. 이러한 순환적 구조에서 시작과 끝은 , 라는 것을 사용해 알아낼 수 있다. sentence = " 나는 밥을 먹었다 " source_sentence = "" + sentence target_senten..
1. 내가 직접 만드는 강아지 고양이 분류기 모델 학습을 위한 데이터셋(dataset) 준비하기 tensorflow_datasets는 텐서플로우가 제공하는 데이터셋 모음집이다. tensorflow_datasets에서 제공되는 데이터섹의 범주 Audio Image Object_detection Structured Summarization Text Translate Video cats_vs_dogs 데이터셋 가져오기 (raw_train, raw_validation, raw_test), metadata = tfds.load( 'cats_vs_dogs', split=['train[:80%]', 'train[80%:90%]', 'train[90%:]'], with_info=True, as_supervised=Tr..



