전체 글
Multiplying a vector by a scalar Vector examples Multiplying a vector by a scalar 벡터와 스칼라의 곱셈 아래와 같이 한 개의 벡터와 스칼라값이 있을 때 두 개의 곱연산은 다음과 같다. 스칼라 값은 벡터의 각각의 element들에게 곱해진다. 이것을 그래프로 그리면 다음과 같다. 벡터 (2,1)은 스칼라 3과 곱해져 벡터 (6,3)이 되었다. 이 때 벡터의 크기는 변하지만 방향은 변하지 않았다. 벡터 (2, 1)과 스칼라 -1을 곱하는 경우를 생각해 보자. 벡터 a에 스칼라 값 -1을 곱했더니 크기는 바뀌지 않았지만 방향이 바뀐것을 확인 할 수 있다. 정리 벡터의 양수인 스칼라 값(1을 제외한)을 곱하면 크기가 변한다. 벡터의 음수인 스칼라 ..
텍스트 요약(Text Summarization)이란? 텍스트 요약(Text Summarization)이란 위 그림과 같이 긴 길이의 문서(Document)원문을 핵심 주제만으로 구성된 짧은 요약(Summary)문장들로 변환하는 것을 말한다. 텍스트 요약시 주의할 점 요약 전후에 정보 손실 발생이 최소화되야한다. 즉, 텍스트의 길이가 크게 줄어들었지만, 요약문은 문서 원문이 담고 있는 정보를 최대한 보존하고 있어야한다. 텍스트 요약 방법 추출적 요약(Extractive Summarization) 추상적 요약(Abstractive Summarization) 추출적 요약(Extractive Summarization) 추출적 요약이란? 단어 그대로 원문에서 문장들을 추출해서 요약하는 방식 ex. 10개의 문장이..
Vector into linear algebra Real coordinate spaces Adding vector algebraically & graphically Vector into linear algebra vector 💡 Vector = Magnitude(크기) + Direction(방향) 벡터는 크기와 방향 모두를 동시에 가지고 있는 것이다. vector example 다음과 같은 예시를 보면 5마일은 단지 크기일 뿐이고 East는 방향일 뿐이다. 하지만 이 두 개를 합친다면 크기와 방향 모두 가지고 있어 그것은 vector가 된다. vector graph (5,0)이라는 벡터가 있을 때 위와 같은 수식으로 표기하고 그린다. 여기서 중요한 점은 시작점은 다르지만 크기와 방향이 같기 때문에 같은 ..
비지도학습(Unsupervised learning)이란? 지도학습과 달리 training data 로 정답(label)이 없는 데이터가 주어지는 학습방법이다. 오로지 데이터셋의 특징(feature) 및 패턴을 기반으로 모델 스스로가 판단한다. 비지도학습의 대표적인 에시 군집화(clustering) → K-means, DBSCAM 차원 축소(demensionality reduction) → PCA(Principal Component Analysis), T-SNE 데이터시각화 생성모델(generative model) 클러스터링 K-means 군집화(clustering)이란? 명확한 분류 기준(label)이 없는 상황에서도 데이터들을 분석하여 가까운것들끼리 묶어 주는 작업이다. K-means알고리즘이란? k값..
셸로우 포커스(shallow focus) 배경을 흐리게 하는 기술, 얕은 피사계 심도(shallow depth of field)라고도 불림 사진을 준비하자 하나의 카메라로 셸로우 포커스를 만드는 방법 배경이 있는 셀카를 촬영합니다. (배경과 사암의 거리가 약간 멀리 있으면 좋습니다.) 시맨틱 세그멘테이션(Semantic segmentation)으로 피사체와 배경을 분리합니다. 블러링(bluring) 기술로 배경을 흐리게 합니다. 피사체를 배경의 원래 위치에 합성합니다. import os import urllib # 웝에서 데이터를 다운로드할 때 사용 import cv2 # 이미지를 처리할 때 사용 import numpy as np from pixellib.semantic import semantic_se..
회귀(Regression)에 대하여 회귀분석이란? 통계학에서 전통적으로 많이 사용되던 분석방법으로, 관팔된 영러 데이터를 기반으로 각 연속형 변수 산의 관계를 모델링하고 이에 대한 적합도를 측정하는 분석 오늘날의 회귀분석이한 단순히 평균으로 수렴하는 현상을 넘어서서, 두 개 이상의 변수 사이의 함수관계를 추구하는 통계적 방법을 의미한다. 두 변수 사이의 관계를 직선 형태로 가정하고 분석하는 것을 선형 회귀분석(Linear regression)이라고 한다. 선형 회귀분석의 4가지 기본가정 선형성 → 예측하고자 하는 종속변수 y와 독립변수 x간에 선형성을 만족하는 특성 독립성 → 독립변수 x간에 상관관게가 없이 독립성을 만족하는 특성(다중 o, 단순 x) 등분산성 → 분산이 같다는 말, 분산이 같다는 것은 ..
Lecture 4 | Introduction to Neural Networks Backpropagation (역전파) Computation graphs 💡 Computation graph는 단순히 계산과정을 그래프로 나타낸 것이다. 위에 수식에서는 score function, loss function(SVM)을 그래프화 시킨것이다. backpropagation은 gradient를 얻기 위해 computation graph내부의 모든 변수에 대해 chain rule을 recursive하게 사용한다. 지금까지 배운 gradient를 구하는 방법을 다음과 같은 것들에 어떻게 적용할지 생각해보자. 배운것들을 적용할려니 막막할 것 이다. 하지만 backpropagation을 사용하면 쉽게 해결할 수 있다. Bac..
신경망 구성 개요 💡 인공신경망이란? 예전부터 인류는 자연의모습을 본떠 인공적인 물건을 만들려는 시도를 많이 해왔다. 머신러닝/딥러닝 과학자들도 자연에서 답을 찾으려 노력했고, 우리 뇌 속의 신경망 구조에 착안해서 퍼셉트론(Perceptron)이라는 형태를 제안하며 이를 연결한 형태를 인공신경망이라고 한다. 다층 퍼셉트론 구성 입력층 (input layer) 출력층 (output layer) 은닉층 (hidden layer) 위의 이미지처럼 2개이강의 레이어를 쌓아서 만든 것을 보통 다층 퍼셉트론(Multi-Layer Perceptron)이라고 한다. 또한 은닉층의 layer가 많아 질 수록 인공신경망이 deep해졌다고 불르고 그것이 DNN(Deep Neural Network)라고 한다. 💡Tips Fu..
텍스트 감정분석의 유용성 오늘은 IMDb나 네이버 영화 리뷰 텍스트에 담긴 이용자의 감성이 긍정적인지 혹은 부정적인지를 분류(Classification)할 수 있는 딥러닝 모델을 만들어 볼 것이다. Q&A 💡 Q.텍스트 데이터에서만 얻을 수 있는 유용한 정보는 무엇인가요? 그 유용성은 텍스트 데이터의 어떤 특징으로부터 비롯되는 것인가요? A. SNS 등에서 광범위한 분량의 텍스트 데이터를 쉽게 얻을 수 있는데, 이 데이터는 소비자들의 개인적, 감성적 반응이 직접 담겨 있을뿐더러 실시간 트렌드를 빠르게 반영하는 데이터이기도 하다. 💡 Q. 텍스트 감성분석 접근법을 크게 2가지로 나누면 무엇과 무엇이 있나요? A. 기계학습 기반 접근법과 감성사전 기반 접근법** 💡 Q. 사전 기반의 감성분석이 기계학습 기반..



