AIFFEL/exploration
Exprolation 17 난 스케치를 할 테니 너는 채색을 하거라 조건 없는 생성모델(Unconditional Generative Model), GAN 만약 GAN으로 MNIST data를 생성해낸다면 아래와 같이 생성될 것이다. 여기서 우리는 7이라는 숫자가 생성되기를 원하지만 GAN은 일정 확률로 0~9까지의 숫자를 만든다. 따라서 우리가 원하는 7이라는 값을 얻기 위해서는 수많은 노이즈를 생성해 넣어야할지도 모른다. 즉 일반적인 GAN과 같은 unconditioned generative model은 내가 생성하고자 하는 데이터에 대해 제어하기 힘들었다. 조건 있는 생성모델(Conditional Generative model), cGAN Conditional Generative Adversarial..
Exploration 16 다음에 볼 영화 예측하기 Session-Based Recommendation Session-Based Recommendation이란? 세션 데이터를 기반으로 유저가 다음에 클릭 또는 구매할 아이템응ㄹ 예측하는 추천 Session: 유저가 서비스를 이용하면서 발생하는 중요한 정보를 담은 데이터를 말하며, 블라우저가 조료되기 전까지 유저의 행동을 담은 시퀀스 데이터 사용데이터: YOOCHOOSE, 추천 엔진 솔류션 회사에서 공개한 E-Commerce데이터 유저에 대한 정보를 전혀 알 수 없다.(성별, 나이, 장소, 마지막 접속 낳짜, 이전 구매 내역 등등) 아이템에 대한 정보도 전혀 알 수 없다.(실제로 어떤 물건인지, 사진이나 설명, 가격) 비로그인 상태로 탐색하는 유저가 많다...
Exploration 15 문자를 읽을 수 있는 딥러닝 기계가 읽을 수 있나요? 사람이 문자를 읽는 방법 문자를 인식 인식한 문자를 해독 컴퓨터 비전에서의 용어 Detection Recognition 구글 OCR API def detect_text(path): """Detects text in the file.""" from google.cloud import vision import io client = vision.ImageAnnotatorClient() with io.open(path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.text_detection(..
Exploration 14 아이유팬이 좋아할 만한 다른 아티스트 찾기 추천 시스템이란 게 뭔가요? 협업 필터링 vs 콘텐츠 기반 필터링 협업 필터링은 다수의 사용자의 아이템 구매 이력 정보만으로 사용자간 유사성 및 아이템 간 유사성을 파악하지만, 콘텐츠 기반 필터링은 아이템의 고유의 정보를 바탕으로 아이템 간 유사성을 파악한다. 다시 말해, 협업 필터링에서는 아이템과 사용자 간의 행동 또는 관계에만 주목할 뿐 아이템 자체의 고유한 속성에 주목하지 않고 콘텐츠 기반 필터링에서는 아이템 자체의 속성에만 주목하고 사용자와 아이템 간의 관련성에는 주목하지 않는다. 협업 필터링을 바로 사용할 수 없게 만드는 세가지 제약 조건 시스템이 충분한 정보를 모으지 못한 사용자나 아이템에 대한 추론을 할 수 없는 상태인 콜..
Exploration 13 인간보다 퀴즈를 잘푸는 인공지능 KorQuAD Task KorQuAD 데이터셋 KorQuAD(The Korean Question Answering Dartaset, 한국어 질의응답 데이터셋) 이 데이터셋은 미국 스탠퍼드 대학에서 구축한 대용량 데이터셋인 SQuAD를 벤치마킹한 것이다. 자연어처리 분야에서 기꼐독해 태스크는 머신이 자연어의 의미를 정확하세 이해하고 사람의 질문에 정확하게 답변할 수 있는지를 측정하는 아주 중요한 분야이다. # imports from __future__ import absolute_import, division, print_function, unicode_literals import tensorflow as tf import tensorflow.ke..
Exploration 12 트랜스포머로 만드는 대화형 챗봇 트랜스포머와 인코더 디코더 인코더: 입력문장 디코더: 이에 상응하는 출력문장을 생성 이를 훈련한다는 것은 결국 입력 문장과 출력문장두 가지 병렬 구조로 구성된 데이터셋을 훈련한다는 의미이다. 트랜스포머의 인코더와 디코더 트랜스포머는 기본적으로 인코더와 디코더 구성을 가지고 있다. 초록색 도형: 인코더 층, 입력문장의 정보를 뽑아냄 분홍색 도형: 디코더 층, 출력문장의 단어를 하나씩 만들어가는 구조 트랜스포머의 입력 이해하기 import tensorflow as tf import tensorflow_datasets as tfds import os import re import numpy as np import matplotlib.pyplot as ..
Exploration 11 어제 오른 내 주식, 과연 내일은? 미래를 예측한다는 것은 가능할까? 아래와 같은 미래 예측 시나리오를 생각해 보자 지금까지의 주가 변화를 바탕으로 다음 주가 변동 예측 특정 지역의 기후데이터를 바탕으로 내일의 온도 변화 예측 공장 센터 데이터 변화 이력을 토대로 이상 발생 예측 위 에시의 공통점은 예측의 근거가 된느 시계열(Time-Series)데이터가 있다는 것이다. 시계열이란? 시간 순서대로 발생한 데이터의 수열이다. 시계열 데이터로 미래의 데이터를 에측하기위해서는 두 가지의 전제가 필요하다. 과거의 데이터에 일정한 패턴이 발견된다. 과거의 패턴은 미래에도 동일하게 반복될 것이다. → 즉, 안정적(Stationary)데이터에 대해서만 미래 예측이 가능하다. 시계열 데이터 ..
없던 데이터를 만들어낸다. 생성 모델링 모델 판별 모델 : 입력된 데이터셋을 특정 기준에 따라 분류하거나, 특정 값을 맞추는 모델 생성 모델 : 학습한 데이터셋과 비슷하면서도 기존에는 없던 새로운 데이터셋을 생성하는 모델로 정리할 수 있습니다. Pix2Pix Pix2Pix란? 간단한 이미지를 입력할 경우 실제 사진처럼 보이도록 바꿔줄 때 많이 사용되는 모델이다. 모델은 단순화된 이미지(input image)와 실제 이미지(Ground Truth)가 쌍을 이루는 데이터셋으로 학습을 진행한다. Input image를 입력받으면, 내부 연산을 통해 실제 사진 같은 형상으로 변화된 Predicted Image를 출력 Predicted Image가 Ground Truth 이미지와 얼마나 비슷한지 평가하여 실제 같..
의료영상에 대해 의료 영상 종류 X-RAY: 전자를 물체에 충돌시킬 때 발생하는 투과혁이 강한 복사선(전자기파), X-RAY는 방사선의 일종으로 지방, 근육, 천, 종이같이 밀도가 낮은 것은 수월하게 통과하지만, 밀도가 높은 뼈, 금속 같은 물질은 잘 통과하지 못한다. CT: Computed Tomography의 줄임말로, 환자를 중심으로 X-RAY를 빠르게 회전하여 3D 이미지를 만들어내는 영상, 환자의 3 차원 이미지를 형성하여 기본 구조는 물론 가능한 종양 또는 이상을 쉽게 식별하고 위치를 파악할 수 있다. MRI: Magnetic Resonance Imaging(자기 공명 영상)의 줄임말로 신체의 해부학적 과정과 생리적 과정을 보기 위해 사용하는 의료 영상 기술, MRI 스캐너는 강한 자기장를 사..



