목록AI (33)
정리노트
강화학습과 다른 학습과의 가장 큰 차이점은강화학습은 "정답(Label), 올바른 행동"을 학습할때'지침(Instruction)'이 아니라, '평가(Evaluation)'하는 정보를 사용하여 학습한다는 것입니다. 지침적인(Instructive) 피드백은 실제로 취해진 행동과는 상관없이 취해야할 행동을 알려줌으로서 학습이 진행됩니다.일반적인 Machine Learning알고리즘의 학습법이 여기에 해당합니다. 반면, 평가적인(Evaluative) 피드백은 취해진 행동이 얼마나 좋은지를 나타낼 뿐 그것이 최고의 행동인지, 최악의 행동인지는 알려주지 않습니다. 정리하면,평가적인 피드백은 취해진 행동에 전적으로 의존하는 반면, 지침적인 피드백은 취해진 행동과는 무관하게 이루어집니다. Chapter2에서는 주로 ..
강화학습의 Bible이라고 불리는 "단단한 강화학습". 조금 욕심내서 제대로 읽어보고 싶은마음에따로 정리해보면서 읽기로 마음먹고 포스팅을 진행하게됐습니다. 각 챕터별로 포스팅하면서코드구현해볼 수 있는 부분은 코딩하고 깃허브에 업로드해보면서 공부를 진행해보려고합니다. 그리고,추후 공부하면서 유용했던 추가적인 자료들은 여기 포스팅에 지속적으로 업데이트할 예정입니다. - 교재 원본 및 기타링크 http://incompleteideas.net/book/the-book-2nd.html Sutton & Barto Book: Reinforcement Learning: An Introduction incompleteideas.net - 예제 풀이https://github.com/krex4715/Reinforcem..
https://www.youtube.com/watch?v=dw0sHzE1oAc&list=PLldiB_QS6edl3h831ZrSG8crEWOvPWeun&index=4 발표자료 https://www.slideshare.net/NaverEngineering/introduction-of-deep-reinforcement-learning Introduction of Deep Reinforcement Learning 발표자: 곽동현(서울대 박사과정, 현 NAVER Clova) 강화학습(Reinforcement learning)의 개요 및 최근 Deep learning 기반의 RL 트렌드를 소개합니다. 발표영상: http://tv.naver.com/v/2024376 https://youtu… www.slideshar..
https://www.youtube.com/watch?v=dw0sHzE1oAc&list=PLldiB_QS6edl3h831ZrSG8crEWOvPWeun&index=4 발표자료https://www.slideshare.net/NaverEngineering/introduction-of-deep-reinforcement-learning Introduction of Deep Reinforcement Learning발표자: 곽동현(서울대 박사과정, 현 NAVER Clova) 강화학습(Reinforcement learning)의 개요 및 최근 Deep learning 기반의 RL 트렌드를 소개합니다. 발표영상: http://tv.naver.com/v/2024376 https://youtu…ww..
https://www.youtube.com/watch?v=dw0sHzE1oAc&list=PLldiB_QS6edl3h831ZrSG8crEWOvPWeun&index=4 발표자료https://www.slideshare.net/NaverEngineering/introduction-of-deep-reinforcement-learning Introduction of Deep Reinforcement Learning발표자: 곽동현(서울대 박사과정, 현 NAVER Clova) 강화학습(Reinforcement learning)의 개요 및 최근 Deep learning 기반의 RL 트렌드를 소개합니다. 발표영상: http://tv.naver.com/v/2024376 https://youtu…ww..
아래 영상은 곽동현 연구원님의 1시간 25분짜리 DRL 소개 영상인데요,Deep Reinforcement Learning에 대한 기본 틀을 잡고 시작하기 딱 좋은 영상이라 생각이들어서,영상내용을 쭉 정리해보는 포스팅을 진행해보려 합니다https://www.youtube.com/watch?v=dw0sHzE1oAc&list=PLldiB_QS6edl3h831ZrSG8crEWOvPWeun&index=4 발표자료https://www.slideshare.net/NaverEngineering/introduction-of-deep-reinforcement-learning Introduction of Deep Reinforcement Learning발표자: 곽동현(서울대 박사과정, 현 NA..
지난 포스팅에서 CNN에 대해 3번에 걸쳐서 다뤄보았다. Convolution Layer는 해당 이미지 Pixel 안의 Data를 Input으로 특징정보를 추출 해주는 일종의 Filter고, 이런 Convolution Layer를 이용해 만든 Neural Network를 바로 CNN이라고 한다. 이번 포스팅에서는 CNN을 이용해서 객체 탐지, 즉 Object Detection을 진행하는 것에 대해 다뤄보도록 하겠다. ◆ 목차 ◎ Localization & Detection ◎ Classification With Localization ○ Loss Function ◎ Convolution implementation of Sliding Windows ○ Replace FC Layer to Convolutio..
https://arxiv.org/abs/1512.03385 Deep Residual Learning for Image RecognitionDeeper neural networks are more difficult to train. We present a residual learning framework to ease the training of networks that are substantially deeper than those used previously. We explicitly reformulate the layers as learning residual functions witharxiv.org2015년 위 논문이 발표되고image Classification분야에서 혁신을 일으켰던 ResNet..
지금까지 CNN 포스팅에서, CNN의 여러가지 Building Block과 이를 바탕으로한 가장 기초적인 CNN Model에 대해서 살펴보았다. 이번에 포스팅할 내용은 이런 CNN모델 Architecture의 Reference들이다. ◆ 목차 ◎ Classic Networks with CNNs ○ LeNet-5 ○ AlexNet ○ VGG Net ◎ Classic Networks with CNNs ○ LeNet-5(1998) 오래전 제안된 Architecture로, MaxPooling대신 Avg Pooling이 쓰이고, Cross Entropy대신 L2 Distance가 쓰이는 게 \ 최근 Architecture와는 많이 다르다는 것을 알 수 있다. https://ieeexplore.ieee.org/st..
지난번 포스팅에서, CNN Architecture에는 크게 3가지 Building Block이 있다고 했다. -> Convoluion Layer, Fully Connected Layer, Pooling Layer 직전 포스팅에서 Convoluion Layer, Fully Connected Layer에 대해서는 다뤘고, 이번 포스팅에서는 나머지 Building Block인 Pooling Layer에 대해서 다뤄보려고 한다. 그리고, 이런 Building Block으로 만든 CNN의 예시로 어떤 것들이 있는지 살펴보고, Pytorch상에서 이를 어떻게 구현하는지 알아보겠다. ◆ 목차 ◎ A Simple Convolution neural Network ◎ Pooling Layers ○ Max Pooling ○..