목록분류 전체보기 (56)
정리노트
지난 포스팅에 이어서 쭉 진행해보도록 하겠습니다. ◆목차 ◎ 긍정적 초깃값 (Optimistic Initial Values) ◎ 신뢰 상한 행동선택 (Upper-Confidence-Bound Action Selection) (UCB) ◎ 경사도 다중선택 알고리즘 (Gradient Bandit Algorithms) ◎ 연관탐색 (Associative Search (Contextual Bandits)) ◎ Chapter_2 Summary ◎ 긍정적 초깃값 (Optimistic Initial Values) 이전 포스팅에서 살펴본 모든 방법 (Stationary, Nonstationary상황에서 표본평균법, 고정된 시간 간격 방법)들은 초기 행동 가치 값(Initial Action Value Estimates)..
강화학습과 다른 학습과의 가장 큰 차이점은강화학습은 "정답(Label), 올바른 행동"을 학습할때'지침(Instruction)'이 아니라, '평가(Evaluation)'하는 정보를 사용하여 학습한다는 것입니다. 지침적인(Instructive) 피드백은 실제로 취해진 행동과는 상관없이 취해야할 행동을 알려줌으로서 학습이 진행됩니다.일반적인 Machine Learning알고리즘의 학습법이 여기에 해당합니다. 반면, 평가적인(Evaluative) 피드백은 취해진 행동이 얼마나 좋은지를 나타낼 뿐 그것이 최고의 행동인지, 최악의 행동인지는 알려주지 않습니다. 정리하면,평가적인 피드백은 취해진 행동에 전적으로 의존하는 반면, 지침적인 피드백은 취해진 행동과는 무관하게 이루어집니다. Chapter2에서는 주로 ..
강화학습의 Bible이라고 불리는 "단단한 강화학습". 조금 욕심내서 제대로 읽어보고 싶은마음에따로 정리해보면서 읽기로 마음먹고 포스팅을 진행하게됐습니다. 각 챕터별로 포스팅하면서코드구현해볼 수 있는 부분은 코딩하고 깃허브에 업로드해보면서 공부를 진행해보려고합니다. 그리고,추후 공부하면서 유용했던 추가적인 자료들은 여기 포스팅에 지속적으로 업데이트할 예정입니다. - 교재 원본 및 기타링크 http://incompleteideas.net/book/the-book-2nd.html Sutton & Barto Book: Reinforcement Learning: An Introduction incompleteideas.net - 예제 풀이https://github.com/krex4715/Reinforcem..
https://www.youtube.com/watch?v=dw0sHzE1oAc&list=PLldiB_QS6edl3h831ZrSG8crEWOvPWeun&index=4 발표자료 https://www.slideshare.net/NaverEngineering/introduction-of-deep-reinforcement-learning Introduction of Deep Reinforcement Learning 발표자: 곽동현(서울대 박사과정, 현 NAVER Clova) 강화학습(Reinforcement learning)의 개요 및 최근 Deep learning 기반의 RL 트렌드를 소개합니다. 발표영상: http://tv.naver.com/v/2024376 https://youtu… www.slideshar..
https://www.youtube.com/watch?v=dw0sHzE1oAc&list=PLldiB_QS6edl3h831ZrSG8crEWOvPWeun&index=4 발표자료https://www.slideshare.net/NaverEngineering/introduction-of-deep-reinforcement-learning Introduction of Deep Reinforcement Learning발표자: 곽동현(서울대 박사과정, 현 NAVER Clova) 강화학습(Reinforcement learning)의 개요 및 최근 Deep learning 기반의 RL 트렌드를 소개합니다. 발표영상: http://tv.naver.com/v/2024376 https://youtu…ww..
https://www.youtube.com/watch?v=dw0sHzE1oAc&list=PLldiB_QS6edl3h831ZrSG8crEWOvPWeun&index=4 발표자료https://www.slideshare.net/NaverEngineering/introduction-of-deep-reinforcement-learning Introduction of Deep Reinforcement Learning발표자: 곽동현(서울대 박사과정, 현 NAVER Clova) 강화학습(Reinforcement learning)의 개요 및 최근 Deep learning 기반의 RL 트렌드를 소개합니다. 발표영상: http://tv.naver.com/v/2024376 https://youtu…ww..
아래 영상은 곽동현 연구원님의 1시간 25분짜리 DRL 소개 영상인데요,Deep Reinforcement Learning에 대한 기본 틀을 잡고 시작하기 딱 좋은 영상이라 생각이들어서,영상내용을 쭉 정리해보는 포스팅을 진행해보려 합니다https://www.youtube.com/watch?v=dw0sHzE1oAc&list=PLldiB_QS6edl3h831ZrSG8crEWOvPWeun&index=4 발표자료https://www.slideshare.net/NaverEngineering/introduction-of-deep-reinforcement-learning Introduction of Deep Reinforcement Learning발표자: 곽동현(서울대 박사과정, 현 NA..
https://www.researchgate.net/publication/323483725_Human-in-the-loop_optimization_of_hip_assistance_with_a_soft_exosuit_during_walking ◆ Introduction 그동안 외골격 로봇에대한 수많은 연구가 있어왔지만, 적용에 어려움을 겪는 가장 큰 부분중 하나는 바로 'Personalization'에 대한 부분이다. 사람의 신체와 움직임의 특성은 개개인마다 천차만별이기 때문에, 특정 목적을 수행하는 제어가 이루어지더라도, 한가지의 고정된 Control Strategy로는 모든 사람들에게 Optimal한 제어를 제공할 수는 없다는 것이 여러 논문 결과를 통해 밝혀졌다. 가령, 사람이 걷는데 힘을 보조하는 ..
1, VS Code 이전 Jetpack 4.x 버전에서 잘 돌아갔던 vs code가 Jetpack5.0 버전에서 설치는되는데 실행은 안되는 문제가 있었습니다 포럼을 뒤져보니 https://forums.developer.nvidia.com/t/vs-code-can-t-launch-with-jetpack-5-0/213980/11 VS code can’t launch with JetPack 5.0 Just tried this. It seems to just freeze without ever launching the app. forums.developer.nvidia.com vs code를 1.50.0 으로 이전버전을 설치해서 사용하면 된다는 답변이 있어서 그대로 따라해봤는데, 잘 실행되는게 확인됐습니다 $ ..
지금까지의 Jetson Xavier세팅이 순조로웠다면, ROS2 설치하는것 자체는 훨씬 간단하게 끝납니다. https://docs.ros.org/en/galactic/Installation/Ubuntu-Install-Debians.html Ubuntu (Debian) — ROS 2 Documentation: Galactic documentation Debian packages for ROS 2 Galactic Geochelone are currently available for Ubuntu Focal. The target platforms are defined in REP 2000 Make sure you have a locale which supports UTF-8. If you are in a min..