빨리 훝어보는 물리 - 1. 물체의 운동
1장. 물체의 운동
1장. 물체의 운동
Definition
• The Laplace Transform and $z$-Transform (along with other integral transforms such as the Wavelet Transform) are based on the concept of Hilbert spaces (ve...
In linear algebra, an $n \times n$ Hermitian matrix $A$ is said to be positive definite if the scalar $x^{*}\text{Ax}$ is real and positive for all non-zero ...
최근 책을 300페이지 넘게 스캔할 일이 있어 vFlat을 실행하니 두 페이지 스캔이 유료화된 것을 알게되었다. 유료 결제도 고민해 보았지만 몇 번 사용하지 않는 기능 때문에 매달 결제해야 하는 것이 부담스러웠다. 그리고 이전에 두 페이지 스캔 기능을 사용해 보았지만 책을 넘겨감에...
1. 정의
학교에서 유체역학 수업을 들을 때였다. 교수님께서 네비어-스톡스 방정식(Navier-Stokes equation)을 적고 계셨다.
이번 글에서는 확률변수의 연산에 대하여 알아본다.
확률변수는 확률의 처음과 끝이라고 해도 과언이 아닐 정도로 아주 중요한 개념이다. 이번 글에서는 확률변수란 무엇인지 알아보자.
서양인의 사고방식으로 바라본 관점
기본단위와 유도단위 물리량은 길이, 시간, 힘, 별의 밝기 등 물리학의 대상이 되는 측정가능한 양을 말한다. 아름다움, 친구간의 친밀도, GDP 등은 측정불가하거나 물리학의 대상이 아니므로 물리량이라고 할 수 없다. 우주의 모든 물리량은 7개의 기본단위(base units)와 그 ...
단위는 왜 생겨났을까? 먼 과거를 생각해보자. 고대시대라고 생각해도 좋다. 사람들이 사냥을 하다가 곰을 만났다. 처음보는 동물이라 머뭇머뭇 하다가 위험을 느끼고 가까스로 도망쳤다. 다른 사람들에게 이 사실을 알리고 조심하라고 하고 싶다. 곰을 어떻게 설명해야 할까?
1. Introduction
강화학습에서 가치함수법에 대한 연구가 활발히 진행되어 왔으나 가치함수 변화에 대하여 정책의 변화가 급격하다는 문제와 연속행동공간에서는 매 스텝마다 함수최적화를 풀어야 하는 문제1로 인하여 정책을 직접 구하는 정책경사법(policy-gradient methods){Sutton.200...
최적정책을 찾는 방법은 크게 최적가치함수(optimal value function) 를 찾은 후 최적정책을 구하는 가치함수법(value function methods) 과 직접 최적정책을 찾는 정책경사법(policy-gradient method) 으로 구분할 수 있다. 본 장에서는...
1. What is RL? 조금만 생각해보면 인간이 오래동안 먹지 못했을 때 배고픔을 느끼고 맛있는 음식을 먹었을 때 행복감을 느끼는 본능이 있기 때문에 음식으로부터 에너지를 얻고 생명을 유지한다는 것을 알 수 있다. 강화학습(reinforcement learning){Sutton...