항목
-
마르코프 결정 과정 (관련어 마르코프결정과정) Markov..기계 학습 마르코프 결정 과정(MDP, Markov Decision Process)는 의사결정 과정을 모델링하는 수학적인 틀을 제공한다. 이 때 의사결정의 결과는 의사결정자의 결정에도 좌우되지만, 어느 정도 임의적으로 주어진다. 마르코프 결정 과정은 동적 계획법과 강화 학습 등의 방법으로 푸는 넓은 범위의 최적화 문제에 유용한...도서 위키백과
-
마르코프 확률 과정 Markov property, マルコフ性dotsb \otimes \mu_{t_{n-1}t_n} 이 되는 마르코프 과정 X가 존재한다. 여기서 \operatorname{Law}(-)는 확률 변수의 법칙(확률 변수가 표본 공간에 유도하는 확률 측도)을 뜻한다. 러시아의 수학자 안드레이 마르코프가 1906년에 도입하였다. 이력 현상 마르코프 연쇄 마르코프 결정 과정 마르코프 모형 서적 인용 eom도서 위키백과
-
마르코프 프로세스 Markov process데 알맞은 모멜로서, 마르코프 프로세스에서는 시스템의 현 상태와 임의의 두 상태 간의 변동 확률(transition probability)만이 앞으로의 진행 과정을 결정하게 된다. 즉, 마르코프 프로세스가 어떤 상태에 있다는 사실이 주어졌을 때, 앞으로의 진행 과정은 그 상태에 이르기까지의 과거 과정과는 전혀 무관하다.
- 분야 :
- 소프트웨어 기초
-
결정 이론 decision theory행동을 결정한다. [2] 정보기초 분야. 의사나 정책의 결정을 합리적으로 하기 위한 수학적 이론, 처음에는 최적제어이론이나 수리계획법, 다단결정과정이나 마르코프 결정과정의 이론 등을 포함하는 넓은 의미로 쓰였는데, 현재에는 오히려 좁은 의미로 쓰이는 수가 많으며, 정책과 이들의 개념을 도입한 다단결정과정...
-
은닉 마르코프 모형 Hidden Markov model, 隠れマルコフモデル혹은 희소성을 결정한다. 그러한 2단계 사전 분포는 두 집중 모수가 희소 분포를 생성하기 위해 설정된다. 그 분포는 어떤 품사가 다른 것보다 더 많이 발생하는...확장 버전 등을 이용하여 학습된다. 앞서 설명했던 디리클레 사전 분포를 이용한 은닉 마르코프 모형의 확장은 디리클레 분포 대신에 디리클레 과정을...도서 위키백과
-
동적 계획법 DP, dynamic programming값을 얻는다. 축차결정과정의 상태 전이가 확정적일 경우는, 이 예와 같이, 조합최적화문제의 표현에 적합하다. 확률적인 상태전이를 생각하는 경우는 마르코프 결정과정으로서 다루어진다. 동적계획법의 응용분야는 광범위한데, 조합 최적화 외에도, 다단결정과정·다단배분과정·최적제어이론·재고문제·변분법 등...
-
운용과학 OR, operations research네트워크 계획법 등 풍부한 축적이 있다. 또 확률 모델에서는 확률∙통계에 있어서 여러 가지 수법이 이용되어 대기행령 및 트래픽 이론, 마르코프 과정 및 마르코프 결정과정, 다변량해석 및 시계열해석, 신뢰성 및 보전성 이론 등이 대표적이다. 모델에 따라서는 게임 이론과도 관련한다. 또, 최적해의 계산이 수학적...
- 분야 :
- 수학
-
정책반복법 policy iteration method마르코프 결정과정의 최적정책을 구하는 대표적인 방법의 하나. 적당한 정책 π에서 시작하여, π에 의해 실현되는 총이득의 기대값 υπ(i)를 구한 후, 최적성 방정식(마르코프 결정과정 참고)의 우변의 υ(i)에 υπ(i)를 썼다고 하고, 우변의 값을 최대화하는 정잭 π'를 구하는 순서를 반복한다. 상당히 대규모인...
- 분야 :
- 수학