"마르코프 결정 과정"

항목

마르코프 결정 과정 (관련어 마르코프결정과정) Markov..
기계 학습 마르코프 결정 과정(MDP, Markov Decision Process)는 의사결정 과정을 모델링하는 수학적인 틀을 제공한다. 이 때 의사결정의 결과는 의사결정자의 결정에도 좌우되지만, 어느 정도 임의적으로 주어진다. 마르코프 결정 과정은 동적 계획법과 강화 학습 등의 방법으로 푸는 넓은 범위의 최적화 문제에 유용한...

도서 위키백과
마르코프 확률 과정 Markov property, マルコフ性
dotsb \otimes \mu_{t_{n-1}t_n} 이 되는 마르코프 과정 X가 존재한다. 여기서 \operatorname{Law}(-)는 확률 변수의 법칙(확률 변수가 표본 공간에 유도하는 확률 측도)을 뜻한다. 러시아의 수학자 안드레이 마르코프가 1906년에 도입하였다. 이력 현상 마르코프 연쇄 마르코프 결정 과정 마르코프 모형 서적 인용 eom

도서 위키백과
마르코프 프로세스 Markov process
데 알맞은 모멜로서, 마르코프 프로세스에서는 시스템의 현 상태와 임의의 두 상태 간의 변동 확률(transition probability)만이 앞으로의 진행 과정을 결정하게 된다. 즉, 마르코프 프로세스가 어떤 상태에 있다는 사실이 주어졌을 때, 앞으로의 진행 과정은 그 상태에 이르기까지의 과거 과정과는 전혀 무관하다.

분야 :

소프트웨어 기초

도서 컴퓨터 정보용어대사전 | 태그 컴퓨터/정보통신
마르코프 연쇄 Markov chain, マルコフ連鎖
있으며, 이 변에 붙어 있는 값은 \Pr(X_{n+1}=x_2|X_n=x_1)이다. 만약 이 확률이 0이라면 변을 생략할 수 있다. 이러한 그래프를 상태 다이어그램이라고 한다. 러시아의 수학자 안드레이 마르코프가 1906년에 도입하였다. 마르코프 결정 과정 마르코프 네트워크 서적 인용 eomeom매스월드매스월드 위키데이터 속성 추적

도서 위키백과
결정 이론 decision theory
행동을 결정한다. [2] 정보기초 분야. 의사나 정책의 결정을 합리적으로 하기 위한 수학적 이론, 처음에는 최적제어이론이나 수리계획법, 다단결정과정이나 마르코프 결정과정의 이론 등을 포함하는 넓은 의미로 쓰였는데, 현재에는 오히려 좁은 의미로 쓰이는 수가 많으며, 정책과 이들의 개념을 도입한 다단결정과정...

도서 컴퓨터 정보용어대사전 | 태그 컴퓨터/정보통신
마르코프 모형 Markov model
마르코프 모형 또는 마르코프 모델은 확률 모델의 유형이다. 마르코프 모형 상태가 관찰 가능 상태가 부분적으로 관찰 가능 시스템이 자율적 마르코프 연쇄 은닉 마르코프 모형 시스템이 통제됨 마르코프 결정 과정 부분적 관찰가능 마르코프 결정 과정 마르코프 연쇄 몬테카를로 안드레이 마르코프 토막글

도서 위키백과
은닉 마르코프 모형 Hidden Markov model, 隠れマルコフモデル
혹은 희소성을 결정한다. 그러한 2단계 사전 분포는 두 집중 모수가 희소 분포를 생성하기 위해 설정된다. 그 분포는 어떤 품사가 다른 것보다 더 많이 발생하는...확장 버전 등을 이용하여 학습된다. 앞서 설명했던 디리클레 사전 분포를 이용한 은닉 마르코프 모형의 확장은 디리클레 분포 대신에 디리클레 과정을...

도서 위키백과
동적 계획법 DP, dynamic programming
값을 얻는다. 축차결정과정의 상태 전이가 확정적일 경우는, 이 예와 같이, 조합최적화문제의 표현에 적합하다. 확률적인 상태전이를 생각하는 경우는 마르코프 결정과정으로서 다루어진다. 동적계획법의 응용분야는 광범위한데, 조합 최적화 외에도, 다단결정과정·다단배분과정·최적제어이론·재고문제·변분법 등...

도서 컴퓨터 정보용어대사전 | 태그 컴퓨터/정보통신
운용과학 OR, operations research
네트워크 계획법 등 풍부한 축적이 있다. 또 확률 모델에서는 확률∙통계에 있어서 여러 가지 수법이 이용되어 대기행령 및 트래픽 이론, 마르코프 과정 및 마르코프 결정과정, 다변량해석 및 시계열해석, 신뢰성 및 보전성 이론 등이 대표적이다. 모델에 따라서는 게임 이론과도 관련한다. 또, 최적해의 계산이 수학적...

분야 :

수학

도서 컴퓨터 정보용어대사전 | 태그 컴퓨터/정보통신
정책반복법 policy iteration method
마르코프 결정과정의 최적정책을 구하는 대표적인 방법의 하나. 적당한 정책 π에서 시작하여, π에 의해 실현되는 총이득의 기대값 υπ(i)를 구한 후, 최적성 방정식(마르코프 결정과정 참고)의 우변의 υ(i)에 υπ(i)를 썼다고 하고, 우변의 값을 최대화하는 정잭 π'를 구하는 순서를 반복한다. 상당히 대규모인...

분야 :

수학

도서 컴퓨터 정보용어대사전 | 태그 컴퓨터/정보통신
확률 과정 確率過程, stochastic process
않는 정상 확률 과정이 주로 연구되고 있는데 시각 s에서의 상태를 알고 있을 때 시각 t＞s에서의 상태가 s에 있어서의 상태만으로 결정되고 s 이전의 상태에는 무관계인 것 같은 마르코프 과정이 응용면에서도 많이 사용되고 있다. 또 시계열(time series)은 시간을 이산적으로 t=1, 2, ⋯로 한 특수한 확률 과정이다

도서 기계공학대사전 | 태그 기계
강화 학습 Reinforcement learning, 強化学習
다루는 '환경'은 주로 마르코프 결정 과정으로 주어진다. 마르코프 결정 과정 문제를 해결하는 기존의 방식과 강화 학습이 다른 지점은, 강화 학습은 마르코프 결정 과정에 대한 지식을 요구하지 않는다는 점과, 강화 학습은 크기가 매우 커서 결정론적 방법을 적용할 수 없는 규모의 마르코프 결정 과정 문제를...

도서 위키백과

이전페이지 없음 현재페이지1 2 3 다음페이지 없음

백과

검색

백과사전 메인메뉴

서비스 바로가기

항목

관련항목

백과 핫이슈

서비스 이용정보