항목

  • Q 러닝 (관련어 Q-러닝) Q 러닝, Q-learning
    출처 필요Q 러닝(Q-learning)은 모델 없이 학습하는 강화 학습 기법 가운데 하나이다. Q 러닝은 주어진 유한 마르코프 결정 과정의 최적의 정책을 찾기 위해 사용할 수 있다. Q 러닝은 주어진 상태에서 주어진 행동을 수행하는 것이 가져다 줄 효용의 기대값을 예측하는 함수인 Q 함수를 학습함으로써 최적의 정책을 학...
    도서 위키백과
  • 러닝 Deep Learning
    2000년대 들어 부활했다. 딥 러닝 학습법을 채택한 인공지능도 속속 등장하고 있다. 페이스북은 2014년 사람의 얼굴을 97.25퍼센트의 정확도로 알아내는 ‘딥...인공지능 기술을 개발했으며, 2015년 구글의 자회사인 ‘딥 마인드’는 ‘딥 Q네트워크’라는 인공지능 비디오 게이머를 개발했다. 딥 러닝 기술을 보유한...
  • Beyond Machine Learning
    때 저 안 졸았는데.... 정확히 뭐가 좋은지.... 공식들도 어렵고.... 김박: 에이 헷갈릴 수도 있지. 한마디로 말하면 머신러닝의 일부분이 딥러닝이예요. Q: 머신러닝, 도대체 무엇인가? A : 머신러닝(기계학습)이란 인공 지능의 한 종류로, 일일이 프로그래밍하지 않아도 컴퓨터가 인간처럼 학습하여 정보를 처리하는...
  • 탐정처럼 데이터의 비밀을 밝혀낸다! 데이터 과학자
    관계 속에서, 데이터 과학 분야는 앞으로 더 중요해질 거라 생각합니다. Q. 데이터 과학자가 되려면 어떤 준비를 하는 것이 좋을까요? 데이터 과학자는 다양한...준비하는 것은 어려워요. 하지만 기본적으로 수학과 통계, 머신 러닝과 딥 러닝 등 AI에 관한 기초 공부를 해두면 좋습니다. 또 KISTI나 통계청 등에서...
    도서 과학향기
  • SARSA SARSA, State–action–reward–state–action
    S2"를 지정하고 마지막으로 에이전트가 새 상태에서 선택하는 다음 작업 "A2"를 지정한다. 5중(St, At, Rt+1, St+1, At+1)의 약어는 SARSA이다. 일부 저자는 약간 다른 규칙을 사용하여 보상이 공식적으로 할당되는 시간 단계에 따라 5중(St, At, Rt, St+1, At+1)을 쓴다. 새몬 매핑 Q 러닝 시간차 학습 강화 학습
    도서 위키백과
  • 구글 딥마인드 Google DeepMind, Google DeepMind
    구글 딥마인드는 심층 인공지능 기술인 ‘심층 큐 네트워크’(Deep Q-network)를 독자적으로 개발하였다. 이 기술은 다층 신경망(Deep Neural Network)과 큐 러닝(Q-Learning)을 조합한 기술이다. 규칙을 알지 못하는 상태에서 점수와 픽셀 디스플레이를 정보로 활용하여 최고점을 만들기 위해 이전 게임 세션으로부터...
    도서 위키백과
  • 시간차 학습 Temporal difference learning, 時間差分学習
    재차 변형하면, \bar{V_t}=r_t + \sum_{i=0}^\infty \gamma^{i+1}r_{t+i+1} = r_t + \gamma \sum_{i=0}^\infty \gamma^{i}r_{t+i+1} = r_t + \gamma \bar{V}_{t+1} 을 얻는다. 따라서, 보상 r_t는 올바른 다음 예측과 현재의 예측의 차이이다. r_t = \bar{V_t} - \gamma \bar{V}_{t+1} Q 러닝 레스콜라-와그너 모델 SARSA
    도서 위키백과
  • 남친보다 낫다! 나를 알아주는 기계, 감성 컴퓨팅
    실제 감정을 느끼고 그에 따라 반응하는 기계를 고안하기 위한 연구가 있다. 듣기만 해도 상당히 난이도가 있을 거 같은 이 분야는, 인공지능 및 머신 러닝 기술을 활용하여 인간의 특정 행동에 대해 자연스러운 감정을 느끼고, 자연스러운 반응을 보이는 기계를 만드는 것을 목표로 한다. Q: 실제 감성 컴퓨팅이 활용된...
  • 튜링 (마이크로아키텍처) Turing (microarchitecture), 图灵微架构
    러닝의 결과를 수행한다. 텐서 코어의 1차 사용에서 해결해야 할 문제를 슈퍼 컴퓨터에서 분석하는데, 슈퍼 컴퓨터는 어떤 결과를 원하는지 예시하여 이를 달성하기 위해 사용할 방법을 결정하고, 그 방법은 소비자의 텐서 코어로 이루어진다. 이러한 방법은 드라이버 업데이트를 통해 소비자에게 전달된다. 튜링의...
    도서 위키백과
  • 볼츠만 분포 Boltzmann distribution, ボルツマン分布
    함수이다. Q={\sum_{i=1}^{M}{e^{- {\varepsilon}_i / (k T)}}} 모든 접근 가능한 상태의 확률을 합하면 1이 되어야 한다는 제약 조건에서 비롯된다. 볼츠만 분포는 엔트로피를 최대화하는 분포이다. H(p_1,p_2,\cdots,p_M) = -\sum_{i=1}^{M} p_i\log_2 p_i 라는 제약 조건에 따라 \sum {p_i {\varepsilon}_i} 특정...
    도서 위키백과
  • 내 머릿 속 상상을 스케치하다, Prototyping
    있다. Q: 아두이노로 만든 재미있는 프로토타입핑이 있나? 코갱에서 만든 프로토타입이 있는데, 간단하게 소개를 하고자 한다. 이 프로토타입은 아토피를 앓고 있는 자녀를 둔 부모를 위해 실내 환경을 자녀들의 피부에 맞게 맞추는 것을 도와주는 스마트 기기이다. 라즈베리 파이(Raspberry Pi)라는 소형컴퓨터에...
  • L-BFGS L-BFGS, Limited-memory BFGS
    머신 러닝 여기서, \mathbf{x}는 unconstrained value의 real-vector이고, f는 미분가능한 스칼라 함수이다. 원래의 BFGS와 같이, L-BFGS 알고리즘은 variable space의 검색을 조정하는 추정된 inverse Hessian matrix를 이용한다. 하지만 BFGS는 inverse Hessian에서 추정된 전체 n\times n 을 이용하고, L-BFGS는 단지...
    도서 위키백과
이전페이지 없음 현재페이지1 2 다음페이지 없음