항목

  • 비음수 행렬 분해 Non-negative matrix factorization
    연구자 Lee와 Seung이 이 분해의 성질과 두 개의 간단한 분해 알고리즘을 비음수 행렬 분해로 소개한 뒤 널리 알려졌다. 예를 들어 10000x500 크기의 단어들을 포함한 행렬 V가 있다고 하자. V의 500개의 열(벡터)은 문서를 나타낸다. 이 행렬 V를 10000x10과 10x500의 크기를 가지는 W와 H로 분해했다고 하자. W는 10개...
    도서 위키백과
  • 디지털 혁명 digital revolution
    64단어로 이루어진 정보 전달 체계로 해석할 수 있다. 이는 컴퓨터에서 0과 1로 정보를 저장하는 디지털 방식과 유사하다. 알고 보면 우리 몸도 DNA 문자로 이루어진 디지털 암호인 셈이다. 아날로그에서 디지털로 과거와는 달리 현대사회를 디지털 시대라고 부를 만큼 우리 생활 주변의 수많은 기기들이 디지털 방식을...
  • 선형 분류 Linear classifier, 線形分類器
    vec x 가 고차원 벡터인 경우에도 선형 분류를 많이 쓰는데, 예를 들어 문서 분류의 경우에 \vec x 의 각 원소는 보통 문서에 들어있는 특정 단어의 사용 회수로 주어진다. (문서-단어 행렬 참조) 그런 경우에는 분류기가 잘 정칙화되어 있어야 한다. Winnow (algorithm) 이차 분류 서포트 벡터 머신 더 보기: Y. Yang...
    도서 위키백과
  • 토픽 모델 Topic model, 主题模型
    내의 단어 통계를 수학적으로 분석함으로써 알아 낼 수 있다. 그렇기에 토픽 모델은 또한 확률적 토픽 모델이라고도 불리는데, 이는 광범위한 텍스트 본문의 잠재적 의미 구조를 발견하기 위한 통계적 알고리즘을 가리키는 의미로도 쓰인다. 정보화 시대가 도래하면서 매일 생성되는 텍스트는 인간이 직접 처리할 수...
    도서 위키백과
  • 명시 의미 분석 Explicit semantic analysis
    지식 베이스로 사용하여 개별 단어 혹은 전체 문서 텍스트를 벡터 형태로 표현하는 것을 가리킨다. 특히 ESA에서는 단어는 해당 텍스트 코퍼스의 tf–idf 행렬의 열벡터로 표현되고, 단어의 나열인 문서는 해당 벡터들의 중심값으로 표현된다. 명시 의미 분석은 Evgeniy Gabrilovich와 Shaul Markovitch에 의해 텍스트...
    도서 위키백과
  • 벡터 공간 모델 Vector space model, ベクトル空間モデル
    SemanticVectors: Apache Lucene으로 생성한 단어-문서 매트릭스에 랜덤 프로젝션 알고리즘을 적용해 구현한 의미 벡터 색인(잠재 의미 분석과 유사) Gensim...주머니 모델을 자바로 구현한 널리 알려진 데이터 마이닝 패키지 by Antonio Gulli 잠재 의미 분석 및 단어 동시발생 행렬을 이용한 텍스트 및 단어...
    도서 위키백과
  • 잠재 의미 분석 Latent semantic analysis, 潜在意味解析
    특히 분포 의미론에서 문서 및 용어와 관련된 개념 집합을 생성하여 문서 집합과 해당 문서에 포함된 용어 간의 관계를 분석하는 기술이다. LSA는 의미가 유사한...가정한다(분포 가설). 문서당 단어 수를 포함하는 행렬(행은 고유한 단어를 나타내고 열은 각 문서를 나타냄)은 큰 텍스트 조각으로 구성되며 특잇값...
    도서 위키백과
  • 잠재 디리클레 할당 Latent Dirichlet allocation, 隐含狄利克雷分布
    w_n이 i번째 주제에 속할 확률 분포를 나타낸다. \beta는 k \times V 크기의 행렬 매개변수로, \beta_{ij}는 i번째 주제가 단어집의 j번째 단어를 생성할 확률을...수 없는 잠재 변수이다. 이 모형은 다음과 같이 해석될 수 있다. 각 문서에 대해 k개의 주제에 대한 가중치 \theta가 존재한다. 문서 내의 각 단어 w_n은...
    도서 위키백과
  • 일반화 벡터 공간 모델 Generalized vector space model
    사용된다. 여기서 r = 1...2n이다. 문서 dk와 질의 q의 유사도는 다음과 같이 계산된다. sim(d_k,q) = \frac{\sum _{j=1}^n \sum _{i=1}^n w_{i,k}*w_{j,q}*t_i...단어 상관도 t_i \cdot t_j는 여러 가지 방식으로 구현될 수 있다. 웡의 논문에서는 자동 색인에 의해 생성된 단어 빈도 행렬을 입력으로 받아 모든 색인...
    도서 위키백과
  • 기계 학습 알고리즘 목록 Outline of machine learning
    멀티 암드 밴딧 다중 작업 학습 멀티모덜 학습 무한 언어 학습 시스템 유사도 학습 통계적 학습이론 전이학습 손실 함수 아파치 플룸 아파치 머하웃 아파치 스파크 단어 가방 모형 편향-분산 트레이드오프 이항 분류 클레버봇 인지 컴퓨터 지능형 로봇 혼동 행렬 대응 분석 교차타당도 차원의 저주 다트머스 회의 결정...
    도서 위키백과
  • 매스매티카 Wolfram Mathematica, Mathematica
    일반적인 단어를 재해석하여 "Mathematica"라 이름 붙여졌다. 역대 Mathematica의 로고에 사용되고있는 것은 "스파이키"라는 3 차원 다면체로 초대 Mathematica는 대형 이십 면체, 이후 버전에서는 쌍곡선 이십 면체를 장식 한 것이 사용되고있다인용. Mathematica는 C/C++ 및 Java로 구현되어 있지만, 확장 가능한...
    도서 위키백과
이전페이지 없음 현재페이지1 다음페이지 없음