"&#54616;&#46177;"

항목

데이터 분석 처리 시각화, 분산 파일 시스템 DFS, 分散-
데이터 저장소와 검색엔진을 위해 개발한 분산 파일 시스템. 하드웨어의 안정성과 자료의 유실문제 처리 높은 데이터 처리율이 특징이다. 하둡 분산 파일 시스템(HDFS : Hadoop Distributed File System) GFS를 모델로 만든 오픈소스 분산파일시스템. GFS와 동일한 특징을 가진다. 대용량의 파일을 블록 단위로 분할하여...

도서 용어로 알아보는 우리시대 DATA | 태그 컴퓨터/정보통신
Hive
기반 처리를 위해 설계되었다. Hive 개발배경 하이브는 페이스북 프로그래머들이 개발한 소프트웨어로서 기존 SQL 문법과 상당히 유사한 HiveQL을 사용하여 하둡에 저장된 빅데이터를 질의 처리할 수 있다. 페이스북의 급증하는 소셜 네트워킹에서 매일 생성되는 대량의 데이터를 관리하고, 학습하기 위해 개발되었고...

유형 :

빅데이터 분산처리기술 분석기술

도서 국립중앙과학관：빅데이터 과학관 | 태그 컴퓨터/정보통신
데이터 관리, 노에스큐엘 NoSQL
작업을 위한 키 값을 최적화할 수 있어 지연(latency)과 처리율(throughput)이 우수하다. 그리고 대규모 확대가 가능한 수평적인 확장성을 가져 대규모의 데이터를 유연하게 처리할 수 있다. NoSQL에 기반을 둔 시스템의 대표적인 예로 아파치 카산드라(Apache Cassandra), 하둡(Hadoop), 몽고디비(MongoDB) 등이 있다.

참고 :

노에스큐엘 시스템은 SQL 계열 쿼리 언어를 사용할 수 있다는 사실을 강조한다는 면에서 ‘Not only SQL’로 불리기도 한다.

도서 용어로 알아보는 우리시대 DATA | 태그 컴퓨터/정보통신
아파치 임팔라 Apache Impala
소프트웨어 정보 아파치 임팔라(Apache Impala)는 아파치 하둡을 실행하는 컴퓨터 클러스터에 저장된 데이터를 위한 오픈 소스 대규모 병렬 처리(MPP) SQL 쿼리 엔진이다.웹 인용 임팔라는 2012년 개발에 영감을 준 구글 F1 동등 오픈 소스로 기술되고 있다. 아파치 임팔라는 아파치 하둡 위에 실행되는 쿼리 엔진이다...

도서 위키백과
실시간대용량 스트림 분석
포함된다. Apache Storm 아파치 스톰(Apache Storm)은 트위터가 내놓은 오픈소스 소프트웨어로 대용량 데이터를 실시간으로 분석할 수 있게 해주는 기술이다. 하둡이 배치분석에 특화된 대용량 분산처리 시스템이라면 스톰은 실시간 분석에 특화된 분산처리 시스템이다. Apache S4 S4의 네 개의 S는 단순 확장형...

유형 :

빅데이터 활용 및 관련 기술

도서 국립중앙과학관：빅데이터 과학관 | 태그 컴퓨터/정보통신
Mahout
분산/병렬처리가 가능한 기계학습 라이브러리이다. Mahout은 다양한 ML(Machine Learning) 알고리즘을 라이브러리 형태로 제공한다. Mahout 특징 Mahout은 하둡을 사용하여 클라우드 환경에서 확장성을 가지며 기존 기계학습 알고리즘의 한계 중의 하나인 대용량 학습 데이터 처리 시간 등의 문제를 해결하도록 하고...

유형 :

빅데이터 분산처리기술 분석기술

도서 국립중앙과학관：빅데이터 과학관 | 태그 컴퓨터/정보통신
아파치 HBase 아파치 HBase, Apache HBase
소프트웨어 정보 아파치 HBase는 하둡 플랫폼을 위한 공개 비관계형 분산 데이터베이스이다. 구글의 빅테이블(BigTable)을 본보기로 삼았으며 자바로 쓰여졌다. 아파치 소프트웨어 재단의 아파치 하둡 프로젝트 일부로서 개발되었으며 하둡의 분산 파일 시스템인 HDFS위에서 동작을 한다. 대량의 흩어져 있는 데이터...

도서 위키백과
분산 파일 시스템 DFS, 分散-
데이터 저장소와 검색 엔진을 위해 개발한 분산 파일 시스템. 하드웨어의 안정성과 자료의 유실문제 처리, 높은 데이터 처리율이 특징이다. - 하둡 분산 파일 시스템(HDFS: Hadoop Distributed File System): GFS를 모델로 만든 오픈소스 분산 파일 시스템. GFS와 동일한 특징을 가진다. 대용량의 파일을 블록 단위로...

도서 TTA정보통신용어사전 | 태그 컴퓨터/정보통신
그루터
그루터(GRUTER)는 대한민국의 빅데이터 플랫폼 및 소셜 데이터 분석 전문 기업이다. 아차피 타조(Apache Tajo)(Tajo) 아파치 하둡 기반의 빅데이터 웨어하우스 솔루션으로 Sql on hadoop 기술로 분류된다. 링크드인, SK 텔레콤 등, 국내외의 개발자와 함께 그루터가 개발을 리드하면서 발전시켜 나가는 아파치 재단의...

도서 위키백과
클라우데라 Cloudera, Cloudera
회사 정보 클라우데라(Cloudera, Inc.)는 기업 고객들에게 아파치 하둡과 아파치 스파크 기반 소프트웨어, 지원 및 서비스, 그리고 트레이닝을 제공하는 미국의 소프트웨어 기업이다. 클라우데라의 하이브리드 오픈 소스 아파치 하둡 배포판 CDH(Cloudera Distribution Including Apache Hadoop)는 기업 등급의 기술...

도서 위키백과
타조 (소프트웨어)
타조(Tajo)는 하둡 기반 데이터웨어하우스 시스템이다. 하둡 데이터 분석을 위해 일반적으로 사용되는 맵리듀스 기술 대신 관계형 데이터베이스에서 사용하는 SQL로 질의할 수 있다. 고려대학교 정보통신대학 컴퓨터학과 DB연구실 박사과정 중이던 손지훈과 최현식이 시작했으며, 2013년 3월에 그루터(Gruter), 고려...

도서 위키백과
앵커스
소프트웨어 정보 앵커스는 하둡 맵리듀스 기반의 데이터 마이닝/기계학습을 다루는 오픈 소스 알고리즘 라이브러리이다. ankus는 오픈 소스 프로젝트로서, 총 3가지의 프로젝트로 구성되어 있다. 1) 데이터 마이닝 및 기계학습 기반의 분석을 위한 'Core Project' 데이터 기초 통계 및 전처리 유사/상관/거리 분석 분류...

도서 위키백과

이전페이지 없음 1 2 현재페이지3 4 5 6 다음페이지 없음

백과

검색

백과사전 메인메뉴

서비스 바로가기

항목

관련항목

멀티미디어16건

백과 핫이슈

서비스 이용정보