항목

  • 말뭉치 corpus
    어떤 기준으로든 한 덩어리로 볼 수 있는 말의 뭉치.|다양한 크기의 자료 모음이 모두 말뭉치라는 이름으로 묶일 수 있으며, 그 내용도 연구 목적에 따라 다양하게 구성될 수 있다. 그러므로 말뭉치란 일정한 규모 이상의 크기를 갖추고 내용적으로 다양성과 균형성이 확보된 자료의 집합체라고 할 수 있다. 일률적으...
    도서 다음백과 | 태그 언어 일반
  • 말뭉치 말모둠, 文集
    언어 연구를 위하여 컴퓨터가 텍스트를 가공·처리·분석할 수 있는 형태로 모아 놓은 자료의 집합. 말모둠·글모둠|개설 컴퓨터로 가공, 처리하고 분석할 수 있도록 저장된 언어의 자료이다. 작게는 시집 한 권이나 소설 한 권으로부터 수천만 어절 이상의 말 또는 글로 표현된 각종 자료에 이르기까지, 다양한 크기...
    유형 :
    개념용어
    분야 :
    언어/언어·문자
  • 말뭉치 Corpus
    언어 연구를 위해 텍스트를 컴퓨터가 읽을 수 있는 형태로 모아 놓은 언어 자료. 언어 현실을 총체적으로 드러내 보여줄 수 있는 자료의 집합체로 매체, 시간, 공간, 주석 단계 등의 기준에 따라 다양한 종류가 있으며, 한 덩어리로 볼 수 있는 말의 뭉치라는 뜻이다.
  • 말뭉치 Text corpus, コーパス
    전문가 필요 말뭉치 또는 코퍼스는 자연언어 연구를 위해 특정한 목적을 가지고 언어의 표본을 추출한 집합이다. 컴퓨터의 발달로 말뭉치 분석이 용이해졌으며 분석의 정확성을 위해 해당 자연언어를 형태소 분석하는 경우가 많다. 확률/통계적 기법과 시계열적인 접근으로 전체를 파악한다. 언어의 빈도와 분포를 확인...
    도서 위키백과
  • Conversation analysis 말뭉치, 会話分析
    Conversation analysis (commonly abbreviated as CA) is an approach to the study of social interaction, embracing both verbal and non-verbal conduct, in situations of everyday life. As its name implies, CA began with a focus on casual conversation, but its methods were subsequently adapted to embra...
  • Text corpus 말뭉치, コーパス
    In linguistics, a corpus (plural corpora) or text corpus is a large and structured set of texts (nowadays usually electronically stored and processed). They are used to do statistical analysis and hypothesis testing, checking occurrences or validating linguistic rules within a specific language t...
  • 병렬 말뭉치 Parallel corpus
    빅데이터를 활용한 자동번역 시스템에서 원문과 대역문을 모아놓은 언어 자료. 언어 간의 대조 분석, 번역 연구에 활용되며 원문에서 번역문(target sentence)을 생성하는 가장 높은 확률이 있는 문장을 최종 번역문으로 제시한다, 여러 언어로 번역돼 제공되는 신문이나 잡지 기사, 독해 공부를 위한 대역 문서, 번역된...
  • 말뭉치언어학 Corpus linguistics, コーパス言語学
    언어학 말뭉치 언어학은 '실제 언어' 혹은 실제 언어의 샘플을 이용하여 언어를 공부하는 응용언어학의 한 분야이다. 말뭉치(코퍼스)란, 언어를 연구하는 각 분야에서 필요로 하는 연구 재료로서 언어의 본질적인 모습을 총체적으로 드러내 보여줄 수 있는 자료의 집합을 뜻한다. 조건만 만족할 수 있으면 작게는 시집...
    도서 위키백과
  • 말뭉치 주석 Annotation, 注釈
    말뭉치 주석(corpus annotation)은 말뭉치의 활용도를 극대화하기 위해 말뭉치의 본문에 특별한 표시를 하는(tagging) 작업이다. 다르게 표현하면 원시 말뭉치에 언어학적 정보를 부여하여 주석 말뭉치로 만드는 작업이라고도 할 수 있다. 이중 가장 기초적인 것은 품사 주석(part of speech annotation)이다. 지금은...
    도서 위키백과
  • 병렬말뭉치 Parallel text, 平行文本
    2개 국어 이상의 번역된 문서를 모은 말뭉치를 병렬말뭉치(parallel corpus, 병렬 코퍼스)라 부른다. 병렬말뭉치는 문장 대 문장 혹은 문단 대 문단으로 구축되어 있다. 병렬말뭉치는 언어 간의 대조 분석, 번역 연구에 활용된다. 최초로 구축된 병렬말뭉치 중 하나인 영어-노르웨이어 병렬말뭉치는 3 가지 목적을...
    도서 위키백과
  • Corpus linguistics 말뭉치 언어학, コーパス言語学
    Corpus linguistics is the study of language as expressed in corpora (samples) of "real world" text. The text-corpus method is a digestive approach for deriving a set of abstract rules, from a text, for governing a natural language, and how that language relates to and with another language...
  • Annotation 말뭉치 주석, 注釈
    An annotation is a metadata (e.g. a comment, explanation, presentational markup) attached to text, image, or other data. Often, annotations make reference to a specific part of the original data. Textual scholarship is a discipline that often uses the technique of annotation to describe or add...
이전페이지 없음 현재페이지1 2 3 4 5 6 다음페이지 없음