항목
-
말뭉치 말모둠, 文集언어 연구를 위하여 컴퓨터가 텍스트를 가공·처리·분석할 수 있는 형태로 모아 놓은 자료의 집합. 말모둠·글모둠 개설 컴퓨터로 가공, 처리하고 분석할 수 있도록 저장된 언어의 자료이다. 작게는 시집 한 권이나 소설 한 권으로부터 수천만 어절 이상의 말 또는 글로 표현된 각종 자료에 이르기까지, 다양한 크기...
- 유형 :
- 개념용어
- 분야 :
- 언어/언어·문자
도서 한국민족문화대백과사전 -
말뭉치 Corpus언어 연구를 위해 텍스트를 컴퓨터가 읽을 수 있는 형태로 모아 놓은 언어 자료. 언어 현실을 총체적으로 드러내 보여줄 수 있는 자료의 집합체로 매체, 시간, 공간, 주석 단계 등의 기준에 따라 다양한 종류가 있으며, 한 덩어리로 볼 수 있는 말의 뭉치라는 뜻이다.
-
Conversation analysis 말뭉치, 会話分析Conversation analysis (commonly abbreviated as CA) is an approach to the study of social interaction, embracing both verbal and non-verbal conduct, in situations of everyday life. As its name implies, CA began with a focus on casual conversation, but its methods were subsequently adapted to embra...출처 영어 위키백과
-
Text corpus 말뭉치, コーパスIn linguistics, a corpus (plural corpora) or text corpus is a large and structured set of texts (nowadays usually electronically stored and processed). They are used to do statistical analysis and hypothesis testing, checking occurrences or validating linguistic rules within a specific language t...출처 영어 위키백과
-
병렬 말뭉치 Parallel corpus빅데이터를 활용한 자동번역 시스템에서 원문과 대역문을 모아놓은 언어 자료. 언어 간의 대조 분석, 번역 연구에 활용되며 원문에서 번역문(target sentence)을 생성하는 가장 높은 확률이 있는 문장을 최종 번역문으로 제시한다, 여러 언어로 번역돼 제공되는 신문이나 잡지 기사, 독해 공부를 위한 대역 문서, 번역된...
-
Corpus linguistics 말뭉치 언어학, コーパス言語学Corpus linguistics is the study of language as expressed in corpora (samples) of "real world" text. The text-corpus method is a digestive approach for deriving a set of abstract rules, from a text, for governing a natural language, and how that language relates to and with another language...출처 영어 위키백과
-
Annotation 말뭉치 주석, 注釈An annotation is a metadata (e.g. a comment, explanation, presentational markup) attached to text, image, or other data. Often, annotations make reference to a specific part of the original data. Textual scholarship is a discipline that often uses the technique of annotation to describe or add...출처 영어 위키백과