말뭉치
1. 개요
Corpus. 영단어를 그대로 읽을 때는 '코퍼스'라는 표기를 쓴다.
언어학, 사회학 등 조사적 목적에 의해서 특정 집단 내에서 사용한 단어들을 모아서 정리해둔 것이다. 컴퓨터의 발달로 말뭉치를 통한 데이터 수집과 분석이 용이해지면서 중요성이 부상했다.
영어, 특정 단어나 연결어 등의 사용빈도 등을 통해서 더 자연스러운 표현으로 바꾸는 일, 사전 편찬이나 사회적으로 이슈가 되었던 것을 객관적으로 확인할 수 있다는 점에서 그 쓸모가 발휘된다.
2. 학자
- Bas Aarts
- Geoffrey Leech: 2014년 작고.
- Gerald Nelson
- Gerry Knowles
- Jan Svartvik
- Randolph Quirk: 2017년 작고.
- Sidney Greenbaum: 1996년 작고.
3. 추천 사이트
- 구글 코퍼스 가장 방대한 자료가 저장되어있다.
- https://www1.essex.ac.uk/linguistics/external/clmt/w3c/corpus_ling/content/
- http://martinweisser.org/corpora_site/CBLLinks.html
- http://www.lancaster.ac.uk/fass/projects/corpus/cbls/corpora.asp
- http://www.corpora4learning.net/resources/corpora.html
- http://corpus.leeds.ac.uk/protected/query.html
- https://cqpweb.lancs.ac.uk/ (무료가입)
- http://clu.uni.no/icame/manuals/
- http://ucrel.lancs.ac.uk/
- https://ithub.korean.go.kr/user/guide/corpus/guide1.do 국립국어원 언어정보나눔터
- http://corpus.korea.ac.kr/ 고려대 한국어대사전을 출판한 고려대학교 민족문화연구원에서 제공하는 무료 코퍼스 분석 도구이다.
- American National Corpus
- Brown Corpus
- Corpus of Contemporary American English 통칭 COCA. 1990년부터 2015년 까지의 미국의 신문
- Santa Barbara Corpus of Spoken American English
홍콩 구어영어
표준중국어