British National Corpus
British National Corpus (BNC) atau Korpus Nasional Inggris adalah korpus monolingual berupa data atau kumpulan teks berbahasa Inggris yang berjumlah lebih dari 100 juta kata.[1] BNC juga disebut sebagai “bank of English” atau bank data bahasa Inggris yang terdiri atas data lisan dan data tulis, serta dikumpulkan melalui berbagai sumber dan topik.
Sejarah
[sunting | sunting sumber]British National Corpus dibuat pertama kali oleh Penerbit Universitas Oxford pada 1980 hingga awal 1990.[1] Saat ini, proyek ini merupakan kolaborasi beberapa pihak yaitu, Penerbit Universitas Oxford, Longman, Chambers, Universitas Lancaster, dan Perpustakaan Inggris.[2]
Konten
[sunting | sunting sumber]Sumber data BNC berasal dari 90% data tulis dan 10% data lisan. Data tulis diambil dari surat kabar, jurnal penelitian, majalah, dan buku-buku fiksi. Selain itu, data lisan antara lain bersumber dari transkripsi percakapan alami dan transkripsi rekaman acara-acara.[2]
Kegunaan
[sunting | sunting sumber]BNC berfungsi untuk membantu pekerjaan-pekerjaan di bidang linguistik, seperti:
- Penyusunan kamus monolingual dan bilingual Dalam penyusunan kamus, BNC berperan untuk membantu pemerolehan data perkembangan bahasa secara alami atau apa adanya. Sampel-sampel kalimatnya digunakan untuk mendukung pembuatan senarai istilah, definisi istilah, contoh lema (entri dalam kamus), penentuan kelas kata, dan kolokasi.[3]
- Uji dan evaluasi bahasa Inggris BNC berfungsi untuk membantu evaluasi semantik atau subkategorial dalam bahasa Inggris dalam rangka analisis makna berbasis komputasi.
- Penyusunan modul berbahasa Inggris BNC berguna untuk membantu mengetahui frekuensi kalimat dan polanya. Hasilnya menjadi bahan pembelajaran atau sumber referensi dalam produksi modul pembelajaran.[2]
- Penelitian linguistik lainnya.
Pemutakhiran
[sunting | sunting sumber]Saat ini, BNC2014 telah dibuat sebagai bentuk pemutakhiran BNC1994. Perbandingan keduanya cukup seimbang dan secara umum memiliki genre atau register yang sama. Pada BNC2014 terdapat tambahan fitur ‘E-language’. Meski begitu, mayoritas proporsi data dari setiap subdivisi korpora memiliki kemiripan.[2]
Referensi
[sunting | sunting sumber]- ^ a b "British National Corpus (BNC)". www.english-corpora.org. Diakses tanggal 2022-02-03.
- ^ a b c d Brezina, Vaclav (12 Agustus 2021). "The Written British National Corpus 2014 – design and comparability". De Gruyter Mouton. Diakses tanggal 2022-02-03.
- ^ Budiwiyanto, Adi. "Korpus Dalam Penyusunan Kamus". badanbahasa.kemdikbud.go.id. Diarsipkan dari versi asli tanggal 2022-02-02. Diakses tanggal 2 Februari 2022.