Tuesday, November 22, 2011

Sebuah Diskusi mengenai Korpus Bahasa Indonesia

Saya yakin Bahasa Indonesia akan mampu membuat korpusnya sendiri :)

pada sebuah kesempatan, setelah kelas Pengantar Metodelogi Penelitian Kebudayaan, tanggal 22 November 2011, awalnya saya akan langsung "bersembunyi" di perpustakaan. Namun, teman-teman mengajak saya untuk menghadiri sebuah seminar kecil mengenai korpus bahasa. Saya pikir nggak ada salahnya ikut diskusi kecil ini, lagipula pasti akan banyak wawasan baru yang akan saya dapat.
wah benar saya, selama hampir 2 jam mengikuti seminar kecil ini, wawasan saya menjadi bertambah buanyaaaaaak banget...
eits, tunggu dulu, apa sih itu korpus? mungkin orang-orang di luar dari bidang Linguistik, akan bingung. Oke, kalau yang belum tahu apa itu korpus, kalian bisa tanya Mbah Wiki, di sini. Atau kalau mau lebih jelasnya, bisa baca versi bahasa Inggris-nya di sini.
Gimana? udah nangkep belom apa itu korpus dalam bidang bahasa?
Acara ini diselenggarakan oleh program studi saya, yaitu prodi Indonesia, sebuah seminar dan diskusi singkat, serta sebuah sosialisasi mengenai korpus bahasa Indonesia. Kesannya akademis banget kan? Kalau kalian pikir acara ini bakal ngebosenin. Kalian salah. Karena seminar ini dibawakan oleh dua dosen andalan saya, yaitu Pak Nazarudin dan Pak Umar Muslim. Jelas aja, kedua dosen tersebut membuat seminar ini semakin menarik. kenapa? yaah cuma anak-anak IKSI dan Tuhan yang tahu kenapa. hahaa :) Belum lagi, anak IKSI yang terkenal dengan suka apapun yang gratisan, sewaktu di seminar ini kami dapat minuman ringan dan coklat-coklat, tambah antusias dong?

Oke, seminar ini dimulai dengan penjelasan apa itu korpus dalam bidang linguistik. Korpus itu secara singkat adalah sebuah kumpulan teks, dengan menggunakan metode penelitian yang berbasis data elektronis.
Jadi, korpus adalah sebuah temuan canggih yang menggabungkan dua dunia, dunia IT dan dunia linguistik.

Sistem Komputer + Ilmu Linguistik = Korpus

Korpus ini lebih dapat diandalkan daripada intuisi. Kalau selama ini, penelitian linguistik Bahasa Indonesia itu masih mengandalkan intuisi dan kata-kata para pakar linguistik (yang katanya belum tentu kebenarannya, kita masih pada tahap percaya pada mitos-mitos yang dikatakan mereka),
Munculnya korpus ini, tentu dapat mendeteksi:
1. Kolokasi : dengan korpus kita bisa mencari kata-kata yang berkolokasi. misalnya kita ingin mengecek kebenaran, apakah kata "garam" selalu berkolokasi dengan kata "dapur"?? naah, untuk melakukan itu kita gak bisa sembarang menentukan, dengan adanya korpus,penelitian akan jauh lebih objektif.

2. Frekuensi: korpus akan membantu menemukan kata-kata/frase-frase mana yang lebih banyak digunakan. Misalnya, dalam sebuah teks masa lampau, kita ingin menemukan/mengetahui sejak kapan penggunaan kata "Ada"? korpus akan segera memberikan jawabannya :) ringkas dan menghemat waktu bukan? Korpus juga bisa menjawab/menunjukkan kepada kita frekuensi penggunaan kata-kata/frase-frase sesuai dengan penelitian kita.

3. Makna Pragmatis / Prosodi : dengan korpus juga lah kita bisa membentuk kamus yang berdasarkan makna pragmatisnya. Selama ini kan, Pusat Bahasa membuat definisi lema-lema entah berdasarkan apa, kalau ada korpus, bahasa Indonesia akan semakin jelas, dan definisi-definisi dalam kamus itu akan lebih relevan dengan pemakaiannya di masyarakat.

4. Fraseologi (idiom): dengan korpus pula lah kita bisa mengecek frase-frase idiomatis secara akurat.

canggih ya? Tapi, dibalik kecanggihan itu semua, ada juga kekurangannya,
1. korpus tidak dapat memberikan informasi sesuatu unsur bahasa. Kalau kalian mau tau informasi lebih lanjut, kalian harus melakukan analisis, ya iya lah, korpus kan cuma alat bantunya, otaknya kan terletak pada manusianya, gimana mengolah sumber data tersebut.
2. korpus hanya menampilkan unsur-unsur yang terdaftar, Jadi, misalnya kalian mau teliti teks yang belum dimasukin ke korpus, mau sampai ubanan juga gak akan berhasil. Datanya dimasukin dulu lah, baru bisa diproses.
3. Korpus hanya berfungsi sebagai data, penyungguh informasi. Percuma aja kalau sama manusianya nggak diolah. Misalnya, korpus cuma nunjukkin, penggunaan kata "adalah" sekian persen. Nah, kalo cuma gitu doang sih buat apa? justru itu, manusia-manusia seperti kita harus mengolah agar data jumlah itu bisa memiliki arti.

Sebenarnya, kalau boleh dibilang Indonesia ini ketinggalan jauuuuh banget sama negara-negara maju yang lain (ya iyalah, dari segala aspek kali). di negara-negara lain, contohnya aja UK, misalnya di Universitas Oxford deh, mereka itu udah punya korpus yang hampir dikatakan lengkap banget. Jadi penelitian mereka menggunakan korpus itu lebih mudah.

nah gimana dengan di Indonesia? yaa Allah, kita itu masih lagi dalam tahap masukin data-datanya menjadi soft-file, kalian tau kan data-data itu banyak bangetttt... kayak masih butuh 20-50 tahun lagi buat nyaingin si korpusnya Oxford.

Sebenarnya sih kita bisa-bisa aja bergerak cepat menyusul mereka, asal kucuran dananya ada. Kalian pikir bikin korpus nggak pake duit? ya elaah, di mana-mana semua juga pakai duit kaliiii..
sekarang lembaga yang bertanggung jawab untuk bahasa siapa?
Pusat Bahasa. Oke, pusat bahasa ya? dia kan di bawah pemerintah, mereka punya dana yang disalurkan pemerintah kita. Tapi, sampai saat ini, Pusat Bahasa belum tergerak untuk membuat korpus bahasa Indonesia. Laah, terus kapan dong???? kapan penelitian bahasa akan dianggap penting?

Malah, sekarang program studi saya di UI sedang membuat korpus sendiri, lingkupnya masih dari data-data ilmiah yang di UI saja. Kalau bukan dari orang-orang UI sendiri yang bergerak, siapa lagi? kita ini nggak boleh salah-salahan. Kita harus perlu mandiri, kalau misalnya Pusat Bahasa belum bergerak dalam hal ini, ya udah, kalau kita mau nungguin mereka bergerak, saya rasa perlu waktu yang bikin kita semakin senewen. Nah, daripada senewen terus dan energi yang dikeluarkan sia-sia, mending kita memulainya dari diri kita atau kelompok-kelompok kecil kita sendiri. Nungguin dan berharap orang lain akan melakukan sesuatu untuk kita itu sulit, bung.

Dalam dunia bahasa dan sastra Indonesia, kita nggak akan bisa maju-maju penelitiannya kalau cuma berdasarkan mitos-mitos yang disampaikan para sesepuh. Perlu ada pembuktian.
begitu aja sih inti dari seminar mengenai korpus.
Semoga bermanfaat juga untuk menambah wawasan teman-teman yang baca, semoga bisa menambah masukan, dan pengetahuan mengenai dunia bahasa kita sendiri.


No comments: