Perkamusan Arab dan Komputer
Tahap perkembangan ilmu perkamusan moden dalam konteks bahasa Arab masih kurang memuaskan. Hal ini kerana tidak banyak kamus yang disusun berasaskan korpus berkomputer. Pengkomputeran bahasa Arab sebenarnya telah pun diterokai oleh pengkaji-pengkaji barat. Walaupun kajian bahasa Arab berasaskan korpus masih belum mencapai ke satu tahap yang boleh dibanggakan, namun demikian beberapa kajian telah dilakukan ke arah itu, seperti kajian oleh Mark Van Mol.
Beberapa usaha telah dilakukan ke arah membina korpus bahasa Arab untuk tujuan penyelidikan bahasa. Usaha ini termasuklah projek pembinaan korpus yang dijalankan di Leeds, Lyon, Leuven, Nijmegen dan Prague. Korpus yang dibina di Universiti Leuven, Nijmegen dan Prague merupakan korpus berkomputer bahasa Arab terawal yang dibina khusus untuk tujuan penyusunan kamus. Kumpulan penyelidik ketiga-tiga buah universiti ini telah mempelopori pengunaan teknologi komputer sepenuhnya dalam penyusunan kamus bahasa Arab.
Leerwoordenboek Arabisch-Nederlands (LAN)
Salah satu usaha yang sedang dilaksanakan untuk memanfaatkan korpus dalam pengajaran dan penyelidikan bahasa Arab ialah projek penyelidikan oleh Mark Van Mol di Universiti Leuven (Belgium). Beliau ialah sarjana yang mempelopori kajian korpus berkomputer bahasa Arab di zaman ini. Korpus yang dibina oleh beliau mengandungi 3 juta perkataan termasuk 1 juta dari sumber lisan dan merangkumi hanya teks yang diterbitkan selepas tahun 1980. Kajian-kajian beliau yang berkaitan telah diterbitkan dalam pelbagai makalah dan termuat dalam laman web.
Projek perkamusan beliau juga telah berjaya menghasilkan kamus bahasa Arab pertama yang disusun berasaskan korpus berkomputer. Proses penyusunannya memakan masa 7 tahun bermula dari tahun 1996 hingga 2001. Kamus Arab-Belanda ini disusun untuk kegunaan pelajar dan mengandungi 17000 entri disamping 10000 ayat contoh yang menjelaskan konteks penggunaannya. Beliau telah melakukan usaha gigih untuk mengumpulkan kosa kata bahasa Arab yang terkini dan relevan dengan pembelajaran bahasa Arab. Kajian beliau mendapati kamus ini mampu membantu pelajar memahami 99% teks pelajaran bahasa Arab.
Vertaalwoordenboek Arabisch-Nederlands (VAN)
Kejayaan Mark Van Mol menerbitkan kamus edisi pelajar telah memberi ilham kepada kumpulan penyusun Universiti Nijmegen (Belanda) untuk menghasilkan kamus yang lebih besar bagi memenuhi keperluan penterjemahan. Kerja penyusunan kamus ini diketuai oleh Jan Hoogland dengan bantuan pensyarah dan pelajar Jabatan Bahasa dan Kebudayaan Timur Tengah. Proses penyusunan yang bermula pada tahun 1997 berakhir pada tahun 2003 dengan terbitnya 2 jilid kamus iaitu Arab-Belanda dan Belanda-Arab.
Kamus Arab-Belanda ini boleh dikatakan besar, kerana selain mempunyai 24000 entri, ia turut disertai lebih daripada 100000 ayat contoh, kolokasi dan frasa idiomatik. Jumlah kosa katanya yang besar menjadikannya sangat sesuai digunakan sebagai alat bantu penterjemah. Hasil ujikaji penyusun membuktikan bahawa kamus ini mampu digunakan untuk menterjemah 99.5% teks bahasa Arab kontemporari.
Proses pembinaan korpus bahasa Arab di Nijmegen telah bermula pada tahun 1994 dengan melakukan pemgimbasan data sumber terlebih dahulu sebelum dipindahkan ke dalam bentuk digital. Data asal dalam bentuk grafik diimbas dengan menggunakan Pengecaman Aksara Beroptik (OCR atau Optical Character Recognition). Masalah utama yang dihadapi ialah kelemahan perisian yang digunakan menyebabkan berlaku banyak kesalahan ejaan. Teks sasaran terpaksa disemak semula untuk memastikan supaya tiada kesilapan ejaan berlaku. Namun demikian, penggunaan OCR telah memberi sumbangan besar dalam pembinaan korpus terawal ini.
Arabsko-český slovník (ACS)
Pada keseluruhannya, kamus ini mempunyai 21000 entri, 28000 makna serta 18000 frasa idiomatik dan kolokasi. Projek penyusunan kamus ini bermula dengan kerja pengumpulan data korpus dari tahun 1997 hingga 1999 dan telah berjaya mengumpul data korpus bahasa Arab moden yang berjumlah 50 juta perkataan. Korpus bernama (CLARA – Corpus Linguae Arabicae) ini adalah sebahagian daripada projek pembinaan Korpus Kebangsaan Czech dan dibina untuk tujuan penyusunan sebuah kamus Arab-Czech yang baharu. Data korpus yang dikumpul merangkumi hanya teks yang diterbitkan selepas tahun 1990, ini termasuklah 50% terbitan berkala dan 35% monografi. Selain itu, 20% teks telah dihasilkan dengan menggunakan Pengecaman Aksara Beroptik (OCR). Setelah terbitnya kamus ini pada tahun 2006, kumpulan penyusunnya sedang merancang usaha untuk menghasilkan pelbagai kamus istilah dan frasa.
Inovasi
Penerapan teori leksikografi dan analisis korpus berkomputer telah menjadikan corak penyusunan ketiga-tiga kamus ini lebih sistematik dan bermutu berbanding kamus-kamus yang dihasilkan secara manual. Banyak pembaharuan dapat dilihat melalui teknik penyampaian dan penyusunan makna, ayat-ayat contoh yang disertakan, pembeza makna, maklumat sintaksis dan kolokasi. Setiap makna ditandai dengan nombor, disusun mengikut kekerapan dan disertai dengan contoh-contoh untuk menjelaskan konteks pengunaan. Maklumat tentang sesuatu kata hanya dimasukkan setelah meneliti kekerapan dan penggunaan sebenar dalam data korpus. Ciri-ciri inilah yang telah menjadikan kamus-kamus ini kamus dwibahasa Arab yang paling autoritatif di pasaran.
Setakat ini hanya tiga kamus ini disusun berasaskan korpus berkomputer dengan menerapkan teori leksikografi moden. Penerbitan kamus-kamus ini menjadi mercu tanda yang penting dalam sejarah perkamusan Arab. Kejayaan ini menunjukkan bahawa teknologi komputer mampu diterapkan untuk menghasilkan kamus bahasa Arab yang lebih bermutu.
Perkembangan pesat yang berlaku dalam ilmu perkamusan, menuntut supaya usaha penyusunan kamus Arab-Melayu juga dijalankan dengan menggunakan teknologi komputer, tanpa menggunakan cara tradisional lagi. Dari sinilah bermulanya idea kami untuk merancang strategi penyusunan sebuah kamus Arab-Melayu kontemporari dengan berbantukan komputer, yang diharap akan menjadi inovasi dalam perkamusan bahasa Arab.
Pautan:
Projek Kajian Linguistik Arab Berkomputer (Universiti Leuven)
Projek Penyusunan Kamus Arab-Belanda (Universiti Nijmegen)
Projek Penyusunan Kamus Arab-Czech (Universiti Prague)
Discussion
No comments yet.