Pangkalan Data Lexikon (PDL)
Pangkalan Data Lexikon ialah tempat menyimpan maklumat tentang kosa kata sesuatu bahasa. Maklumat ini merangkumi maklumat linguistik seperti fonologi, morfologi, semantik, pragmatik dll. Dalam konteks bahasa Arab, terdapat beberapa pangkalan data lexikon yang telah atau sedang diusahakan pada masa kini, yang paling terkenal ialah projek DIINAR-MBC (DIctionnaire INformatisé de l’ARabe, Multilingue et Basé sur Corpus), yang diusahakan dengan kerjasama penyelidik dari lima buah negara.
Kami merancang untuk membina sebuah pangkalan data lexikon yang berfungsi menyimpan semua maklumat kosa kata yang telah terkumpul melalui kajian ini. Pangkalan data ini akan dibina secara berperingkat dalam jangka masa panjang memandangkan data yang besar dan lengkap mungkin memerlukan berpuluh-puluh tahun dari segi usaha pengumpulannya.
Sehingga kini, data yang terkumpul mengandungi 20000 perkataan, dengan setiap kata dilengkapi dengan maklumat kelas kata (cth. kata nama, kata kerja, adjektif), kata dasar (jizr) dan bentuk kata (wazn). Selain itu, data frasa (rangkai kata, idiom, kolokasi) pula berjumlah 34000. Semua data ini dipinjam atau diadaptasi daripada kamus yang sedia ada dalam bentuk digital.
Data lexikon yang sedia terakam dalam pangkalan data akan menjadi tunjang dalam kajian ini, walaupun data yang tersimpan masih sedikit dan belum memuaskan. Usaha selanjutnya akan dijalankan untuk memasukkan kata baru, frasa dan maklumat linguistik yang berkaitan. Dalam hal ini, kamus-kamus lain yang berada di pasaran juga akan dimanfaatkan untuk penambahan data yang sedia ada. Selain itu, data korpus akan digunakan untuk memperolehi contoh-contoh sebenar dan kemudiannya disimpan di dalam pangkalan data sebagai bukti sokongan.
Pangkalan data ini masih dalam peringkat pembinaan. Walaubagaimanapun, dalam perancangan kami, usaha akan dijalankan untuk membolehkan pangkalan data ini dicapai dalam talian. Ini akan membolehkan lebih ramai lagi dapat menyumbang tanpa perlu berkumpul di suatu tempat. Pengguna juga boleh mencapai maklumat dengan mudah dan cepat.
Jika ramai pengkaji bahasa berganding bahu, tidak mustahil satu pangkalan data yang besar akan dapat dihasilkan. Apabila data dimasukkan ke dalam pangkalan data yang sama, banyak tenaga, kos dan masa dapat dijimatkan.
Kami berharap pembinaan PDL ini akan menjadi sumber data lexikon bahasa Arab yang boleh dimanfaatkan bukan hanya dalam penyusunan kamus, bahkan juga dalam aktiviti pengajaran dan penyelidikan bahasa.
Discussion
No comments yet.