default-image

ডাক্তারদের কাছে হাজার রকম রোগী আসেন। শরীর ব্যথার বর্ণনা করতে গিয়েও কত রকম ভাষা ব্যবহার করি আমরা! কেউ বলেন শরীর ‘ম্যাজম্যাজ’ করছে, কেউ বলেন ‘চিনচিন’ করছে, কারও আবার ব্যথায় ‘টনটন’ করে। ধরুন, একজন ডাক্তার তাঁর সমস্ত রোগীর কথার অডিও রেকর্ড করে রাখলেন। ধারণ করা কথাগুলো কম্পিউটারে দেওয়া মাত্রই কম্পিউটার যদি বের করে ফেলে, কোন ধরনের অসুখে মানুষ কোন শব্দগুলো বেশি ব্যবহার করে, নিশ্চয়ই সেটি ডাক্তারের বেশ কাজে আসবে। এ রকম একটি প্রকল্প নিয়েই কাজ করেছেন ঢাকা বিশ্ববিদ্যালয়ের ভাষাবিজ্ঞান বিভাগের শিক্ষার্থী সাজিয়া মেহনাজ। তাঁর এই থিসিস পেয়েছে দক্ষিণ কোরিয়ার ইনচিওন ন্যাশনাল ইউনিভার্সিটির ‘আউটস্ট্যান্ডিং করপাস থিসিস অ্যাওয়ার্ড’।

২০২০ সালে স্নাতকোত্তর পর্যায়ে ‘কগনিটিভ চ্যালেঞ্জেস অব অ্যানাফোরা: আ স্টাডি অন বাংলা প্রনোমিনাল এক্সপ্রেশন’ নামের থিসিসের জন্য সাজিয়া মেহনাজ এ অ্যাওয়ার্ডের আন্তর্জাতিক বিভাগে মনোনীত হন।

বিজ্ঞাপন

বাক্যে কোনো সর্বনাম সেই বাক্যের কোন বিশেষ্যকে নির্দেশ করছে, সেটি বের করার যে প্রক্রিয়া, তাকে বলা হয় অ্যানাফোরা রেজল্যুশন। কিন্তু যন্ত্রের ক্ষেত্রে এটি আলাদাভাবে বিশ্লেষণ করতে না পারলে যন্ত্র সেটি নির্ণয় করতে পারে না। সে ক্ষেত্রে যন্ত্রকে কিছু নির্দিষ্ট অ্যালগরিদম ঠিক করে দিতে হয় এবং যন্ত্র সে অনুযায়ী সমাধান দেয়। বাংলা ভাষায় এই নির্দিষ্ট বিষয়ে এর আগে যেসব কাজ হয়েছে, তার বেশির ভাগই হয়েছে কম্পিউটারবিজ্ঞানের আলোকে। সাজিয়ার লক্ষ্য ছিল ভাষাবিজ্ঞানের আলোকে পুরো কাজ করা।

সাজিয়া মেহনাজ বলেন, ‘শুরু থেকেই ভাষাবিজ্ঞানের তাত্ত্বিক বিষয়গুলোর চেয়ে প্রায়োগিক বিষয়গুলোয় আমার আগ্রহ বেশি ছিল। স্নাতকোত্তরের থিসিসের জন্য ভাষাবিজ্ঞানের জ্ঞানকে কাজে লাগিয়ে কীভাবে যুগোপযোগী প্রায়োগিক কোন বিষয় নিয়ে গবেষণা করা যায়—এটা ভাবছিলাম শেষ বর্ষের শুরু থেকেই। শেষ বর্ষের শেষ সেমিস্টারের কম্পিউটেশনাল লিঙ্গুইস্টিকস এবং স্নাতকোত্তর প্রথম সেমিস্টারের কর্পাস লিঙ্গুইস্টিকস কোর্স দুটি আমার জানার পরিধি বাড়িয়ে দেয়।’ এরপর নিজ আগ্রহ থেকেই ‘কর্পাস’ আর ‘ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং’—এ দুই বিষয়কে এক করে গবেষণা করার সিদ্ধান্ত নেন তিনি। থিসিসের কাজে তাঁর সুপারভাইজার ছিলেন অধ্যাপক শাহরিয়ার রহমান।

গবেষণা করতে গিয়ে কী ধরনের চ্যালেঞ্জের মুখোমুখি হতে হয়েছে, জানতে চেয়েছিলাম সাজিয়ার কাছে। বললেন, ‘থিসিসটি করার সময় বাংলা ভাষায় ব্যাকরণের এ-বিষয়ক রিসোর্স খুঁজে পেতে বেশ অসুবিধা হয়েছে। কিন্তু ইংরেজি ব্যাকরণের এ ধরনের বিষয়ের জন্য রিসোর্স অসংখ্য। তাই বাংলা প্রথাগত ব্যাকরণের পাশাপাশি এ ধরনের আপডেটেড বিষয়ের বইও থাকা প্রয়োজন।’

মোরশেদুল আলম ভূঁইয়া ও হাবিবা সুলতানার একমাত্র মেয়ে সাজিয়া মেহনাজ এখন একটি বেসরকারি সফটওয়্যার প্রতিষ্ঠানে অ্যাসোসিয়েট লিঙ্গুয়িস্ট হিসেবে কর্মরত।

বিজ্ঞাপন
প্র স্বপ্ন নিয়ে থেকে আরও পড়ুন
মন্তব্য করুন