ডিজিটাল পরিসরে বাংলা

আগামী দিনগুলোতে বাংলা ভাষার নানা কিছু সহজ করার জন্য যেসব প্রযুক্তিগত উদ্ভাবন ঘটবে, তার অনেক কিছুই বিকশিত হবে নতুন প্রজন্মের হাতে। ছবিটি প্রথম আলো আয়োজিত ‘বর্ণমেলা’ অনুষ্ঠানের

বর্তমান পৃথিবীতে চলছে ডিজিটাল যুগ। ব্যবহারিক বিবেচনায় বাংলাও এর সঙ্গে অভিঘাত মোকাবিলায় সচেষ্ট। বাংলাদেশে ডিজিটাল পরিসরে বাংলার ব্যবহার তথা চর্চা এখন আমাদের জীবনের আচার। মুঠোফোন ব্যবহার থেকে অর্থ লেনদেন, অফিস-কার্যালয়, সরকারি-বেসরকারি কাজে ডিজিটাল পরিসরের কার্যাবলিতে বাংলার সংশ্লেষ আমাদের উত্সাহিত করে।

প্রথমেই বুঝে নিতে চাই, ডিজিটাল পরিসর বলতে কী বোঝানো হচ্ছে, সেই সঙ্গে তার পরিসর আমাদের জন্য কতটুকু বিস্তৃত? স্মার্ট ঘড়ি, ট্যাবলেট বা ইন্টারনেট নাগরিকের (নেটিজেনের) কম্পিউটার ব্যবহারে এর সসীম অবস্থান নয়। ব্যাংকিং, অর্থ লেনদেন, কেনাকাটা, বাস-ট্রেন-বিমান বা বিবিধ পরিবহনে ডিজিটাল পরিসর বিস্তৃত। শিক্ষাপ্রতিষ্ঠানে ভর্তি, পরীক্ষার ফলাফল নির্ধারণ ও প্রকাশ—সর্বত্রই এখন ডিজিটালের প্রয়োগ। বিনোদন ও সময় কাটানোর ফন্দিও (যন্ত্র) এখন ডিজিটালের আওতাভুক্ত। বৈশ্বিক বাণিজ্য ও বহির্বিশ্বের সঙ্গে মিথস্ক্রিয়ায় ডিজিটাল প্রয়োগ অপরিহার্য। চিকিত্সাবিজ্ঞান, প্রকৌশল ও কারিগরি কর্মকাণ্ডে; প্রতিরক্ষা ও সামরিক প্রযুক্তি ও মহড়ায়; অপরাধ দমনে ও গুপ্তচর কর্মকাণ্ডে; বিমান ও জাহাজ চালনা থেকে মহাকাশ গবেষণায়; ভূতাত্ত্বিক জরিপ ও গবেষণায়; সাগর-মহাসাগর অন্বেষণ ছাড়িয়ে আধুনিক সভ্যতার সব পরিসরেই ডিজিটাল প্রয়োগ সুবিস্তৃত।

ডিজিটাল পরিসরেই যেহেতু আধুনিক বিশ্বের মহাযজ্ঞ, তাই আমরা বুঝতে চেষ্টা করব, ডিজিটাল পরিসরে বাংলা ভাষা অধুনা কতটুকু কুলিয়ে উঠতে পারবে।

পেছনের কথা

কম্পিউটার মূলত ছিল গণনাযন্ত্র, কিন্তু কালপরিক্রমায় এটি এখন আধুনিক জীবনের অনুঘটক। এই যন্ত্র শুধু গোড়াতে ইংরেজি ভাষানির্ভর ছিল এবং এখনো কম্পিউটার শিক্ষাদান ও চর্চা ইংরেজিতেই। পরবর্তীকালে এর সংকেত বিবিধ ভাষায়ও সাড়া দিতে উপযোগী করা হয়।

পৃথিবীর বিভিন্ন আধুনিক প্রগতিশীল ভাষায়, সেগুলোর ব্যবহারকারীদের নিরলস প্রচেষ্টায় প্রযুক্তি-প্রদত্ত সুবিধাদির সুযোগের সদ্ব্যবহার ঘটেছে। অথচ বাংলা ভাষা পৃথিবীর অন্যতম প্রধান ভাষা হওয়া সত্ত্বেও এখনো প্রযুক্তি-সংশ্লিষ্ট ব্যবহারিক সুবিধাদি এবং অগ্রগতিতে এর অর্জনের চিত্র আশানুরূপ নয়। বাংলাদেশে কম্পিউটারে বাংলা হরফ কে বা কারা তৈরি করেন, তা নিশ্চিত করে কেউ বলেন না। প্রথম উদ্যোগ বোধ হয় বুয়েটে, অক্ষর প্রদর্শনের জন্য ইলেকট্রনিক সার্কিট নাকি তৈরি হয় ১৯৮৫ সালে। অর্থাৎ আমাদের দেশে কম্পিউটারে বাংলা ভাষার ব্যবহার এবং প্রচলন ঘটেছে অনেক দেরিতে, আশির দশকের শুরুতে; বাংলাদেশিরা বিচ্ছিন্ন প্রচেষ্টায় এর সূচনা করেন। এখন তার দুই যুগ চলছে।

যাঁরা কম্পিউটার আবিষ্কার ও এর ব্যবহারের প্রচলন করেন এবং যাঁরা এই জ্ঞানচর্চা করেন, তাঁরা সবাই ইংরেজি আশ্রয়ী, বিধায় এর ভাষাও ইংরেজি হিসেবে দাঁড়িয়ে যায়। আদিতে ল্যাটিন বর্ণ ছাড়া অন্য ভাষা যুক্ত করা যেত না। ১৯৬৪ সালে এ দেশে যখন কম্পিউটার আসে, তখন তা যদিও শুধু গণনাযন্ত্র, তবে ১৯৮০ সালের আগের পারসোনাল কম্পিউটার পর্দায় বাংলা হরফ ফোটানো সম্ভব ছিল, কিন্তু সর্বৈব ব্যবহার্য বাংলা নয়।

১৯৮৪ সালের ২০ জানুয়ারিতে ম্যাকিনটোশ কম্পিউটার বাজারে আসে। সাইফুদ্দাহার শহীদ তখন লন্ডনে ম্যাকিনটোশ অপারেটিং সিস্টেম এবং ম্যাকরাইট বাংলায় রূপান্তরের কাজ শুরু করেন। প্রায় সমসাময়িক কালে, যাদবপুর বিশ্ববিদ্যালয় কম্পিউটারের পর্দায় বাংলা হরফের ‘প্রতিবিম্ব’ (ইমেজ) দেখাতে সমর্থ হয়, কিন্তু তার অধিকতর পার্শ্বিক ব্যবহার এবং ‘উত্পাদ’ (আউটপুট) লাভের কৌশল তখনো ধরা দেয়নি।

মোস্তাফা জব্বার জানাচ্ছেন যে টেন্ডি নামক পিসিতে তিনি বাংলা হরফ দেখেছেন। ১৯৮০ সালের আগের পারসোনাল কম্পিউটারে (তার ক্ষমতা যা–ই থাকুক) কেউ চেষ্টা করলে বাংলা লিখতে পারতেন। এমনকি ১৯৮১ সালে জন্ম নেওয়া আইবিএম পিসির ডোয়ান জান নামক ওয়ার্ড প্রসেসরটিতে ফন্ট এডিটর দিয়েও বাংলা লেখা যেত। ১৯৮১ সালে বাংলাদেশ ব্যুরো অব স্ট্যাটিস্টিকস স্থাপিত ফটোটাইপসেটার ছিল। (ডিজিটাল বাংলা, ২০১৮)।

১৯৮৫ সালে বাংলার জন্য একটা পূর্ণাঙ্গ ইন্টারফেস প্রস্তুত সম্ভব হয় এবং ১৯৮৬ সালে শহীদলিপি সফটওয়্যার চালু হয় গণমাধ্যম ইনস্টিটিউটে। এর পর থেকে বলা চলে, ১৯৮৭ থেকে আজ পর্যন্ত নিয়তই বাংলা ভাষার ডিজিটাল যাত্রায় কোনো না কোনো উন্নয়ন হয়ে আসছে।

সৈয়দ মাইনুল হাসান ১৯৮৭ সালের গোড়ার দিকে ডিটিপির কাজে যে মাইনুললিপি তৈরি করেন, সেটি ব্যবহার করেই বাংলায় প্রথম কম্পিউটার-ঘটিত (কম্পিউটারাইজড) পত্রিকা আনন্দপত্র প্রকাশ করেন বিজয় সফটওয়্যারখ্যাত মোস্তাফা জব্বার (১৬ মে ১৯৮৭)। এরপর দুই স্তরের কি–বোর্ড তৈরি করে মোস্তাফা জব্বার বাংলা ব্যবহারের অগ্রগতি ঘটান।

এ দেশে কম্পিউটারে বাংলা ব্যবহারের উল্লেখযোগ্য সূচনা ও প্রসার ১৯৮৮ সালের ডিসেম্বর থেকে, যখন মোস্তাফা জব্বার বিজয় কি–বোর্ডে তন্বী সুনন্দা ফন্ট প্রকাশ করেন। এই সময়ে ম্যাকিনটোশে গ্রাফিক সুবিধায় ফন্ট তৈরি করেন মাহমুদ হোসেন ও মুহম্মদ জাফর ইকবালও।

কারিগরি সমস্যা

কম্পিউটারে বাংলা ব্যবহারের দুটি মাত্রিকতা এ দেশে বিদ্যমান এবং এগুলো নিয়ে সমস্যাও বিদ্যমান। প্রথমটি আসকি কোড, অন্যটি ইউনিকোড।

সার্বিক জরিপ ও পর্যালোচনায় দেখা যায় যে এখন পর্যন্ত বাংলাদেশে কম্পিউটারে বাংলা লেখার জন্য সর্বাধিক ব্যবহৃত ও জনপ্রিয় প্রযুক্তি হলো মোস্তাফা জব্বার প্রবর্তিত বিজয় সফটওয়্যার। ১৯৮৮ সালে মুক্তিপ্রাপ্ত এই প্রযুক্তি এখন ব্যাপকভাবে ব্যবহৃত, বিশেষ করে সাধারণ মুদ্রণশিল্পে বাংলাদেশ ও তার বাইরে এর ব্যবহার সুপ্রতিষ্ঠিত হয়েছে।

বিজয় সফটওয়্যার আসকি কোড ব্যবহার করে; ফলে অনলাইনে বা সাইবারজগতে এর ব্যবহার সীমিত। বিজয় যদিও পরবর্তী পর্যায়ে ইউনিকোড ব্যবহারের সুযোগ রেখেছে, তবু সাইবারজগতে তার ব্যবহারও সর্বৈব সুচারু হয়ে ওঠেনি এখনো।

ইউনিকোডভিত্তিক বাংলা সফটওয়্যার কয়েকটাই বেরিয়েছে—বাংলাদেশে ও বাইরে। ভারতে ইউনিকোডভিত্তিক বেশ কয়েকটি সফটওয়্যার ব্যবহৃত হয়। আনন্দবাজার পত্রিকা গ্রুপ এর ব্যাপক ব্যবহারকারী। বেঙ্গালুরুতে উদ্ভাবিত ভিরিন্দা ইউনিকোড ফন্টটি সার্বিকভাবে সহজলভ্য ও সুব্যবহার্য। ব্যক্তিগত উদ্যোগে অনেক বাংলাদেশি আরও বাংলা ফন্ট ও সফটওয়্যার উদ্ভাবন করেছেন। খুলনা প্রযুক্তি বিশ্ববিদ্যালয়ের তানবিন ইসলাম সিয়াম উদ্ভাবিত কালপুরুষ এবং আর সোলায়মান করিমের সোলায়মান লিপি ইউনিকোড পাটাতনে তৈরি বলে মুদ্রণ ও অনলাইনে সমভাবে ব্যবহার্য।

মেহেদী হাসান খান ময়মনসিংহ মেডিকেল কলেজের ছাত্র থাকাকালে ২০০৩ সালের ২৬ মার্চে অবমুক্ত করেন তাঁর উদ্ভাবিত অভ্র সফটওয়্যার। একদিক থেকে সহজে ব্যবহার্য, উন্মুক্ত বলে সহজলভ্য এবং ইউনিকোডভিত্তিক হওয়ায় অভ্র বাংলাদেশ ও তার বাইরে যথেষ্ট জনপ্রিয় এবং ব্যবহৃত। ফনেটিক (ধ্বনিক) কৌশল ব্যবহার করে, ইংরেজি হরফে বাংলা বর্ণে বাংলা শব্দমালার কম্পিউটার প্রতিচ্ছবি সৃষ্টি এই প্রোগ্রামের বৈশিষ্ট্য। নির্দিষ্ট কোনো কি–বোর্ডবিন্যাসে ধাতস্থ না হয়েও সামান্য ইংরেজি জানা যে কেউ ধ্বনিভিত্তিক এই সফটওয়্যারে সহজে বাংলা লিখতে পারেন। তাত্ক্ষণিক প্রয়োজনে মুঠোফোন/আইপ্যাড/ট্যাবলেট বা অনুরূপ যন্ত্রে এটি ব্যবহার করা যায়। কোনো ডিজিটাল প্রয়োগে এ দিয়ে মোটামুটি কাজ করে নেওয়া যায়। এসব কারণে এর ব্যাপক ব্যবহার আছে। তবে উন্নত পর্যায়ে, সূক্ষ্মতর ব্যবহারে এবং সুদীর্ঘ কম্পোজের মতো দ্রুত কার্যসম্পাদনের ক্ষেত্রে কিছু সীমাবদ্ধতা এতে আছে। তা সত্ত্বেও অভ্র বাংলা প্রযুক্তি সংশ্লেষে একটি নাম বটে।

কম্পিউটারবিজ্ঞানী মুহম্মদ জাফর ইকবাল ও মাহমুদ হোসেন রতন যে একটা স্বতন্ত্র কি–বোর্ড তৈরি করে কম্পিউটারে বাংলায় লেখার উদাহরণ সৃষ্টি করেছিলেন, বিভিন্ন কারণে শহীদলিপি এবং এই সংস্করণটি ব্যাপক প্রসার লাভ করেনি। কাছাকাছি সময়ে এবং পরবর্তী সময়ে আরও কয়েকটা কি–বোর্ডভিত্তিক সংস্করণ আত্মপ্রকাশ করে। আবহ ও অনির্বাণ কি–বোর্ডভিত্তিক সংস্করণের পাশে এ ক্ষেত্রে উল্লেখযোগ্য কয়েকটি হলো ন্যাশনাল, লেখনী, আল্পনা, বর্ণসফট ইত্যাদি। এ ছাড়া পরে আগত অভ্র, অভ্র ইজি, প্রভাত, সামহোয়্যারইন, বৈশাখী, বংশী ইত্যাদি কি–বোর্ডভিত্তিক পদ্ধতি বর্তমানে প্রচলিত হয়েছে।

বিবিধ প্রয়োগ ও সীমাবদ্ধতা

বাংলা এখন বিবিধ মাত্রায় ও যন্ত্রে ব্যবহৃত হচ্ছে। তার জন্য বহুজাতিক কোম্পানিগুলোও নানান চেষ্টা ও কৌশল জারি রেখেছে। মাইক্রোসফট কোম্পানিটি তাদের যন্ত্রে সফটওয়্যারবান্ধব করে কিছু প্রোগ্রাম ব্যবহার প্রবর্তন করেছে, যেমন বাংলা লেখার ও অনুবাদের সফটওয়্যার। গুগল ট্রান্সলেশন অথবা নিছক মুঠোফোনে বাংলা ব্যবহার সম্ভব, এমনকি বাংলায় কথা বললে তা লিখিতরূপে দেখানোর জন্য (স্পিচ-টু-টেক্সট) জি-বোর্ড প্রোগ্রাম এখন দামি মুঠোফোনে ব্যবহার করা যায়; কিন্তু ইংরেজিতে মুঠোফোনের সামনে কথা বলে আদেশ দিলে যেমন মুঠোফোন সেই কাজ করে, তেমন বাংলা প্রোগ্রাম এখনো সঠিক হয়ে ওঠেনি। অটো ট্রান্সলেশন বা স্বয়ংক্রিয় অনুবাদযন্ত্রে বাংলা ব্যবহার এখনো অপেক্ষা করছে।

বাংলায় গুগলের মতো সার্চ ইঞ্জিন তৈরি হয়েছে দু–একটি (যথা মুহম্মদ জাফর ইকবালের পিপীলিকা আর নূরুল ফেরদৌসের খুঁজুন), তবে সেগুলোর কার্যকারিতা ও প্রচলন জনবান্ধব হয়ে ওঠেনি।

সমস্যা ও ভাবনা

ফলদায়ী প্রয়োগে কার্যকর আরও অনেক কিছু এখনো করা বাকি আছে। অন্যান্য ভাষায় যেসব কাজ হয়ে গেছে, সেগুলো থেকে আমরা, স্বীকার করতেই হয়, পিছিয়ে আছি। যান্ত্রিক অনুবাদ (মেশিন ট্রান্সলেশন), কথা-থেকে-লেখা (স্পিচ–টু–টেক্সট), হাতের লেখা বা ছাপা কোনো কিছু থেকে সরাসরি কম্পিউটারে কম্পোজ হয়ে যাওয়া (ওসিআর বা অপটিক্যাল ক্যারেক্টার রিডার), বানান শুদ্ধীকরণ (স্পেল চেক), শব্দবাছাই ও সজ্জিতকরণ (সর্টিং) ইত্যাদি অনেক কাজেই এখন বাংলা ভাষায় কম্পিউটারের প্রত্যক্ষ সমর্থন চালু হয়নি।

ফন্টঘটিত–বৃত্তান্ত

ফন্ট নিয়ে অনেক কাজ হয়েছে বাংলায়, সেই ছাপার অক্ষরের প্রথম যুগ থেকেই, ফলে উনিশ শতকের তৃতীয় দশকেই বাংলা ছাপার চেহারা অনেকটা পাল্টায়। ১৮৩১ সালে ভিনসেন্ট ফিগিন্স সম্ভবত প্রথম বাণিজ্যিকভাবে বিক্রির জন্য বাংলা হরফ তৈরি করেছিলেন। কিন্তু সম্ভবত লাইনোটাইপ প্রযুক্তি আসার পর ফন্টের এক প্রকার অবয়ব পরিবর্তনের ধারা শুরু হয়। লাইনোটাইপ এক অর্থে সহজ করে দেয় কম্পোজের সুবিশাল ‘ক্যারেক্টার’—মালা থেকে অপেক্ষাকৃত স্বল্পসংখ্যক ‘ক্যারেক্টারে’ কম্পোজ সম্ভব করে তোলা। শেষ পর্যন্ত বাংলা হরফের সংখ্যাকে ১২৪ এবং বিবিধ আরও ৫০টিতে নামিয়ে আনা গিয়েছিল।

লাইনোটাইপ বেঙ্গলি নামে মুদ্রাক্ষরশৈলীর উদাহরণ সৃষ্টি করেছিলেন টিম হলওয়ে নামক প্রতিভাবান অবাঙালি নকশাবিদ। বলা হয়ে থাকে যে বর্তমানে বাংলা ছাপা অক্ষরের সুদর্শন যে রূপটি দেখতে পাওয়া যায়, তা ১৯৭০-এর দশকের ওই লাইনোটাইপ বেঙ্গলিরই কোনো না কোনো রূপ। অনেক পরে (’৮০-৯০-এর দশকে?) আনন্দবাজার গ্রুপের সঙ্গে যুক্ত হয়ে লাইনোটাইপের যৌক্তিক বিন্যাস সাধন করেন ফিওনা রস। এর মধ্যে ভারতে বেশ কিছু ফন্ট জনপ্রিয়তা লাভ করে, যার বেশ কয়েকটির ডিজাইন করেন বিখ্যাত চলচ্চিত্রকার সত্যজিৎ রায়, যেগুলোর ব্যবহার এখনো পশ্চিমবঙ্গে রয়েছে, বিশেষ করে পোস্টার, নামফলক বা দেয়াললিখনে। ছাপার কাজে যতটা নয়; বরং ডিজাইন ও স্টাইলের জন্য সেগুলোর রয়েছে বিশেষ বৈশিষ্ট্য। কিন্তু বাংলাদেশের নিবেদিতপ্রাণ তরুণ উত্সাহী কয়েকজনের প্রচেষ্টায় সুপ্রচুর ফন্টবৈচিত্র্য এখন ছাপার কাজে এবং ইন্টারনেটে সহজলভ্য। বলা চলে, ফন্ট ও ডিজাইনে বাংলা ঋদ্ধ হয়ে ওঠে কম্পিউটারে বাংলা লেখা ও মুদ্রণপ্রযুক্তি অনুসরণের শুরু থেকে।

সংখ্যা ও বৈচিত্র্য আর ব্যবহারের ব্যাপকতার দিক থেকে আনন্দ কম্পিউটার্সের বাংলা সফটওয়্যারের ফন্টের কথা উল্লেখ করা যায়। বাংলাদেশের কয়েকটি পত্রিকাও নিজেদের মুদ্রণের জন্য আলাদা আলাদা ফন্ট ডিজাইন করে নিয়েছে। কিন্তু ফন্টশৈলী ও যৌক্তিক দিক থেকে কম্পিউটার বা ডিজিটাল ক্ষেত্রে ব্যবহৃত বেশির ভাগ বাংলা ফন্টই ত্রুটিমুক্ত এবং পুরোপুরি বিজ্ঞানসম্মত নয় বলে মনে করি।

ডিজিটাল ক্ষেত্রে বাংলা ফন্ট ব্যবহারের প্রধান সমস্যা মনে করি ‘কম্প্যাটিবিলিটি’, অর্থাৎ এক উদ্ভাবনের ফন্ট অন্যটাতে ব্যবহার বা স্থানান্তর করতে গেলেই কিছু কিছু গোল যেন বাধে। কখনো একেবারেই অবয়ব স্পষ্ট হয় না, কখনো ভেঙে যায়, আবার কখনো বিন্যাস বিস্রস্ত হয়। একই উদ্ভাবনের একেক সংস্করণ ও সেই সঙ্গে উইন্ডোজ অপারেটিভ ভার্সনের পার্থক্যের ক্ষেত্রে গোলমাল বেশি হয়। কোনো কোনো সফটওয়্যারে ‘পরাবর্তন’ (কনভার্সন) করার অপশন থাকে, কিন্তু তা–ও নিখুঁত হয় না, পরে আবার বেছে বেছে স্বহস্তে সেগুলো ঠিক করতে হয়। সবচেয়ে বেশি অসুবিধা রয়ে যায় ‘আসকি’ থেকে ‘ইউনিকোডে’ বা পারস্পরিক পরিবর্তন করতে গেলে।

নতুন মাধ্যম হিসেবে ইন্টারনেট আসার পর থেকে ডিজিটাল ফন্ট তৈরির কাজ শুরু হয়েছিল। বাংলাদেশের কয়েকজন উদ্যমী তরুণের প্রচেষ্টা চলেছিল ২০০২ থেকে ২০১২ সাল পর্যন্ত সময়ে। যদিও ইতিমধ্যে চল্লিশের বেশি ইউনিকোড কমপ্লায়েন্ট ফন্ট পাওয়া যাচ্ছে কয়েকটি উদ্যোক্তা প্রতিষ্ঠানের সহায়তায় (যথা একুশে, ওমিক্রনল্যাব, অঙ্কুর)। তবু গ্রাফিকসে যাঁরা কাজ করেন, তাঁরা তৃপ্ত নন। মনে করা হয়, ইউনিকোডে ফন্টবৈচিত্র্য সীমায়িত। অনলাইনে/ইন্টারনেটে তো সৃষ্টিশীল বাংলা কাজের কথা কেউ সাধারণত বলেন না। কিছু ইন্টারফেস নতুন করে সম্পাদিত করতে পারলে ভালো হতো।

আসকি আর ইউনিকোডের যে বড় তফাত—ব্যঞ্জনের সঙ্গে স্বরচিহ্ন বসানো এবং প্রয়োজন অনুযায়ী যুক্তবর্ণ কম্পোজ করায়—দ্বিরীতিতে অভ্যস্ত না হলে ব্যাপক ব্যবহারকারী কেবলই হোঁচট খেতে থাকেন। ইউনিকোডে যেহেতু ব্যঞ্জনের শেষে স্বরচিহ্ন বসাতে হয় অথবা যুক্তব্যঞ্জনের পর লিংক-চাবি ব্যবহার করে অন্য চিহ্ন বসাতে হয়, সে ক্ষেত্রে কয়েকটি সংযুক্তি সমস্যার সৃষ্টি করে। যেমন ব্যঞ্জনের সঙ্গে রেফ বসানো, কোনো ব্যঞ্জনের সঙ্গে য-ফলা বসানোতে দ্রুততায় কাজ করতে চাওয়া ব্যবহারকারীর জন্য বিড়ম্বনাবিশেষ।

যুক্তবর্ণ ও সেগুলোর সম্মিলনের পর যে সামগ্রিক অবয়ব বা চেহারা দাঁড়ায়, তা সব ক্ষেত্রে নান্দনিকতা বজায় রাখতে পারে না। কোনো কোনো যুক্তবর্ণের সঙ্গে হ্রস্ব উ-কার বসালে তা ছাপায় গিয়ে লেপটে যায়, যেমন সম্মুখ, আপ্লুত, হণ্ডুরাস (বিদেশি শব্দ) ইত্যাদি।

বাংলা স্বচ্ছ যুক্তবর্ণ ও সম্পৃক্ত যুক্তবর্ণ নিয়ে শিক্ষাবিদ ও বিশেষজ্ঞরা এখনো একমত হতে পারেননি। এখন মিশ্ররীতি বজায় আছে। ফলে অনেক শিক্ষিত ব্যক্তিও অনেক সময় জানেন না, কোন কোন বর্ণ নিয়ে বাংলায় কোন যুক্তবর্ণটি গঠিত (দুটো উদাহরণই যথেষ্ট: ষ্ণ = ষ্ + ণ, জ্ঞ = জ্ +ঞ)। কম্পিউটার কম্পোজে এই অজ্ঞতার প্রতিফলন দেখা যায়।

আসলে উনিশ শতকের তৃতীয় দশকেই বাংলা হরফের চেহারা পাল্টে যায়; বিদ্যাসাগর উদ্যোগ নিয়ে কিছু সংস্কার করেন, যাতে স্বচ্ছ ও অস্বচ্ছ বর্ণের তফাত বোঝা এবং দৃষ্টি-সমস্যা ও ধারণার প্রকাশ কিছুটা মিটেছিল; কিন্তু তিনি সব কটি সমস্যার সুরাহা করে যাননি। দেখা যাচ্ছে যে অনেক অস্বচ্ছ যুক্তবর্ণ অস্বচ্ছই থেকে গেছে। বাংলাদেশে জাতীয় পাঠ্যপুস্তক পর্ষদ (এনসিটিবি) শিশুপাঠে সহজতার কথা বলে স্বচ্ছ যুক্তবর্ণ ব্যবহার করে। প্রাথমিক শিখনে হয়তো তার একটা ফল লাভ হয়, কিন্তু মাধ্যমিক ও উচ্চমাধ্যমিক পর্যায়ে গিয়ে শিক্ষার্থীকে নতুন করে, একটি একটি যুক্তাক্ষর ‘ক্যারেক্টার’ হিসেবে আত্মস্থ করতে হয়। প্রপঞ্চটি পুরোনো, কিন্তু কম্পিউটারের ইন্টারফেসে যেখানে সুযোগ আছে, তাতে অভিন্ন হরফনীতিতে বাংলাকে বিন্যস্ত করা যায়। জানা যাচ্ছে যে সময়ের সঙ্গে যদিও বিদ্যাসাগরীয় হরফের সামান্য কিছু পরিমার্জনের চেষ্টা হয়েছে, কিন্তু কম্পিউটারের ফন্ট ডিজাইন করতে গিয়ে ডেভেলপাররা সেগুলোর জনপরিচিত চেহারা মোটামুটি আগের মতোই রেখেছেন। বিদ্যাসাগরীয় ধারার দৃষ্টিগ্রাহ্য ব্যত্যয় ঘটেছিল লাইনোটাইপে। সেখানে বরং এক অর্থে স্বচ্ছতা অনেক বেশি।

অন্যদিকে দেখলে, বাংলার চেয়ে জটিলতর হয়েও পৃথিবীর অনেক ভাষা ডিজিটাল প্রযুক্তির সংশ্লেষ ঘটিয়েছে। যেমন চীনা, জাপানি, কোরীয় বা থাই ভাষা অনেকটাই প্রযুক্তিবান্ধব। আমরাও হয়তো পারতাম, যদি সমন্বিত উদ্যোগে বাংলার উন্নয়নকর্ম গ্রহণ করা যেত। এক ইউনিকোডভিত্তিক ব্যবহার পুরোপুরি নিখুঁত করতে পারলেই অনেকটা এগিয়ে যাওয়া যেত।

ইউনিকোডে বাংলা

ইউনিকোডে বাংলার সম্পৃক্তি ঘটেছে অনেক বিলম্বে। বাংলাদেশ দীর্ঘদিন ইউনিকোড কনসোর্টিয়ামের সদস্য হয়নি। মাত্র অক্টোবর ১৯৯১-এ ইউনিকোড স্ট্যান্ডার্ডে বাংলালিপিকে যোগ করা হয়। ইউনিকোডে বাংলালিপির অবস্থান U+ 0980 থেকে U+ 09FF। অফিশিয়াল ইউনিকোড কনসোর্টিয়াম কোড চার্টেও (সংস্করণ ১১.০) পুরো ছকটিতে ১৫x৯ = মোট ১৪৫টি খোপে (কোড ব্লক রেঞ্জে) বাংলার বর্ণগুলোর সংস্থান করা হয়েছে। তার মধ্যে আজকের দিনে অপ্রয়োজনীয় বা বাংলায় সরাসরি অহরহ প্রয়োজন হয় না এমন বর্ণ বা গাণিতিক চিহ্ন রয়েছে (কিছু কোড পয়েন্টে অহমিয়া, পালি ও সংস্কৃত ভাষার)। ৩১টি খোপ বা ফাঁকা জায়গা অনির্ধারিত। তাতে দাঁড়াচ্ছে যে প্রয়োজনে আরও কিছু যোগ করা যেতে পারে, যেমন বাংলা দাড়ি এখানে নেই, তার ঘরটি অব্যবহৃত রয়েছে। বাংলাদেশি টাকার চিহ্নও অনুপস্থিত। অন্যদিকে এক ৎ যোগ করা নিয়ে অনেকটা সময় ধরে ইউনিকোডের কাছে ধরনা দিতে হয়েছিল। ড়, ঢ় এবং য়-এর জন্য ইউনিকোডে সংস্থান নিয়ে বাংলাদেশ দর–কষাকষি করে যাচ্ছে। এখন আবার যখন আমরা চাইছি ইন্টারনেটের ডোমেইন নাম বাংলায় করতে, তখন আন্তর্জাতিক সংস্থার দিক থেকে কিছু বাছবিচার আসছে। আইসিএএনএন (ইন্টারন্যাশনাল করপোরেশন ফর অ্যাসাইনড নেমস অ্যান্ড নাম্বারস) মনে করে, বিশাল সংখ্যায় মানুষকে ইন্টারনেটের আওতায় আনতে হলে তাদের মাতৃভাষা হলো সর্বোত্তম মাধ্যম, যার একটি ধাপ হলো আইডিএন (ইন্টারন্যাশনাল ডোমেইন নেম) যার যার মাতৃভাষায় করতে দেওয়া। তাতে স্থানীয় লিপি দিয়ে ইউআরএল ডোমেইন লেখার ব্যবস্থা করা হবে। বর্তমানে ডোমেইন নেম যেখানে আসকি কোডে লেখা হয়, আইডিএনে তা ইউনিকোডনির্ভর। পাঁচটি ভাগে পুরো ঠিকানাটা লেখা হয়। সে ক্ষেত্রে বাংলা সংযোজন করলে এ রকম হতে পারে—https://www.সরবরাহ.সিন্দাবাদ.বাংলা। এখানে ডান থেকে বাঁয়ে টপ লেভেল ডোমেইন, সেকেন্ড লেভেল ডোমেইন, পরে সাবডোমেইন নাম বাংলায় ও ইউনিকোডে লেখা হয়েছে। প্রতিটি লেভেলে ভাষার মৌলিক বর্ণমালার সর্বোচ্চ ৬৩টি ব্যবহার করা যায়। এর জন্য আবার দুটি শর্ত আছে আইসিএএনএনের।

কিন্তু বাংলালিপিতে ডোমেইন নেম লেখায় কিছু সমস্যার উদ্ভব হয়েছে। সেগুলোর মধ্যে অন্যতম হলো ভারতীয় কিছু ভাষার বর্ণের সঙ্গে বাংলার সাদৃশ্য। বাংলাদেশের পর্যবেক্ষণে দেখা যাচ্ছে যে ভারতীয় মান অনুসরণে ড, ঢ, য-এর নিচে আলাদা ‘নুকতা’ বা বিন্দু দিয়ে ড়, ঢ়, য় লিখতে বলা হচ্ছে, যার পক্ষে আমরা কেউই নই। কেননা দীর্ঘকাল পর্যন্ত আমাদের বর্ণমালায় সদম্ভে আপন সত্তা নিয়ে ড়, ঢ়, য় বর্তমান, এতেই আমরা অভ্যস্ত। আমরা মনে করি, বাংলা ইউনিকোড চার্টে বাংলা ভাষার যথার্থ ব্যবহারনির্দেশ ও দিশা পাওয়া যাচ্ছে না। কাজেই এর পরিমার্জন ও সংশোধন প্রয়োজন। বাংলা ডোমেইনে আইডিএন–জটিলতা তার অন্যতম উদাহরণ।

মার্চ ২০১৯-এ জাপানের ইস্পাতশিল্প নগরী কোবেতে আন্তর্জাতিক আইসিএএনএন সম্মেলনে বাংলা ইউনিকোড ব্লকের সমাধানের চেষ্টা হয়েছে। আশা করা যায়, একটা গ্রহণযোগ্য মতৈক্যে আসা যাবে।

সমাধান বা সমস্যার অবসান

সমস্যার খতিয়ান এখানেই শেষ নয়। এসব ক্ষেত্রে সমস্যা থাকবেই, সমাধানও করতে হবে। তাই চ্যালেঞ্জ রয়ে গেছে। বাংলার ডিজিটালবান্ধব করার উদ্যোগ ও প্রচেষ্টায় আমরা পিছিয়ে আছি। কেননা তার ভিত্তিই তৈরি হয়নি, তাই বাংলা এখনো লো-রিসোর্স ল্যাঙ্গুয়েজ। বাংলার জন্য যথেষ্ট ‘কর্পাস’ (ভাষাংশ) এখনো আমাদের হাতে জমেনি। এটা এক-দুই বছরের, দু–একজনের কাজ নয়। কলকাতার আইএসআই (ইন্ডিয়ান স্ট্যাটিস্টিক্যাল ইনস্টিটিউট) অনেক আগে থেকে কাজ শুরু করেও এখনো উল্লেখ করার মতো পরিমাণ ভাষাংশ সংকলিত করার প্রক্রিয়াতেই আছে।

ভাষার আধুনিক প্রযুক্তির গবাক্ষ-উন্মুক্তিতে এআই বা কৃত্রিম বুদ্ধিমত্তার বড় ভূমিকা থাকবে, তা রোবোটিকসে গুরুতর ভূমিকা পালন করবে; সেখানে বাংলার সংযুক্তি একটি চ্যালেঞ্জ নিঃসন্দেহে। এনএলপি (ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং) নির্ভর করে এআইয়ের ওপর। এআই প্রযুক্তির প্রধান খাতই তো এনএলপি, যার সঙ্গে উচ্চারিত ও আলোচিত হয় মেশিন লার্নিং, বিগ ডেটা অ্যানালাইসিস, আইওটির মতো প্রযুক্তির অন্ত্যফল। দুঃখের বিষয়, এসব খাতে আমাদের কোনো প্রতিষ্ঠান (একাডেমি বা গবেষণাপ্রতিষ্ঠান) বা শিল্পোদ্যোগ এগিয়ে এসে কার্যকর ভূমিকা পালন করেনি, শুধু পাশ্চাত্য প্রযুক্তির ধারণ ও পুচ্ছগ্রাহিতা ছাড়া।

আশার কথা

অনেকটা বিচ্ছিন্নভাবে হলেও যা কিছু কাজ হয়েছে, তার সবই ব্যক্তি উদ্যোগে বা ক্ষুদ্রায়তনে প্রাতিষ্ঠানিক অনুভূমিক সমতলে। বিভিন্ন বিশ্ববিদ্যালয় (যথা বাংলাদেশ প্রকৌশল বিশ্ববিদ্যালয়; শাহজালাল বিজ্ঞান ও প্রযুক্তি বিশ্ববিদ্যালয়; খুলনা প্রকৌশল বিশ্ববিদ্যালয়; ঢাকা বিশ্ববিদ্যালয়) ভাষাপ্রযুক্তি নিয়ে কাজ

করার চেষ্টা করে আসছে এবং এখনো সচেষ্ট আছে। কিছু ব্যক্তি উদ্যোগের কথা আগেই উল্লেখ করা হয়েছে। কিছু সফটওয়্যার অনেকটা

প্রয়োজন মেটাচ্ছে, যেমন আনন্দ কম্পিউটার্স মাল্টিমিডিয়া কয়েকটি শিশুতোষ শিক্ষণ সিডি প্রকাশ করেছে, যেমন করেছে বিভাষীর জন্য ও বাংলাভাষীর জন্য প্রমিত বাংলা ও উচ্চারণ শেখার প্রোগ্রাম।

এসব ছাড়া বাংলাদেশ কম্পিউটার কাউন্সিল কিছু প্রকল্প হাতে নিয়েছে, যাতে ১৬টি বিভিন্ন দিকে কাজ শুরু হয়েছে। তাদের তত্ত্বাবধানে ‘গবেষণা ও উন্নয়নের মাধ্যমে তথ্যপ্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ’ প্রকল্পের চলমান কাজে সফটওয়্যার/টুল/রিসোর্স উন্নয়নের প্রচেষ্টার মধ্যে আছে বাংলা থেকে ১০টি ভাষায় স্বয়ংক্রিয় যান্ত্রিক অনুবাদ, বাংলা ওসিআর, স্পিচ-টু-টেক্সট, বাংলা ফন্ট রূপান্তর ইঞ্জিন, বাংলা বানান বা ব্যাকরণ পরীক্ষণ ও সংশোধন, ক্ষুদ্র জাতিগোষ্ঠীর ভাষার জন্য কি–বোর্ড উন্নয়ন ইত্যাদি।

সম্প্রতি বাংলাদেশ কম্পিউটার কাউন্সিল আরও কয়েকটি দিকে কাজ করে যাচ্ছে। যেমন বাংলা বর্ণ ও কোড পয়েন্ট প্রমিতকরণ, কম্পিউটারে বাংলা টাইপফেসের প্রমিতকরণ, অনলাইনে ব্যবহৃত বাংলা বানান প্রমিতকরণ, যন্ত্রসহায়ক নিয়মাবদ্ধ বাংলা শব্দ ও ভাষা ব্যবহারের মান্য রূপ প্রণয়ন, কম্পিউটারে বাংলা শব্দের বাছাইক্রম (সর্টিং অর্ডার) নির্ধারণ, ওয়েব ও সফটওয়্যারে ব্যবহৃত পরিভাষা/গ্লসারির বাংলাদেশ মান প্রণয়ন, বাংলা-আইপিএ ও বাংলা-রোমান বর্ণ ট্রান্সলিটারেশন ও প্রতিবর্ণীকরণ মান প্রণয়ন, ইশারা ভাষার প্রমিত রূপ নির্ধারণ। এই সব কটির অগ্রগতি আশা করা যাচ্ছে।

স্থানাভাবে তথ্যসূত্র দেওয়া গেল না

● মহাম্মদ দানীউল হক: জাহাঙ্গীরনগর বিশ্ববিদ্যালয়ের বাংলা বিভাগের সাবেক অধ্যাপক।