ডিজিটাল মাধ্যমে যেভাবে জায়গা করে নিচ্ছে ভয়েস প্রযুক্তি

স্মার্টফোন বা গেজেটের নানান আকৃতির চোখধাঁধানো স্ক্রিন, কি–প্যাড আর স্ক্রিন সোয়াইপের যুগেও আমাদের ভয়েস ডিজিটাল প্রযুক্তির যুগান্তকারী বিকাশে পাকাপোক্তভাবেই স্থান করে নিচ্ছে। কল বাটন বা কি–প্যাড চেপে মেসেজে মনের ভাব প্রকাশ করার দিন ফুরিয়ে এসেছে। মনের ভাব, আবেগ-অনুভূতি প্রকাশের এ কাজটি এখন করা যাচ্ছে কৃত্রিম বুদ্ধিমত্তা, অ্যালগরিদম ও ডাটার নিবিড় সমন্বয়ের মাধ্যমে।

এই কর্মযজ্ঞ আমাদের পরিচয় করিয়ে দিচ্ছে অপার সম্ভাবনার এক নতুন প্রযুক্তি, ভয়েস টেকনোলজির সঙ্গে, যেখানে আমাদের মুখের কথা শুধু বাতাসে ধ্বনিতই হয় না বরং কথামতো কাজ করা, কোনো তথ্য খুঁজে দেওয়া বা ব্যাংক লেনদেন করার মতো কাজগুলোও করে দেয়। এই বিবর্তনশীল প্রযুক্তিটি ধীরে ধীরে আমাদের দৈনন্দিন জীবনে বিস্তার লাভ করছে, কথা বলে সেবা নিতে সাহায্য করে। তাই জাদুকরি এই প্রযুক্তিটিকে কীভাবে পরিচালিত হচ্ছে আর কীভাবে এই প্রযুক্তি ডিজিটাল উৎকর্ষের সীমাকে নতুন উচ্চতায় নিয়ে যাচ্ছে, সে বিষয়ে জানতে আমাদের আগ্রহের শেষ নেই।

ভয়েস টেকনোলজির মূলে কী কাজ করে

ভয়েস টেকনোলজি, প্রযুক্তি ও কৃত্রিম বুদ্ধিমত্তার সঙ্গে আমাদের মিথস্ক্রিয়াকে এক অনন্য উচ্চতায় নিয়ে গিয়েছে, যেখানে কথার মাধ্যমেই আমরা ডিজিটাল প্রযুক্তিনির্ভর কোনো সেবা নিতে পারছি। মুখের কথা শনাক্ত করতে পারা ও সিনথেসিসের মধ্যে যোগসূত্র স্থাপন করে মানুষ ও যন্ত্রের মধ্যে কথোপকথন চালিয়ে নেওয়া যাচ্ছে। এত সব অসাধ্যসাধনে পারদর্শী ভয়েস টেকনোলজির মূলে কী কাজ করে, তা জানতে আমাদের আগ্রহের শেষ নেই। প্রাথমিকভাবে বলা যায়, ভয়েস প্রযুক্তির মূলে রয়েছে তিনটি প্রক্রিয়া। শুরুতেই একটি স্বয়ংক্রিয় স্পিচ রিকগনিশন বা শনাক্তকরণ ইঞ্জিন উচ্চারিত শব্দ বা মুখের কথাকে লেখনীতে রূপান্তর করে।

এরপর একটি ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং ইঞ্জিন মুখের কথাকে পারিপার্শ্বিকতা ও পরিস্থিতির বিবেচনায় বুঝতে চেষ্টা করে। এই ইঞ্জিনই পরবর্তী সময়ে মানুষের ভাষায় প্রতিক্রিয়া জানানোর কাজটি সম্পন্ন করে। সর্বশেষে, একটি টেক্সট-টু-স্পিচ ইঞ্জিন আক্ষরিক ডেটাকে ভাষায় রূপান্তরের মাধ্যমে প্রতিক্রিয়া জানায়। আমাদের ভয়েস প্রযুক্তির প্রতিক্রিয়া জানাতে এই ইঞ্জিনগুলো সম্মিলিতভাবে মিলিসেকেন্ড সময় নেয়।

বিভিন্ন অ্যাপ্লিকেশনের সহজ সমন্বয়

ভয়েস টেকনোলজি বিশ্বজুড়ে নানাভাবে আমাদের দৈনন্দিন জীবনে জড়িয়ে গেছে। অ্যাপল, গুগল, স্যামসাংয়ের মতো বিশ্বখ্যাত প্রতিষ্ঠানগুলোর উদ্ভাবিত ‘ভার্চ্যুয়াল অ্যাসিস্ট্যান্ট’ ভয়েস টেকনোলজির দ্বারা পরিচালিত, যা ব্যবহারকারীদের কোনো কিছু জানতে চাওয়া, কোনো তথ্য পেতে অনুরোধ করা বা চাওয়ামাত্র কোনো কাজ করানোর মতো সুবিধা দিয়ে থাকে।

ভয়েস টেকনোলজির একটি বড় সুবিধা হলো টেক্সটনির্ভর ইন্টারফেস যে সমস্যাগুলো তৈরি করে, তা দূর করতে পারা। এখানে আমাদের অ্যাপ ব্যবহার, মোবাইলের বাটন বা স্ক্রিনের বিষয়বস্তু অথবা লিখিত অংশবিশেষ সম্পর্কে বিশদ জ্ঞান থাকাটা ততটা গুরুত্বপূর্ণ না। ভয়েস প্রযুক্তিতে যা দরকার, তা হলো সঠিক শব্দ প্রয়োগ বা মৌখিক নির্দেশনা। ঝামেলাহীন এই সাধারণ বিষয়টিই পর্যটন থেকে শুরু করে ব্যাংকিং, উৎপাদন খাতসহ আরও অনেক শিল্পের বিকাশকে বেগবান করেছে, যা ভয়েস টেকনোলজির সাবলীল ব্যবহারের মাধ্যমে এ শিল্প খাতগুলোর দৈনন্দিন ব্যবহার আরও সহজ করেছে।

প্রশিক্ষণের ওপর ভিত্তি করে ভয়েস প্রযুক্তি একাধিক ভাষা বুঝে প্রতিক্রিয়া জানাতে পারে, যা ভাষাগত ব্যবধানের মধ্যে দূরত্ব কমায়। এই সক্ষমতা প্রযুক্তির সঙ্গে আমাদের সম্পর্ককে নতুন করে সংজ্ঞায়িতই করেনি, বরং ডিজিটাল স্বাক্ষরতার ব্যবধান কমাতে বিশেষ ভূমিকা রাখছে। তথ্য খুঁজতে, কোনো কিছু জানতে বা কৌতূহলের বশে তথ্যভান্ডার থেকে কোনো তথ্য খুঁজে পাওয়ার ইচ্ছাকে সহজ করার মাধ্যমে ভয়েস প্রযুক্তি আমাদের তথ্য অধিকারকে অবাধ ও সর্বজনীন করেছে।

ডিজিটাল প্রযুক্তির সামগ্রিক প্রসারের কারণে ভয়েস প্রযুক্তি আজ বিশ্বব্যাপী তথ্যভান্ডারের সঠিক বিন্যাস ও বুননে বিশেষ ভূমিকা পালন করছে। এটা শুধু ছোটখাটো সুবিধার জন্য নয়। এটি প্রযুক্তির ব্যবহার, বাধা ডিঙানো সক্ষমতায় সর্বোপরি ভৌগোলিক উৎকর্ষে, সক্ষমতা বৃদ্ধিতে নেতৃত্বের আসনে থাকবে। এখন সময় শব্দপ্রযুক্তির আধিপত্য, যা মানব জীবনধারায় এক নবযুগের সূচনা করবে। অগ্রগতির আহ্বানে ভয়েস প্রযুক্তি শুধু একটি নোট নয়, একটি মূর্ছনা, যা মুখর হতে শুরু করেছে।

ভয়েস প্রযুক্তি, ভয়েস বায়োমেট্রিকক্স বা প্রত্যেক ব্যবহারকারীকে স্বতন্ত্রভাবে শনাক্ত করার ক্ষমতা রাখে। খুচরা বাজার ও ব্যাংকিং সেক্টর মূল্য পরিশোধ ও কেনাকাটায় ডিজিটাল লেনদেনে ইতিমধ্যে এই সুবিধাটি ব্যবহার করছে। এ ছাড়া জাপান ও ইন্ডিয়ার মতো দেশগুলো একটি চলমান শিক্ষণ উপাদান ‘হিসাব ভয়েস প্রযুক্তি’ ব্যবহারের সম্ভাব্যতা নিয়ে বেশ কিছুদিন ধরে কাজ করছে। বিশ্বের বিভিন্ন দেশ বয়স্ক নাগরিকদের সেবা, স্বাস্থ্যবিষয়ক তথ্য সংরক্ষণ, জরুরি অ্যালার্ট, জনস্বার্থে প্রচারিত তথ্যের মতো বিষয়গুলোর ক্ষেত্রে ভয়েস প্রযুক্তিকে কাজে লাগানোর সুযোগ নিয়েও কাজ করে যাচ্ছে।

ভয়েস প্রযুক্তির হ্যান্ডস-ফ্রি, ডিভাইস-ফ্রি সুবিধার কারণে এটি সহজেই অত্যাবশ্যক অনেক সেবায় ব্যবহার করা যায়। প্রযুক্তিটি শিক্ষিত, শিক্ষাসুবিধা বঞ্চিতনির্বিশেষে সবার জন্য সেবা গ্রহণের অভিজ্ঞতাকে আরও সাবলীল ও স্বতঃস্ফূর্ত করে তুলেছে। জটিল কাজকে সহজভাবে করার ক্ষমতা তথ্যপ্রযুক্তিকে অন্যান্য প্রযুক্তির সঙ্গে আমাদের কর্মকাণ্ডকে নতুনভাবে রূপ দিতে পারে, এমন একটি প্রভাব বিস্তারকারী উপাদানে পরিণত করেছে। এর ফলে আমরা এগিয়ে যাচ্ছি ডিজিটাল জ্ঞানসম্পন্ন এক সমৃদ্ধ সমাজব্যবস্থার দিকে।

আরও পড়ুন

শব্দপ্রযুক্তির ক্রমবর্ধমান ব্যবহারের ফলে বিনিয়োগ বাড়ছে এর গবেষণা ও উন্নয়ন কর্মকাণ্ডে। ভেঞ্চার ক্যাপিটাল ও প্রযুক্তির সঙ্গে জড়িত প্রতিষ্ঠানগুলো এ ধরনের স্টার্টআপ কোম্পানিগুলোকে সহায়তা করছে। সিলিকন ভ্যালি, বেইজিংয়ের বৈষয়িক বিনিয়োগ কেন্দ্রগুলো এই প্রযুক্তি প্রসারে বিনিয়োগ আকর্ষণ করছে। ব্যবসায়িক প্রতিষ্ঠান ও সরকারের পারস্পরিক অংশীদারত্ব শব্দপ্রযুক্তির বিকাশকে ত্বরান্বিত করছে।

সম্প্রতি ভারত ভয়েস ব্যাংকিং এবং ইউনিভার্সাল পেমেন্ট ইন্টারফেসের মাধ্যমে ডিজিটাল অর্থ লেনদেন অনুমোদন দিয়েছে। ইনফোসিস ও জিওর মতো প্রতিষ্ঠানগুলো আর্টিফিশিয়াল শব্দপ্রযুক্তিতে অনেক বিনিয়োগ করছে। এ প্রযুক্তির সার্বিক প্রসারে আমাজন, অ্যাপল, মাইক্রোসফট আইবিএম ন্যুওয়েন্স কমিউনিকেশন ওপেনআই, বাইডু এবং অন্যান্য বৈষয়িক প্রতিষ্ঠানগুলো বিশেষ অবদান রাখছে। তাদের নিজস্ব পণ্য ও উন্নয়ন কর্মকাণ্ডে আর্টিফিশিয়াল ইন্টেলিজেন্সের প্রয়োগ সম্পর্কে তাঁরা যথেষ্ট ওয়াকিবহাল এবং এই প্রযুক্তিতে নেতৃত্ব দেওয়ার অভিপ্রায়ে মাইক্রোসফটের ১৯.৭ বিলিয়ন ডলারের ন্যুওয়েন্স এবং গুগলের ৯৮০ মিলিয়ন ডলারের এপিআই আর্টিফিশিয়াল ইন্টেলিজেন্সের অধিকরণ উদ্যোগ বিশেষভাবে উল্লেখ্য।

ভয়েস প্রযুক্তি শুধু যন্ত্রের সঙ্গে মানুষের মিথস্ক্রিয়া নয়, বরং সামাজিক অবকাঠামোর উন্নয়নেও বিশেষ ভূমিকা রাখে। আমাদের প্রতিদিনকার জীবনযাপন ও জীবন ধারণে সঠিক উৎকর্ষে সরকার ও তার পারিপার্শ্বিক প্রযুক্তিনির্ভর প্রতিষ্ঠান, গবেষণা কেন্দ্র ও স্টার্টআপগুলো বিশেষ অবদান রেখে যাচ্ছে এই উদ্ভাবন প্রযুক্তির বিকাশে। এই দৌড়ে সবাই চেষ্টা করছে প্রথম সারিতে থাকতে, সে উন্নত বা উন্নয়নশীল দেশই হোক অথবা প্রযুক্তিনির্ভর প্রতিষ্ঠান। কারণ, এই প্রযুক্তি সমাজের সবচেয়ে কম সময়ে যুগোপযোগী সেবা প্রদানে সক্ষম হবে, প্রয়োজন হবে শুধু সঠিক শব্দের ব্যবহার, দরকার হবে না ডিজিটাল স্বাক্ষরতার।

ডিজিটাল প্রযুক্তির সামগ্রিক প্রসারের কারণে ভয়েস প্রযুক্তি আজ বিশ্বব্যাপী তথ্যভান্ডারের সঠিক বিন্যাস ও বুননে বিশেষ ভূমিকা পালন করছে। এটা শুধু ছোটখাটো সুবিধার জন্য নয়। এটি প্রযুক্তির ব্যবহার, বাধা ডিঙানো সক্ষমতায় সর্বোপরি ভৌগোলিক উৎকর্ষে, সক্ষমতা বৃদ্ধিতে নেতৃত্বের আসনে থাকবে। এখন সময় শব্দপ্রযুক্তির আধিপত্য, যা মানব জীবনধারায় এক নবযুগের সূচনা করবে। অগ্রগতির আহ্বানে ভয়েস প্রযুক্তি শুধু একটি নোট নয়, একটি মূর্ছনা, যা মুখর হতে শুরু করেছে।

এ জেড এম সাঈফ প্রযুক্তি ও সমসাময়িক বৈশ্বিক ঘটনাপ্রবাহের বিশ্লেষক এবং
বিজ্ঞাপনী সংস্থা পেপার রাইমের সিইও