ছবিতে নিজের কণ্ঠ যুক্ত করে বানানো যাবে ভিডিও
ভার্চ্যুয়াল চরিত্রের বিভিন্ন ছবিতে কণ্ঠস্বর যুক্ত করেই বাস্তবধর্মী ভিডিও বানানো যাবে। ক্যারেক্টার ডট এআইয়ের তৈরি টকিং মেশিনস নামের এআই মডেল ব্যবহার করে এ সুযোগ মিলবে। প্রতিষ্ঠানটির দাবি, টকিং মেশিনস এআই মডেলের মাধ্যমে ভিডিওতে ব্যবহারকারীদের উচ্চারণ করা শব্দ, বিরতি ও কণ্ঠস্বরের ওঠানামার ধরন অনুযায়ী কথা বলবে বিভিন্ন ভার্চ্যুয়াল চরিত্র। কৃত্রিমভাবে তৈরি চরিত্রগুলোর মুখ, চোখ ও মাথার নড়াচড়ার ধরন বাস্তবের মতো হওয়ায় ভিডিওগুলোকে আসল বলেই মনে হবে।
এক ব্লগ বার্তায় ক্যারেক্টার ডট এআই জানিয়েছে, ব্যবহারকারীরা একটি ছবি ও কণ্ঠস্বর ইনপুট করে বিভিন্ন ধরনের ভার্চ্যুয়াল চরিত্রের রিয়েলটাইম ভিডিও তৈরি করতে পারবেন। এই মডেলের পেছনে রয়েছে ডিফিউশন ট্রান্সফরমার প্রযুক্তি। শুধু তা–ই নয়, মডেলটিতে অ্যাসিমেট্রিক নলেজ ডিসটিলেশন নামের কৌশলও ব্যবহার করা হয়েছে।
কণ্ঠস্বর শ্রুতিমধুর করতে এরই মধ্যে নিজস্ব শ্রবণ মডিউলও তৈরি করেছে ক্যারেক্টার ডট এআই। প্রতিষ্ঠানটির দাবি, এই মডেলের মাধ্যমে যত বড় ভিডিও তৈরি করা হোক না কেন, গুণগত মানে কোনো অবনতি হবে না। টকিং মেশিনস মডেলটি মানুষের চেহারাযুক্ত চরিত্র থেকে শুরু করে ত্রিমাত্রিক অবতারের (থ্রিডি অ্যাভাটার) চরিত্রও তৈরি করতে পারে।
সম্প্রতি ক্যারেক্টার ডট এআই আরও কিছু নতুন সুবিধা চালু করেছে। এর মধ্যে রয়েছে ছবি থেকে ভিডিও তৈরির প্রযুক্তি অ্যাভাটারএফএক্স, সিনস এবং স্ট্রিমস। কণ্ঠস্বরভিত্তিক যোগাযোগ আরও সহজ করতে চালু হয়েছে কল ফিচার, যার মাধ্যমে ব্যবহারকারীরা নিজেদের তৈরি চরিত্রের সঙ্গে সরাসরি কথা বলতে পারেন।
সূত্র: ইন্ডিয়ান এক্সপ্রেস