ছবি থেকে ভিডিও তৈরির এআই মডেল তৈরি করেছে মাইক্রোসফট, তবে...
ছবির সঙ্গে অডিও ক্লিপ যুক্ত করলেই ছবিতে থাকা ব্যক্তি ঠোঁট নাড়িয়ে কথা বলবে। শুধু তা–ই নয়, কথা বলার সময় চেহারার অভিব্যক্তিও পরিবর্তন করবে। শুনতে অবাক লাগলেও কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তির মাধ্যমে ছবিতে থাকা ব্যক্তির ঠোঁট ও চেহারার অভিব্যক্তি পরিবর্তনের মাধ্যমে ভিডিও তৈরি করে দেবে মাইক্রোসফটের ‘ভ্যাসা ওয়ান’ এআই মডেল। কৃত্রিম বুদ্ধিমত্তা প্রযুক্তিনির্ভর মডেলটি কাজে লাগিয়ে যেকোনো ছবিতে থাকা ব্যক্তির মুখ দিয়ে শব্দ উচ্চারণের মাধ্যমে ভিডিও তৈরি করা যাবে।
মাইক্রোসফটের তথ্যমতে, ভার্চ্যুয়াল চরিত্রকে সহজে প্রাণবন্তভাবে উপস্থাপনের জন্য তৈরি করা হয়েছে এআই মডেলটি। ছবি ও অডিও প্রম্পট দেওয়ার পর মডেলটি স্বয়ংক্রিয়ভাবে ছোট আকারের ভিডিও তৈরি করবে, সেখানে অডিওতে থাকা বার্তা অনুযায়ী ভার্চ্যুয়াল চরিত্রের ঠোঁট নড়াচড়া করবে। এমনকি মুখ ও অঙ্গপ্রত্যঙ্গের ভঙ্গিও হবে নিখুঁত।
ভ্যাসা ওয়ান এআই মডেলের মাধ্যমে সর্বোচ্চ এক মিনিট দৈর্ঘ্যের ভিডিও তৈরি করা যাবে। ৫১২ ও ৫১২ রেজল্যুশনের ভিডিওতে বাস্তবের মতোই ছবিতে থাকা ব্যক্তি কথা বলবে। ভিডিওগুলো চাইলে বিভিন্ন সামাজিক যোগাযোগমাধ্যমে আদান-প্রদানের পাশাপাশি সংরক্ষণও করা যাবে।
নতুন এ মডেল এখনই সবার জন্য উন্মুক্ত করছে না মাইক্রোসফট। প্রতিষ্ঠানটি জানিয়েছে, এআই টুল ব্যবহার করে নকল ভিডিও বানিয়ে প্রতারণা ও গুজব তৈরি আশঙ্কা রয়েছে। ভ্যাসা ওয়ান এআই মডেলও এর বাইরে নয়। তাই এখনই মডেলটি সবার জন্য উন্মুক্ত করা হবে না। এমনকি মডেলটির কোনো পরীক্ষামূলক সংস্করণও উন্মুক্ত করা হবে না। সঠিকভাবে ব্যবহারের প্রযুক্তি তৈরির পর মডেলটি সবার জন্য উন্মুক্ত করা হবে।
সূত্র: ইন্ডিয়া টুডে