লেখা থেকে ভিডিও তৈরির কৃত্রিম বুদ্ধিমত্তাপ্রযুক্তি আনছে ওপেনএআই

লিখিত বর্ণনা থেকে সোরার তৈরি ভিডিওর একটি দৃশ্যছবি: ওপেনএআই

কৃত্রিম বুদ্ধিমত্তার (এআই) সাহায্যে লেখা থেকে ভিডিও তৈরির প্রযুক্তি বা মডেল ‘সোরা’ আনতে কাজ করছে চ্যাটজিপিটির মূল প্রতিষ্ঠান ওপেনএআই। ওপেনএআই বলছে, লিখিত বর্ণনা দেওয়া হলে বাস্তব ঘটনা বা দৃশ্য আর কাল্পনিক দৃশ্যও তৈরি করে দেবে এআই মডেল সোরা। এক মিনিট পর্যন্ত দৈর্ঘ্যের ভিডিও তৈরি করতে পারবে সোরা।

এক ব্লগ বার্তায় ওপেনএআই জানিয়েছে, অনেক চরিত্র, বিভিন্ন ধরনের গতি, নির্দিষ্ট বিষয়বস্তু, পটভূমিসহ জটিল দৃশ্য তৈরি করতে পারবে সোরা। এ ছাড়া কোনো বস্তু পৃথিবীতে কীভাবে অবস্থান করে, সে সম্পর্কেও পুঙ্খানুপুঙ্খ ধারণা রয়েছে এই এআই মডেলের। এমনকি কোনো চরিত্রকে যথাযথভাবে ফুটিয়ে তুলতে পারার পাশাপাশি নির্দেশনায় দৃশ্যের জন্য বর্ণিত অন্য উপাদান কী কী রয়েছে, সেটিও তুলে ধরতে পারে সোরা। ছবি থেকেও এর সাহায্যে ভিডিও তৈরি করা সম্ভব। বিদ্যমান কোনো ভিডিওতে যদি কোনো ফ্রেমের ঘাটতি থাকে, সেটিও পূরণ করতে পারবে সোরা।

এক্স বার্তায় সোরার তৈরি একটি ভিডিও প্রকাশ করেছে ওপেনএআই। সেই ভিডিও তৈরির লিখিত বর্ণনারও (প্রম্পট) উল্লেখ রয়েছে পোস্টে। লিখিত বর্ণনায় তুষারে ঢাকা টোকিও শহরের কথা বলা রয়েছে। শহরে মানুষের বেশ সমাগমও রয়েছে। মানুষজন তুষার উপভোগ করছে। মলে অনেকে কেনাকাটা করছে। চেরি গাছে ফুল ফুটেছে।

তুষার পড়েছে কিছু ফুলের ওপর। এমন একটি দৃশ্যের ভিডিও তৈরির কথা বলা হয়েছে, আর ভিডিওটি এমনভাবে দেখানো হবে যাতে বোঝা যায় যে একটি ক্যামেরা শহরের রাস্তা ধরে ঘুরছে। লিখিত নির্দেশ অনুযায়ী সে রকম একটি দৃশ্যের ভিডিও তৈরি করে দিয়েছে সোরা।

সোরা নামের এআই মডেলটি এখন পরীক্ষামূলক পর্যায়ে রয়েছে। এর ঝুঁকি, অপতথ্য ও আইনগত বিষয়গুলো পর্যবেক্ষণ করা হচ্ছে। এআই মডেলটি নিয়ে মতামত দেওয়ার জন্য কয়েকজন ভিজুয়াল আর্টিস্ট, ডিজাইনার ও চলচ্চিত্র নির্মাতা মডেলটি ব্যবহারের সুযোগ পাচ্ছেন।

এর আগে কৃত্রিম বুদ্ধিমত্তা (এআই) ব্যবহার করে ভিডিও তৈরির জন্য ‘লুমিয়ের’ নামে একটি প্রোগ্রাম বানানোর কাজ চলছে বলে ঘোষণা দেয় গুগল।

সূত্র: দ্য ভার্জ