চ্যাটজিপিটির নির্মাতা প্রতিষ্ঠান ওপেনএআইকে চ্যালেঞ্জ জানিয়ে কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তির নতুন মডেল উন্মুক্ত করেছে টিকটকের মূল প্রতিষ্ঠান বাইটড্যান্স। প্রতিষ্ঠানটির দাবি, ‘ওমনিহিউম্যান-১’ নামের এআই মডেলটি ছবি ও অডিও ব্যবহার করে স্বয়ংক্রিয়ভাবে বাস্তবসম্মত ভিডিও তৈরি করতে পারে। এর ফলে সহজেই নিজেদের পছন্দমতো ভিডিও তৈরি করতে পারবেন টিকটক ব্যবহারকারীরা। নতুন এআই মডেলটি শিগগিরই বাণিজ্যিকভাবে ব্যবহার করা যাবে।
সম্প্রতি সাউথ চায়না মর্নিং পোস্ট এক প্রতিবেদনে জানিয়েছে, ওমনিহিউম্যান-১ মডেলটি মানুষের কথা বলা, গান গাওয়া ও শরীরের স্বাভাবিক গতিবিধি অত্যন্ত নিখুঁতভাবে ফুটিয়ে তুলতে পারে। বিদ্যমান অডিওনির্ভর ভিডিও তৈরির প্রযুক্তির তুলনায় এটি অনেক বেশি উন্নত। যদিও মডেলটি এখনো সাধারণ ব্যবহারকারীদের জন্য উন্মুক্ত করা হয়নি, তবে এর কিছু নমুনা ভিডিও ইতিমধ্যে অনলাইনে ছড়িয়ে পড়েছে। এর মধ্যে ২৩ সেকেন্ডের একটি ভিডিওতে দেখা গেছে, বিজ্ঞানী আলবার্ট আইনস্টাইন বক্তৃতা দিচ্ছেন। ভিডিওটি ইউটিউবে প্রকাশিত হয়েছে।
ওমনিহিউম্যান-১ প্রশিক্ষণের জন্য বার্তা, অডিও ও শরীরের নড়াচড়ার বৈচিত্র্যময় তথ্যভান্ডার সংযুক্ত করা হয়েছে, যা মডেলটিকে আরও নিখুঁত ও বাস্তবসম্মত করেছে। বাইটড্যান্সের প্রকাশিত একটি ভিডিওতে দেখা গেছে, এক ব্যক্তি বক্তৃতা দিচ্ছেন। তার হাতের ভঙ্গি, ঠোঁটের নড়াচড়া ও মুখাবয়বের অভিব্যক্তি এতটাই নিখুঁত যে বাস্তব ভিডিওর সঙ্গে পার্থক্য করা কঠিন।
এআইনির্ভর ভিডিও তৈরির প্রযুক্তিতে ইতিমধ্যে বড় বড় প্রতিষ্ঠানগুলো প্রতিযোগিতায় নেমেছে। গত ডিসেম্বর মাসে ওপেনএআই ‘সোরা’ নামের ভিডিও তৈরির এআই টুল উন্মুক্ত করেছে, যা কাজে লাগিয়ে সহজেই কৃত্রিম ভিডিও তৈরি করা সম্ভব। অন্যদিকে, বার্তা বা ছবি থেকে উচ্চমানের ভিডিও তৈরি করতে সক্ষম ‘ভিও’ মডেল উন্মুক্ত করেছে গুগলের ডিপমাইন্ড।
সূত্র: টাইমস অব ইন্ডিয়া