ছবি বিশ্লেষণ সহজ করতে গবেষকদের জন্য মেটার নতুন এআই টুল

এআইভিত্তিক এই টুল ছবিকে বিভিন্ন অংশে ভাগ করতে পারে
ছবি: মেটা এআই

ছবি সম্পাদনা, নজরদারি ফুটেজ বিশ্লেষণ এবং ছবির বিভিন্ন অংশ বোঝা—এসব কাজের মধ্যে একটি মিল হলো আপনাকে একটি ছবির মধ্যে বিভিন্ন বস্তু শনাক্ত এবং আলাদা করা জানতে হবে। সাধারণত, যখন কোনো ছবির একটি অংশ গবেষকেরা বিশ্লেষণ করেন, তখন তাঁদের স্ক্র্যাচ থেকে শুরু করতে হয়।

এ প্রক্রিয়া কিছুটা শ্রমসাধ্য। তাই এ ধরনের সমস্যা নিয়ে কাজ করা গবেষক ও ওয়েবসাইট নির্মাতাদের জন্য সে প্রক্রিয়ার পরিবর্তে এক জায়গায় বহুমাত্রিক সুবিধা পাওয়া যাবে—এমন একটি টুল আনছে মেটা। গত বুধবার মেটা ‘সেগমেন্ট এনিথিং মডেল’ বা ‘এসএএম’ নামে একটি কৃত্রিম বুদ্ধিমত্তা (এআই) মডেল প্রকাশ করেছে। এর মাধ্যমে ব্যবহারকারীরা একটি বিন্দুতে চেপে বা বস্তুর চারপাশে একটি বাক্স এঁকে ছবির যেকোনো ধরনের ‘কাটআউট’ বা বিভিন্ন অংশে ভাগ (সেগমেন্ট) করতে পারবেন। টুলটির উদ্দেশ্য সৃজনশীল সম্পাদনা বা গবেষণায় ব্যবহার। এ ছাড়া ভার্চ্যুয়াল রিয়েলিটি (ভিআর) হেডসেটে ছবির বিভিন্ন অংশ স্পষ্ট করে দেখতেও এটি ব্যবহার করা যাবে।  

ব্যবহারকারীদের জন্য ব্রাউজারভিত্তিক চালু করা এ টুল মেটা নিজেদের কম্পিউটার ভিশন মডেলে ওপেন সোর্স করেছে। মেটা দাবি করছে, টুলটি একটি ছবির বিভাজিত অংশের ১১০ কোটি ডেটাসেটের ওপর প্রশিক্ষিত এবং একটি বড় প্রতিষ্ঠান থেকে ১ কোটি ১০ লাখ ছবি ব্যবহারের অনুমোদন নিয়েছে। তবে কোন প্রতিষ্ঠান থেকে এসব ছবির অনুমোদন নেওয়া হয়েছে, মেটা তা প্রকাশ করেনি।

মেটার এআই গবেষণা শাখা মেটা এআই ওই তথ্যভান্ডার তৈরি করতে কেনিয়ার ১৩০ জন বিশেষজ্ঞ নিয়ে কাজ করে, যা লাখ লাখ ছবির ১০০ কোটি অংশের ম্যানুয়াল এবং স্বয়ংক্রিয় লেবেলিংয়ের সংমিশ্রণে তৈরি করা হয়।

বেশ কয়েক বছর ধরেই ছবি ও ভিডিওতে বিভিন্ন বস্তু শনাক্তে কম্পিউটার ভিশন প্রযুক্তি ব্যবহৃত হচ্ছে। এরই মধ্যে এই প্রযুক্তি নজরদারি ক্যামেরা এবং ড্রোনের মতো যন্ত্রে যুক্তও হয়েছে। এআইভিত্তিক চ্যাটবট আসার পর মেটার এআই গবেষকদের উদ্দেশ্য হলো এআইয়ের মৌলিক মডেলগুলোর অগ্রগতিকে কম্পিউটার ভিশন প্রযুক্তিতে যুক্ত করা।

এ ব্যাপারে সার্চ ইঞ্জিন প্রতিষ্ঠান ফিসনার প্রতিষ্ঠাতা ও প্রধান নির্বাহী কর্মকর্তা পল পাওয়ার বলেন, ‘এটি প্রযুক্তির নতুন একটি ক্ষেত্র তা বলব না। ছবি বা ভিডিওকে বিভিন্ন অংশে বিভাজনের পদ্ধতি বিদ্যমান, তাই এটি নতুন ক্ষমতা তা বলা যাবে না। তবে মেটার মৌলিক মডেলগুলো ব্যবহার করার পদ্ধতি নতুন এবং তারা যে তথ্যভান্ডারের ওপর প্রশিক্ষণ নিচ্ছে, তার আকার বৃহৎ বলে আমি মনে করি।’

ইনস্টাগ্রাম ও ফেসবুকজুড়ে বিজ্ঞাপনে স্বয়ংক্রিয়ভাবে উত্তর দিকে সক্ষম এআই ব্যবহারের পরিকল্পনার পাশাপাশিই নতুন এই টুলের ঘোষণাও দিল মেটা। এর আগে গত ফেব্রুয়ারিতে কৃত্রিম বুদ্ধিমত্তা প্রযুক্তিনির্ভর বিভিন্ন সুবিধা চালুর জন্য নতুন একটি দল গঠনের ঘোষণা দেন মেটার প্রধান নির্বাহী কর্মকর্তা মার্ক জাকারবার্গ।

সে সময় মার্ক জাকারবার্গ জানিয়েছিলেন, ইনস্টাগ্রামের ফিল্টারসহ ফেসবুক, হোয়াটসঅ্যাপ ও মেসেঞ্জারে কৃত্রিম বুদ্ধিমত্তা প্রযুক্তিনির্ভর চ্যাটবট যুক্তের জন্য কাজ করছে মেটা। জাকারবার্গ এখন দিনের বেশির ভাগ সময় ওই দলের সঙ্গে কাটান।

সূত্র: ফোর্বস