হাজার হাজার লেখকের সাহিত্যকর্ম অনুমোদন ছাড়াই ব্যবহারের মাধ্যমে প্রশিক্ষিত করা হয়েছে কৃত্রিম বুদ্ধিমত্তাভিত্তিক প্রযুক্তিগুলোকে। দ্য আটলান্টিক–এর একটি সাম্প্রতিক অনুসন্ধানে এ তথ্য উঠে এসেছে।

১ লাখ ৭০ হাজারেরও বেশি বই নিয়ে তৈরি করা হয়েছে ‘বুকসথ্রি’ নামের এমনই একটি বিশাল ডেটাসেট। এটি ব্যবহার করে তাদের কৃত্রিম বুদ্ধিমত্তাভিত্তিক মডেলগুলোকে প্রশিক্ষিত করেছে মেটা, ব্লুমবার্গসহ অন্য অনেক প্রযুক্তি কোম্পানি। ওপেন এআইয়ের তৈরি চ্যাটজিপিটি কিংবা ব্লুমবার্গ জিপিটি—এদের প্রতিটির মডেলেই ব্যবহৃত হয়েছে এই ‘বুকসথ্রি’ ডেটাসেট। এখানের বইগুলোর এক-তৃতীয়াংশ ফিকশন আর বাকি দুই-তৃতীয়াংশ নন-ফিকশন। বেশির ভাগ বই-ই প্রকাশ পেয়েছে গত দুই দশকে। লেখকদের মধ্যে আছেন স্টিফেন কিং, জেডি স্মিথ, র‌্যাচেল কাস্ক, মার্গারেট অ্যাটউড, হারুকি মুরাকামিসহ আরও অনেকে। অন্যদিকে প্রকাশনা সংস্থার হিসাবে পেঙ্গুইন র‌্যানডম হাউসের ৩০ হাজার, হার্পার কলিন্সের ১৪ হাজার, ম্যাকমিলানের ৭ হাজারসহ আরও অনেক প্রকাশনা সংস্থার বই ব্যবহৃত হয়েছে। 

দেখা গেছে, বেশির ভাগ বই-ই পাইরেটেড ওয়েবসাইট থেকে সংগ্রহ করা হয়েছে। গ্রন্থস্বত্বের আইন ভেঙে নিজেদের বই এমনভাবে ব্যবহার করায় মনঃক্ষুণ্ন হয়েছেন লেখকেরা। এর প্রতিবাদে ইতিমধ্যে তাঁরা আইনি ব্যবস্থাসহ অন্যান্য উদ্যোগ নিতে শুরু করেছেন।

সূত্র: দ্য আটলান্টিক

● গ্রন্থনা: নাফিস সাদিক