হাজার হাজার লেখকের সাহিত্যকর্ম অনুমোদন ছাড়াই ব্যবহারের মাধ্যমে প্রশিক্ষিত করা হয়েছে কৃত্রিম বুদ্ধিমত্তাভিত্তিক প্রযুক্তিগুলোকে। দ্য আটলান্টিক–এর একটি সাম্প্রতিক অনুসন্ধানে এ তথ্য উঠে এসেছে।
১ লাখ ৭০ হাজারেরও বেশি বই নিয়ে তৈরি করা হয়েছে ‘বুকসথ্রি’ নামের এমনই একটি বিশাল ডেটাসেট। এটি ব্যবহার করে তাদের কৃত্রিম বুদ্ধিমত্তাভিত্তিক মডেলগুলোকে প্রশিক্ষিত করেছে মেটা, ব্লুমবার্গসহ অন্য অনেক প্রযুক্তি কোম্পানি। ওপেন এআইয়ের তৈরি চ্যাটজিপিটি কিংবা ব্লুমবার্গ জিপিটি—এদের প্রতিটির মডেলেই ব্যবহৃত হয়েছে এই ‘বুকসথ্রি’ ডেটাসেট। এখানের বইগুলোর এক-তৃতীয়াংশ ফিকশন আর বাকি দুই-তৃতীয়াংশ নন-ফিকশন। বেশির ভাগ বই-ই প্রকাশ পেয়েছে গত দুই দশকে। লেখকদের মধ্যে আছেন স্টিফেন কিং, জেডি স্মিথ, র্যাচেল কাস্ক, মার্গারেট অ্যাটউড, হারুকি মুরাকামিসহ আরও অনেকে। অন্যদিকে প্রকাশনা সংস্থার হিসাবে পেঙ্গুইন র্যানডম হাউসের ৩০ হাজার, হার্পার কলিন্সের ১৪ হাজার, ম্যাকমিলানের ৭ হাজারসহ আরও অনেক প্রকাশনা সংস্থার বই ব্যবহৃত হয়েছে।
দেখা গেছে, বেশির ভাগ বই-ই পাইরেটেড ওয়েবসাইট থেকে সংগ্রহ করা হয়েছে। গ্রন্থস্বত্বের আইন ভেঙে নিজেদের বই এমনভাবে ব্যবহার করায় মনঃক্ষুণ্ন হয়েছেন লেখকেরা। এর প্রতিবাদে ইতিমধ্যে তাঁরা আইনি ব্যবস্থাসহ অন্যান্য উদ্যোগ নিতে শুরু করেছেন।
সূত্র: দ্য আটলান্টিক
● গ্রন্থনা: নাফিস সাদিক