অনলাইনে ঘৃণামূলক বক্তব্য শনাক্তে হিমশিম খাচ্ছে এআই, কারণ কী
ঘৃণামূলক বক্তব্য একসময় মূলত সরাসরি আলাপ–আলোচনায় সীমাবদ্ধ ছিল। এখন তা অজ্ঞাতপরিচয়ের অনলাইন অ্যাকাউন্ট থেকে দূরদূরান্তে ব্যাপক পরিসরে মুহূর্তেই ছড়িয়ে পড়ছে।
জাতিসংঘ ১৮ জুন ‘ঘৃণামূলক বক্তব্য প্রতিরোধ দিবস’ পালন করেছে। এ উপলক্ষে সংস্থার মহাসচিব আন্তোনিও গুতেরেস সতর্ক করে বলেছেন, সামাজিক যোগাযোগমাধ্যমগুলো এ ঝুঁকি আরও বাড়িয়ে তুলছে।
অনলাইনে ঘৃণামূলক বক্তব্য শনাক্ত ও অপসারণে এখন কৃত্রিম বুদ্ধিমত্তা (এআই) ব্যবহৃত হচ্ছে। কিন্তু মানুষের বিচারবুদ্ধির তুলনায় এসব ব্যবস্থা কোথায় কোথায় পিছিয়ে পড়ছে, তা বিশ্লেষণ করে দেখেছে আল–জাজিরা।
একই কনটেন্ট যদি দুটি সিস্টেমে ভিন্নভাবে চিহ্নিত হয়, একটিতে ঘৃণামূলক বক্তব্য হিসেবে ধরা পড়ে, অন্যটিতে পড়ে না। তাহলে তা মডারেশনের প্রক্রিয়ার গ্রহণযোগ্যতাকে দুর্বল করে দেয়।
ঘৃণামূলক বক্তব্যের সংজ্ঞা
জাতিসংঘের সংজ্ঞা অনুযায়ী, ঘৃণামূলক বক্তব্য বলতে মৌখিক, লিখিত বা আচরণগত এমন সব যোগাযোগ বোঝানো হয়, যা কোনো ব্যক্তি বা গোষ্ঠীর বিরুদ্ধে বৈষম্য সৃষ্টি করে বা সহিংসতা উসকে দেয়।
জাতিসংঘ বলছে, কোনো মানুষের বাস্তব বা ধারণাগত পরিচয়, জাতি, বর্ণ, ধর্ম, লিঙ্গ, যৌনতা বা প্রতিবন্ধকতা এ ধরনের বক্তব্যের লক্ষ্য হয়ে থাকে। এটি শুধু শব্দের মধ্যে সীমাবদ্ধ নয়; বরং তা ছবি, কার্টুন, অঙ্গভঙ্গি, এমনকি বিভিন্ন বস্তু দিয়েও প্রকাশ করা হতে পারে।
ইউনেসকো ও ইপসসের ২০২৩ সালের এক জরিপে দেখা যায়, ইন্টারনেট ব্যবহারকারীদের দুই-তৃতীয়াংশের বেশি অনলাইনে ঘৃণামূলক বক্তব্যের শিকার হয়েছেন।
অনলাইনে কত মানুষ ঘৃণামূলক বক্তব্যের শিকার
২০২৩ সালে ইপসস নামের একটি জরিপ সংস্থা ও জাতিসংঘের শিক্ষা, বিজ্ঞান ও সংস্কৃতি সংস্থা ইউনেসকো যৌথভাবে ১৬টি দেশের ৮ হাজার মানুষের ওপর একটি সমীক্ষা পরিচালনা করে। সেখানে দেখা যায়, ইন্টারনেট ব্যবহারকারীদের দুই-তৃতীয়াংশের বেশি অনলাইনে ঘৃণামূলক বক্তব্যের শিকার হয়েছেন।
জরিপে আরও দেখা যায়, উত্তরদাতাদের ৩৩ শতাংশ মনে করেন, এলজিবিটিকিউআই গোষ্ঠীর মানুষ সবচেয়ে বেশি ঘৃণামূলক বক্তব্যের শিকার হন। এরপর ২৮ শতাংশ নিয়ে দ্বিতীয় স্থানে রয়েছে জাতি ও বর্ণগত সংখ্যালঘুরা, নারীরা ১৮ শতাংশ নিয়ে রয়েছেন তৃতীয় স্থানে।
ফেসবুকের মূল প্রতিষ্ঠান মেটা ২০২৩ সালের পর থেকে ঘৃণামূলক পোস্ট অপসারণের হার কমিয়েছে। ২০২৫ সালের শেষ প্রান্তিকে (অক্টোবর থেকে ডিসেম্বর) প্রতিষ্ঠানটি ইনস্টাগ্রাম থেকে ১৩ লাখ ও ফেসবুক থেকে ১৩ লাখ পোস্ট সরিয়েছে। ২০২৪ সালের একই সময়ে তা ছিল যথাক্রমে ৭৪ লাখ ও ৫৮ লাখ।
প্রতিষ্ঠানটি স্বয়ংক্রিয়ভাবে ঘৃণামূলক বক্তব্য শনাক্ত করার পরিবর্তে ব্যবহারকারীদের রিপোর্টের ওপর বেশি নির্ভর করতে শুরু করার পর এ পরিবর্তন এসেছে।
অন্যদিকে টিকটক জানিয়েছে, ২০২৫ সালের শেষ প্রান্তিকে তাদের সরানো ঘৃণামূলক বক্তব্য ও কনটেন্টের ৯৬ দশমিক ৩ শতাংশ ব্যবহারকারীর রিপোর্টের আগেই শনাক্ত ও অপসারণ করা হয়েছে।
পরোক্ষ বা ইঙ্গিতপূর্ণ ঘৃণামূলক বক্তব্য একটি বড় চ্যালেঞ্জ। এসব ক্ষেত্রে সাধারণত কোনো গালিগালাজ বা অপমানজনক শব্দ ব্যবহার করা হয় না বলে অনেক সময় তা ঘৃণামূলক বক্তব্য হিসেবে শনাক্ত হয় না।
এআই মডেল কীভাবে ঘৃণামূলক বক্তব্য শনাক্ত করে
অনলাইনে ঘৃণামূলক বক্তব্য শনাক্ত ও প্রতিরোধে সামাজিক যোগাযোগমাধ্যমগুলো এখন বেশি হারে কৃত্রিম বুদ্ধিমত্তার (এআই) ওপর নির্ভর করছে। এ ক্ষেত্রে বিশেষ করে বৃহৎ ভাষা মডেল বা এলএলএম–ভিত্তিক কনটেন্ট নিয়ন্ত্রণব্যবস্থা ব্যবহার করা হচ্ছে, যা বিপুল পরিমাণ বার্তা স্বয়ংক্রিয়ভাবে বাছাই করে আলাদা করতে পারে।
সাধারণভাবে এসব ব্যবস্থা লেবেলযুক্ত ডেটাসেট ও পূর্বপ্রশিক্ষিত ভাষা মডেলের মাধ্যমে আপত্তিকর ভাষা শনাক্ত করে। এরপর একটি নির্দিষ্ট মান বা স্কোরের ভিত্তিতে সিদ্ধান্ত নেয়। এ স্কোরের ভিত্তিতে কোনো কনটেন্ট ঘৃণামূলক কি না বা নীতিমালা ভেঙেছে কি না, সে সিদ্ধান্ত নেওয়া হয়।
যুক্তরাষ্ট্রের পেনসিলভানিয়া বিশ্ববিদ্যালয়ের গবেষকদের ২০২৫ সালের এক গবেষণায় দেখা গেছে, এ মডেলগুলো ঘৃণামূলক বক্তব্য শনাক্ত ও শ্রেণিবিন্যাসে ব্যাপকভাবে ভিন্ন আচরণ করে। বিশেষ করে বিভিন্ন ডেমোগ্রাফিক গোষ্ঠীর ক্ষেত্রে তাদের সিদ্ধান্তে পার্থক্য দেখা যায়, যা পক্ষপাত ও অনলাইন সুরক্ষায় অসমতার উদ্বেগ তৈরি করে।
গবেষণায় ওপেনএআই, অ্যানথ্রপিক, ডিপসিক, মিস্ট্রাল ও গুগলের মতো প্রতিষ্ঠানের সাতটি এআই মডারেশন সিস্টেম বা নিয়ন্ত্রণব্যবস্থা বিশ্লেষণ করা হয়। এতে দেখা যায়, একই ধরনের ঘৃণামূলক বক্তব্যকে বিভিন্ন মডেল ভিন্নভাবে মূল্যায়ন ও স্কোর দেয়।
উদাহরণ হিসেবে বলা হয়, মিস্ট্রাল মডারেশন এন্ডপয়েন্টসহ কিছু সিস্টেম অনেক ক্ষেত্রে স্কোরকে প্রায় ১-এর কাছাকাছি রাখে। এর অর্থ, এসব সিস্টেম প্রায় সব ক্ষেত্রে কনটেন্টকে অত্যন্ত ঘৃণামূলক হিসেবে চিহ্নিত করে। অন্যদিকে ওপেনএআই মডারেশন এন্ডপয়েন্ট অনেক ক্ষেত্রে তুলনামূলকভাবে কম স্কোর দেয়। কখনো কখনো অন্যান্য মডেলের তুলনায় অর্ধেকের কম স্কোর দেয়।
গবেষকদের ভাষায়, একই কনটেন্ট যদি দুটি সিস্টেমে ভিন্নভাবে চিহ্নিত হয়—একটিতে ঘৃণামূলক বক্তব্য হিসেবে ধরা পড়ে, অন্যটিতে পড়ে না—তাহলে তা মডারেশনের প্রক্রিয়ার গ্রহণযোগ্যতাকে দুর্বল করে দেয়।
ফেসবুকের মূল প্রতিষ্ঠান মেটা ২০২৩ সালের পর থেকে ঘৃণামূলক পোস্ট অপসারণের হার কমিয়েছে।
এআই–ভিত্তিক ঘৃণামূলক বক্তব্য শনাক্তের সীমাবদ্ধতা
এআই বা এলএলএম তখনই কোনো লেখাকে ‘ঘৃণামূলক বক্তব্য’ হিসেবে খুব সহজে ধরে ফেলে, যখন সেখানে সরাসরি কোনো গালিগালাজ, আপত্তিকর শব্দ বা চেনা কোনো অপবাদ ব্যবহার করা হয়। একে বলা হয় ‘সুস্পষ্ট’ ঘৃণামূলক বক্তব্য।
কিন্তু মানুষ যখন সরাসরি কোনো খারাপ শব্দ ব্যবহার না করে, ঘুরিয়ে বা সূক্ষ্ম ও পরোক্ষভাবে কাউকে হেয় করে কথা বলে, তখন এআইয়ের পক্ষে সেই চতুরতা ধরা কঠিন হয়ে পড়ে। এ ক্ষেত্রে কোনো নির্দিষ্ট গোষ্ঠীর বিরুদ্ধে অশালীন ভাষা ব্যবহার বা গালিগালাজের কথা উল্লেখ করা যায়।
লন্ডনের কুইন মেরি বিশ্ববিদ্যালয়ের সহযোগী অধ্যাপক এবং বিশ্ববিদ্যালয়টির সোশ্যাল ডেটা সায়েন্স ল্যাবের সহপ্রধান আর্কাইত্জ জুবিয়াগা আল–জাজিরাকে বলেন, ‘পরোক্ষ বা ইঙ্গিতপূর্ণ ঘৃণামূলক বক্তব্য এক বড় চ্যালেঞ্জ। এ ক্ষেত্রে সাধারণত কোনো গালিগালাজ বা অপমানজনক শব্দ ব্যবহার করা হয় না বলে অনেক সময় তা ঘৃণামূলক বক্তব্য হিসেবে শনাক্ত হয় না।’
ওপেনএআই, অ্যানথ্রপিক, ডিপসিক, মিস্ট্রাল ও গুগলের মতো প্রতিষ্ঠানের সাতটি এআই মডারেশন সিস্টেম বা নিয়ন্ত্রণব্যবস্থা বিশ্লেষণ করা হয়। এতে দেখা যায়, একই ধরনের ঘৃণামূলক বক্তব্যকে বিভিন্ন মডেল ভিন্নভাবে মূল্যায়ন ও স্কোর দেয়।
জুবিয়াগা উদাহরণ দিয়ে বলেন, ‘ধরুন, একটি বার্তা শুরু হলো এভাবে—পৃথিবীটা কত সুন্দর হতো যদি...’। এরপর সেখানে কোনো একটি গোষ্ঠীকে হেয় বা অবমাননাকর মন্তব্য করা হলো। বার্তার প্রথম অংশ ইতিবাচক শোনালেও পরের অংশে ঘৃণা প্রকাশ পেতে পারে। কিন্তু এআই সিস্টেম অনেক সময় বার্তার ইতিবাচক দিক বেশি গুরুত্ব দেয়, ফলে ভেতরে থাকা ঘৃণার বিষয়টি ধরতে হিমশিম খায়।’
জুবিয়াগা বিপরীত একটি সমস্যার কথাও বলছেন। তিনি বলেন, এখানে ভাষার একটি বিশেষ রূপ দেখা যায়, যাকে বলে ‘রিক্লেইমড ল্যাঙ্গুয়েজ’ বা অধিকার ফিরিয়ে নেওয়া ভাষা। এর মানে হলো, অতীতের কোনো এক সময় যে শব্দগুলো কোনো অবহেলিত বা প্রান্তিক গোষ্ঠীকে অপমান ও হেয় করার জন্য গালি হিসেবে ব্যবহার করা হতো, পরে সেই গোষ্ঠীর মানুষেরাই শব্দগুলো নিজেদের আপন করে নেয় এবং নিজেদের মধ্যে সাধারণ কথাবার্তায় ব্যবহার করতে শুরু করে। ফলে এককালের অপমানসূচক শব্দগুলোই পরে তাদের নিজেদের যোগাযোগের মাধ্যম হয়ে ওঠে।
এই অধ্যাপকের মতে, ‘ভাষার এ ধরনের ব্যবহারকে ঘৃণামূলক বক্তব্য হিসেবে চিহ্নিত করা উচিত নয়। কিন্তু এআই সিস্টেমগুলো অনেক সময় এসবও ভুলভাবে ঘৃণামূলক বলে শনাক্ত করে।’