অনলাইনে ঘৃণামূলক বক্তব্য শনাক্তে হিমশিম খাচ্ছে এআই, কারণ কী

আল–জাজিরা

এক ব্যক্তির স্মার্টফোনের পর্দায় বিভিন্ন সামাজিক যোগাযোগমাধ্যম অ্যাপ দেখা যাচ্ছে। ১২ জুন, ২০২৬ছবি: এএফপি

ঘৃণামূলক বক্তব্য একসময় মূলত সরাসরি আলাপ–আলোচনায় সীমাবদ্ধ ছিল। এখন তা অজ্ঞাতপরিচয়ের অনলাইন অ্যাকাউন্ট থেকে দূরদূরান্তে ব্যাপক পরিসরে মুহূর্তেই ছড়িয়ে পড়ছে।

জাতিসংঘ ১৮ জুন ‘ঘৃণামূলক বক্তব্য প্রতিরোধ দিবস’ পালন করেছে। এ উপলক্ষে সংস্থার মহাসচিব আন্তোনিও গুতেরেস সতর্ক করে বলেছেন, সামাজিক যোগাযোগমাধ্যমগুলো এ ঝুঁকি আরও বাড়িয়ে তুলছে।

অনলাইনে ঘৃণামূলক বক্তব্য শনাক্ত ও অপসারণে এখন কৃত্রিম বুদ্ধিমত্তা (এআই) ব্যবহৃত হচ্ছে। কিন্তু মানুষের বিচারবুদ্ধির তুলনায় এসব ব্যবস্থা কোথায় কোথায় পিছিয়ে পড়ছে, তা বিশ্লেষণ করে দেখেছে আল–জাজিরা।

একই কনটেন্ট যদি দুটি সিস্টেমে ভিন্নভাবে চিহ্নিত হয়, একটিতে ঘৃণামূলক বক্তব্য হিসেবে ধরা পড়ে, অন্যটিতে পড়ে না। তাহলে তা মডারেশনের প্রক্রিয়ার গ্রহণযোগ্যতাকে দুর্বল করে দেয়।

ঘৃণামূলক বক্তব্যের সংজ্ঞা

জাতিসংঘের সংজ্ঞা অনুযায়ী, ঘৃণামূলক বক্তব্য বলতে মৌখিক, লিখিত বা আচরণগত এমন সব যোগাযোগ বোঝানো হয়, যা কোনো ব্যক্তি বা গোষ্ঠীর বিরুদ্ধে বৈষম্য সৃষ্টি করে বা সহিংসতা উসকে দেয়।

জাতিসংঘ বলছে, কোনো মানুষের বাস্তব বা ধারণাগত পরিচয়, জাতি, বর্ণ, ধর্ম, লিঙ্গ, যৌনতা বা প্রতিবন্ধকতা এ ধরনের বক্তব্যের লক্ষ্য হয়ে থাকে। এটি শুধু শব্দের মধ্যে সীমাবদ্ধ নয়; বরং তা ছবি, কার্টুন, অঙ্গভঙ্গি, এমনকি বিভিন্ন বস্তু দিয়েও প্রকাশ করা হতে পারে।

ইউনেসকো ও ইপসসের ২০২৩ সালের এক জরিপে দেখা যায়, ইন্টারনেট ব্যবহারকারীদের দুই-তৃতীয়াংশের বেশি অনলাইনে ঘৃণামূলক বক্তব্যের শিকার হয়েছেন।

অনলাইনে কত মানুষ ঘৃণামূলক বক্তব্যের শিকার

২০২৩ সালে ইপসস নামের একটি জরিপ সংস্থা ও জাতিসংঘের শিক্ষা, বিজ্ঞান ও সংস্কৃতি সংস্থা ইউনেসকো যৌথভাবে ১৬টি দেশের ৮ হাজার মানুষের ওপর একটি সমীক্ষা পরিচালনা করে। সেখানে দেখা যায়, ইন্টারনেট ব্যবহারকারীদের দুই-তৃতীয়াংশের বেশি অনলাইনে ঘৃণামূলক বক্তব্যের শিকার হয়েছেন।

জরিপে আরও দেখা যায়, উত্তরদাতাদের ৩৩ শতাংশ মনে করেন, এলজিবিটিকিউআই গোষ্ঠীর মানুষ সবচেয়ে বেশি ঘৃণামূলক বক্তব্যের শিকার হন। এরপর ২৮ শতাংশ নিয়ে দ্বিতীয় স্থানে রয়েছে জাতি ও বর্ণগত সংখ্যালঘুরা, নারীরা ১৮ শতাংশ নিয়ে রয়েছেন তৃতীয় স্থানে।

২০২৩ সালে ইপসস নামের একটি জরিপ সংস্থা ও জাতিসংঘের শিক্ষা, বিজ্ঞান ও সংস্কৃতি সংস্থা ইউনেসকো যৌথভাবে ১৬টি দেশের ৮ হাজার মানুষের ওপর এক সমীক্ষা চালায়। সেখানে দেখা যায়, ইন্টারনেট ব্যবহারকারীদের দুই-তৃতীয়াংশের বেশি অনলাইনে ঘৃণামূলক বক্তব্যের শিকার হয়েছেন

ছবি: আল–জাজিরা থেকে স্ক্রিনশট

ফেসবুকের মূল প্রতিষ্ঠান মেটা ২০২৩ সালের পর থেকে ঘৃণামূলক পোস্ট অপসারণের হার কমিয়েছে। ২০২৫ সালের শেষ প্রান্তিকে (অক্টোবর থেকে ডিসেম্বর) প্রতিষ্ঠানটি ইনস্টাগ্রাম থেকে ১৩ লাখ ও ফেসবুক থেকে ১৩ লাখ পোস্ট সরিয়েছে। ২০২৪ সালের একই সময়ে তা ছিল যথাক্রমে ৭৪ লাখ ও ৫৮ লাখ।

প্রতিষ্ঠানটি স্বয়ংক্রিয়ভাবে ঘৃণামূলক বক্তব্য শনাক্ত করার পরিবর্তে ব্যবহারকারীদের রিপোর্টের ওপর বেশি নির্ভর করতে শুরু করার পর এ পরিবর্তন এসেছে।

অন্যদিকে টিকটক জানিয়েছে, ২০২৫ সালের শেষ প্রান্তিকে তাদের সরানো ঘৃণামূলক বক্তব্য ও কনটেন্টের ৯৬ দশমিক ৩ শতাংশ ব্যবহারকারীর রিপোর্টের আগেই শনাক্ত ও অপসারণ করা হয়েছে।

পরোক্ষ বা ইঙ্গিতপূর্ণ ঘৃণামূলক বক্তব্য একটি বড় চ্যালেঞ্জ। এসব ক্ষেত্রে সাধারণত কোনো গালিগালাজ বা অপমানজনক শব্দ ব্যবহার করা হয় না বলে অনেক সময় তা ঘৃণামূলক বক্তব্য হিসেবে শনাক্ত হয় না।

আর্কাইত্জ জুবিয়াগা, লন্ডনের কুইন মেরি বিশ্ববিদ্যালয়ের সহযোগী অধ্যাপক

এআই মডেল কীভাবে ঘৃণামূলক বক্তব্য শনাক্ত করে

অনলাইনে ঘৃণামূলক বক্তব্য শনাক্ত ও প্রতিরোধে সামাজিক যোগাযোগমাধ্যমগুলো এখন বেশি হারে কৃত্রিম বুদ্ধিমত্তার (এআই) ওপর নির্ভর করছে। এ ক্ষেত্রে বিশেষ করে বৃহৎ ভাষা মডেল বা এলএলএম–ভিত্তিক কনটেন্ট নিয়ন্ত্রণব্যবস্থা ব্যবহার করা হচ্ছে, যা বিপুল পরিমাণ বার্তা স্বয়ংক্রিয়ভাবে বাছাই করে আলাদা করতে পারে।

সাধারণভাবে এসব ব্যবস্থা লেবেলযুক্ত ডেটাসেট ও পূর্বপ্রশিক্ষিত ভাষা মডেলের মাধ্যমে আপত্তিকর ভাষা শনাক্ত করে। এরপর একটি নির্দিষ্ট মান বা স্কোরের ভিত্তিতে সিদ্ধান্ত নেয়। এ স্কোরের ভিত্তিতে কোনো কনটেন্ট ঘৃণামূলক কি না বা নীতিমালা ভেঙেছে কি না, সে সিদ্ধান্ত নেওয়া হয়।

যুক্তরাষ্ট্রের পেনসিলভানিয়া বিশ্ববিদ্যালয়ের গবেষকদের ২০২৫ সালের এক গবেষণায় দেখা গেছে, এ মডেলগুলো ঘৃণামূলক বক্তব্য শনাক্ত ও শ্রেণিবিন্যাসে ব্যাপকভাবে ভিন্ন আচরণ করে। বিশেষ করে বিভিন্ন ডেমোগ্রাফিক গোষ্ঠীর ক্ষেত্রে তাদের সিদ্ধান্তে পার্থক্য দেখা যায়, যা পক্ষপাত ও অনলাইন সুরক্ষায় অসমতার উদ্বেগ তৈরি করে।

গবেষণায় ওপেনএআই, অ্যানথ্রপিক, ডিপসিক, মিস্ট্রাল ও গুগলের মতো প্রতিষ্ঠানের সাতটি এআই মডারেশন সিস্টেম বা নিয়ন্ত্রণব্যবস্থা বিশ্লেষণ করা হয়। এতে দেখা যায়, একই ধরনের ঘৃণামূলক বক্তব্যকে বিভিন্ন মডেল ভিন্নভাবে মূল্যায়ন ও স্কোর দেয়।

উদাহরণ হিসেবে বলা হয়, মিস্ট্রাল মডারেশন এন্ডপয়েন্টসহ কিছু সিস্টেম অনেক ক্ষেত্রে স্কোরকে প্রায় ১-এর কাছাকাছি রাখে। এর অর্থ, এসব সিস্টেম প্রায় সব ক্ষেত্রে কনটেন্টকে অত্যন্ত ঘৃণামূলক হিসেবে চিহ্নিত করে। অন্যদিকে ওপেনএআই মডারেশন এন্ডপয়েন্ট অনেক ক্ষেত্রে তুলনামূলকভাবে কম স্কোর দেয়। কখনো কখনো অন্যান্য মডেলের তুলনায় অর্ধেকের কম স্কোর দেয়।

গবেষকদের ভাষায়, একই কনটেন্ট যদি দুটি সিস্টেমে ভিন্নভাবে চিহ্নিত হয়—একটিতে ঘৃণামূলক বক্তব্য হিসেবে ধরা পড়ে, অন্যটিতে পড়ে না—তাহলে তা মডারেশনের প্রক্রিয়ার গ্রহণযোগ্যতাকে দুর্বল করে দেয়।

ফেসবুকের মূল প্রতিষ্ঠান মেটা ২০২৩ সালের পর থেকে ঘৃণামূলক পোস্ট অপসারণের হার কমিয়েছে।

এআই–ভিত্তিক ঘৃণামূলক বক্তব্য শনাক্তের সীমাবদ্ধতা

এআই বা এলএলএম তখনই কোনো লেখাকে ‘ঘৃণামূলক বক্তব্য’ হিসেবে খুব সহজে ধরে ফেলে, যখন সেখানে সরাসরি কোনো গালিগালাজ, আপত্তিকর শব্দ বা চেনা কোনো অপবাদ ব্যবহার করা হয়। একে বলা হয় ‘সুস্পষ্ট’ ঘৃণামূলক বক্তব্য।

কিন্তু মানুষ যখন সরাসরি কোনো খারাপ শব্দ ব্যবহার না করে, ঘুরিয়ে বা সূক্ষ্ম ও পরোক্ষভাবে কাউকে হেয় করে কথা বলে, তখন এআইয়ের পক্ষে সেই চতুরতা ধরা কঠিন হয়ে পড়ে। এ ক্ষেত্রে কোনো নির্দিষ্ট গোষ্ঠীর বিরুদ্ধে অশালীন ভাষা ব্যবহার বা গালিগালাজের কথা উল্লেখ করা যায়।

লন্ডনের কুইন মেরি বিশ্ববিদ্যালয়ের সহযোগী অধ্যাপক এবং বিশ্ববিদ্যালয়টির সোশ্যাল ডেটা সায়েন্স ল্যাবের সহপ্রধান আর্কাইত্জ জুবিয়াগা আল–জাজিরাকে বলেন, ‘পরোক্ষ বা ইঙ্গিতপূর্ণ ঘৃণামূলক বক্তব্য এক বড় চ্যালেঞ্জ। এ ক্ষেত্রে সাধারণত কোনো গালিগালাজ বা অপমানজনক শব্দ ব্যবহার করা হয় না বলে অনেক সময় তা ঘৃণামূলক বক্তব্য হিসেবে শনাক্ত হয় না।’

ওপেনএআই, অ্যানথ্রপিক, ডিপসিক, মিস্ট্রাল ও গুগলের মতো প্রতিষ্ঠানের সাতটি এআই মডারেশন সিস্টেম বা নিয়ন্ত্রণব্যবস্থা বিশ্লেষণ করা হয়। এতে দেখা যায়, একই ধরনের ঘৃণামূলক বক্তব্যকে বিভিন্ন মডেল ভিন্নভাবে মূল্যায়ন ও স্কোর দেয়।

জুবিয়াগা উদাহরণ দিয়ে বলেন, ‘ধরুন, একটি বার্তা শুরু হলো এভাবে—পৃথিবীটা কত সুন্দর হতো যদি...’। এরপর সেখানে কোনো একটি গোষ্ঠীকে হেয় বা অবমাননাকর মন্তব্য করা হলো। বার্তার প্রথম অংশ ইতিবাচক শোনালেও পরের অংশে ঘৃণা প্রকাশ পেতে পারে। কিন্তু এআই সিস্টেম অনেক সময় বার্তার ইতিবাচক দিক বেশি গুরুত্ব দেয়, ফলে ভেতরে থাকা ঘৃণার বিষয়টি ধরতে হিমশিম খায়।’

জুবিয়াগা বিপরীত একটি সমস্যার কথাও বলছেন। তিনি বলেন, এখানে ভাষার একটি বিশেষ রূপ দেখা যায়, যাকে বলে ‘রিক্লেইমড ল্যাঙ্গুয়েজ’ বা অধিকার ফিরিয়ে নেওয়া ভাষা। এর মানে হলো, অতীতের কোনো এক সময় যে শব্দগুলো কোনো অবহেলিত বা প্রান্তিক গোষ্ঠীকে অপমান ও হেয় করার জন্য গালি হিসেবে ব্যবহার করা হতো, পরে সেই গোষ্ঠীর মানুষেরাই শব্দগুলো নিজেদের আপন করে নেয় এবং নিজেদের মধ্যে সাধারণ কথাবার্তায় ব্যবহার করতে শুরু করে। ফলে এককালের অপমানসূচক শব্দগুলোই পরে তাদের নিজেদের যোগাযোগের মাধ্যম হয়ে ওঠে।

এই অধ্যাপকের মতে, ‘ভাষার এ ধরনের ব্যবহারকে ঘৃণামূলক বক্তব্য হিসেবে চিহ্নিত করা উচিত নয়। কিন্তু এআই সিস্টেমগুলো অনেক সময় এসবও ভুলভাবে ঘৃণামূলক বলে শনাক্ত করে।’

প্রথম আলোর খবর পেতে গুগল নিউজ চ্যানেল ফলো করুন

বিশ্ব থেকে আরও পড়ুন

ই-পেপার

অনলাইনে ঘৃণামূলক বক্তব্য শনাক্তে হিমশিম খাচ্ছে এআই, কারণ কী