এনক্রিপশন এড়িয়ে চ্যাটবটের সঙ্গে কথোপকথনের বিষয় শনাক্ত করতে পারে ‘হুইস্পার লিক’

আহসান হাবীব
হুইস্পার লিকের ব্যাপারে সতর্ক করেছে মাইক্রোসফট

এনক্রিপশন বা তথ্য সুরক্ষার স্তর ভেদ করে ব্যবহারকারী ও কৃত্রিম বুদ্ধিমত্তা (এআই) চ্যাটবটের কথোপকথনের বিষয় অনুমান করা সম্ভব। এমন এক নতুন সাইবার হুমকির তথ্য প্রকাশ করেছে মাইক্রোসফট। প্রতিষ্ঠানটি জানিয়েছে, এই নতুন সাইড চ্যানেল আক্রমণের নাম ‘হুইস্পার লিক’। এটি স্ট্রিমিংভিত্তিক ল্যাংগুয়েজ মডেলের এনক্রিপ্টেড ট্রাফিক বিশ্লেষণ করে কথোপকথনের বিষয় শনাক্ত করতে পারে।

মাইক্রোসফটের নিরাপত্তা গবেষকদের মতে, কোনো সাইবার হামলাকারী যদি ব্যবহারকারী ও ল্যাংগুয়েজ মডেলের মধ্যে এনক্রিপ্টেড যোগাযোগ পর্যবেক্ষণ করতে সক্ষম হয় তাহলে সে বুঝে ফেলতে পারে, ব্যবহারকারীর প্রশ্ন বা বার্তা কোনো নির্দিষ্ট সংবেদনশীল বিষয়ের সঙ্গে সম্পর্কিত কি না।

গবেষক জোনাথন বার ওর, জিওফ ম্যাকডোনাল্ড এবং মাইক্রোসফট ডিফেন্ডার নিরাপত্তা গবেষণা দল জানিয়েছে, এই আক্রমণে হামলাকারীরা এনক্রিপ্টেড টিএলএস ট্রাফিক থেকে ডেটা প্যাকেটের আকার ও প্রেরণ সময়ের ব্যবধান বিশ্লেষণ করে মেশিন লার্নিং ক্লাসিফায়ার ব্যবহার করে। এর মাধ্যমে কথোপকথনের বিষয়বস্তু সরাসরি না জেনেও অনুমান করা যায়, সেটি কোনো নির্দিষ্ট সংবেদনশীল বিষয়ের সঙ্গে সম্পর্কিত কি না। লার্জ ল্যাংগুয়েজ মডেলগুলো সাধারণত স্ট্রিমিং মোডে কাজ করে। অর্থাৎ পুরো উত্তর তৈরি না হওয়া পর্যন্ত অপেক্ষা না করে ধাপে ধাপে পাঠায়। এতে ব্যবহারকারীরা দ্রুত প্রতিক্রিয়া পান। তবে এ পদ্ধতিই এখন সাইড চ্যানেল আক্রমণের জন্য নতুন ঝুঁকির পথ তৈরি করছে।

মাইক্রোসফট জানায়, এইচটিটিপিএস এনক্রিপশন থাকা সত্ত্বেও এই আক্রমণ কার্যকর হতে পারে। সাধারণত এনক্রিপ্টেড কথোপকথনের তথ্য সুরক্ষিত রাখে এবং পরিবর্তন রোধ করে। কিন্তু হুইস্পার লিক আক্রমণে ট্রাফিকের আকার ও সময় বিশ্লেষণ করে কথোপকথনের বিষয় আন্দাজ করা যায়। যা ব্যবহারকারীর গোপনীয়তার জন্য বড় হুমকি। এর আগে গবেষকেরা ল্যাংগুয়েজ মডেলের ওপর আরও কয়েকটি সাইড-চ্যানেল আক্রমণ চালিয়েছিলেন। যেমন এনক্রিপ্টেড প্যাকেটের আকার দেখে টোকেনের দৈর্ঘ্য অনুমান করা বা ইনপুট চুরি করার চেষ্টা। হুইস্পার লিক সেই গবেষণারই সম্প্রসারিত রূপ। মাইক্রোসফটের প্রতিবেদনে বলা হয়েছে, স্ট্রিমিং মোডে মডেলের প্রতিক্রিয়া তৈরি হওয়ার সময় এনক্রিপ্টেড প্যাকেটের আকার ও আগমনের ব্যবধানের ক্রম বিশ্লেষণ করেই কথোপকথনের মূল বিষয় শনাক্ত করা সম্ভব।

এই ধারণা পরীক্ষা করতে মাইক্রোসফট একটি বাইনারি ক্লাসিফায়ার তৈরি করে। প্রম্পট কোনো নির্দিষ্ট বিষয়ের সঙ্গে সম্পর্কিত কি না, এই ক্লাসিফায়ার তা শনাক্ত করতে পারে। তারা তিনটি মেশিন লার্নিং মডেল লাইট জিবিএম, বাই-এলএটিএমও ব্যবহার করে পরীক্ষাটি চালায়।

ফলাফলে দেখা যায়, মিস্ট্রাল, ডিপসিক ও ওপেনএআইয়ের বেশ কয়েকটি মডেল ৯৮ শতাংশের বেশি নির্ভুলতা দেখিয়েছে। অর্থাৎ কোনো পর্যবেক্ষক যদি এলোমেলোভাবে চ্যাটবটের এনক্রিপ্টেড ট্রাফিক নজরদারি করে, তবু সে নির্দিষ্ট বিষয়ের কথোপকথন শনাক্ত করতে পারে। মাইক্রোসফট সতর্ক করে বলেছে, যদি কোনো সরকারি সংস্থা বা ইন্টারনেট সেবা প্রদানকারী জনপ্রিয় কোনো এআই চ্যাটবটের ট্রাফিক পর্যবেক্ষণ করে, তারা নির্ভরযোগ্যভাবে শনাক্ত করতে পারবে ব্যবহারকারী কোনো সংবেদনশীল বিষয়ে প্রশ্ন করছেন কি না। গবেষকেরা আরও জানান, সময়ের সঙ্গে আক্রমণকারীর হাতে যত বেশি প্রশিক্ষণ ডেটা জমবে, হুইস্পার লিক ততই কার্যকর হয়ে উঠবে।

বিষয়টি প্রকাশের পর ওপেনএআই, মিস্ট্রাল, মাইক্রোসফট ও এক্সএআই ইতিমধ্যে এই ঝুঁকি কমাতে প্রতিরোধমূলক ব্যবস্থা নিয়েছে। এর মধ্যে অন্যতম কার্যকর সমাধান হলো প্রতিটি উত্তরের সঙ্গে বিভিন্ন দৈর্ঘ্যের এলোমেলো টেক্সট যোগ করা, যাতে প্যাকেটের আকার বা টোকেনের দৈর্ঘ্য অনুমান করা না যায়। মাইক্রোসফট ব্যবহারকারীদের জন্যও কিছু পরামর্শ দিয়েছে। তাদের পরামর্শ, অনির্ভরযোগ্য নেটওয়ার্কে সংবেদনশীল বিষয় নিয়ে আলোচনা না করা, অতিরিক্ত সুরক্ষার জন্য ভিপিএন ব্যবহার করা, সম্ভব হলে নন-স্ট্রিমিং মডেল ব্যবহার করা এবং এমন এআই সেবা বেছে নেওয়া, যেখানে এসব সুরক্ষা ব্যবস্থা আগে থেকেই কার্যকর।

সূত্র: দ্য হ্যাকার নিউজ

