ইন্টারনেট আর্কাইভ
ইন্টারনেট আর্কাইভ

ইন্টারনেট আর্কাইভের ওয়েব্যাক মেশিন ব্লকের মুখে

প্রায় তিন দশক ধরে ইন্টারনেট আর্কাইভের ওয়েব্যাক মেশিন ডিজিটাল জগতের এক নির্ভরযোগ্য ভান্ডার হিসেবে কাজ করে আসছে। ইন্টারনেটের বিলুপ্ত বা পরিবর্তিত পাতাগুলো সংরক্ষণ করার মাধ্যমে এটি সাংবাদিক, ইতিহাসবিদ, গবেষক, এমনকি আদালতের কাছেও এক অপরিহার্য সম্পদে পরিণত হয়েছে। ২০২৫ সালের অক্টোবর পর্যন্ত এই মেশিনে ১ ট্রিলিয়নের (১ লাখ কোটি) বেশি ওয়েব পেজ সংরক্ষিত ছিল।

সম্প্রতি প্রযুক্তি ও কৃত্রিম বুদ্ধিমত্তাসংক্রান্ত স্টার্টআপ অরিজিনালিটি এআইয়ের এক বিশ্লেষণে দেখা গেছে, বিশ্বের ২৩টি বড় সংবাদমাধ্যম বর্তমানে ইন্টারনেট আর্কাইভের ওয়েব ক্রলার ব্লক করে দিয়েছে। তবে প্রকৃত চিত্র আরও ভয়াবহ। বিশ্বের ৯টি দেশের অন্তত ২৪১টি সংবাদমাধ্যম এখন ইন্টারনেট আর্কাইভের চারটির মধ্যে অন্তত একটি ক্রলার বটকে তাদের সাইটে প্রবেশ করতে বাধা দিচ্ছে। এই নিষেধাজ্ঞার সবচেয়ে বড় অংশ এসেছে যুক্তরাষ্ট্রের সবচেয়ে বড় সংবাদপত্র গোষ্ঠী ইউএসএ টুডে থেকে। প্রতিষ্ঠানটি ২০০টির বেশি মিডিয়া আউটলেট পরিচালনা করে। তারা সম্মিলিতভাবে আর্কাইভের বটকে ব্লক করেছে।

দ্য নিউইয়র্ক টাইমস আরও একধাপ এগিয়ে হার্ড ব্লকিং ব্যবস্থা গ্রহণ করেছে। এ ছাড়া জনপ্রিয় প্ল্যাটফর্ম রেডিট এবং ব্রিটিশ সংবাদমাধ্যম দ্য গার্ডিয়ানও একই পথে হাঁটছে। তবে দ্য গার্ডিয়ান কিছুটা ভিন্ন কৌশল অবলম্বন করেছে। তারা কেবল তাদের প্রকাশিত সংবাদ বা নিবন্ধগুলো আর্কাইভে জমা হওয়া বন্ধ করেছে, যাতে কোনো এআই প্রতিষ্ঠান এই আর্কাইভ ব্যবহার করে তাদের আধেয় বা কনটেন্ট চুরি করতে না পারে। তবে তাদের আঞ্চলিক হোমপেজ বা বিষয়ভিত্তিক পাতাগুলো এখনো ওয়েব্যাক মেশিনে দেখা যাচ্ছে।

বিভিন্ন সংবাদমাধ্যমের দাবি, তাদের এই লড়াই ইন্টারনেট আর্কাইভের বিরুদ্ধে নয়। অনিয়ন্ত্রিত বট এবং কৃত্রিম বুদ্ধিমত্তার বিরুদ্ধে কাজ করছে বিভিন্ন সংবাদমাধ্যম। এ বিষয়ে ইউএসএ টুডের মুখপাত্র লার্ক-মেরি অ্যান্টন জানান, এটি কোনো নির্দিষ্ট প্রতিষ্ঠানকে ব্লক করার বিষয় নয়। আধেয়গুলো যেন কোনো বট অনুমতি ছাড়া সংগ্রহ করতে না পারে, তার জন্য এ কাজ করা হয়েছে। নিউইয়র্ক টাইমসের মুখপাত্র গ্রাহাম জেমস বলেন, ‘ইন্টারনেট আর্কাইভে থাকা আমাদের আধেয় মেধাস্বত্ব আইন লঙ্ঘন করে ব্যবহার করছে এআই প্রতিষ্ঠানগুলো, যা সরাসরি আমাদের ব্যবসায়িক স্বার্থের সঙ্গে সাংঘর্ষিক।’

জনপ্রিয় সামাজিক যোগাযোগমাধ্যম রেডিটও একই যুক্তি দিয়েছে। তারা চায় না ওয়েব্যাক মেশিন এমন একটি পেছনের দরজা হিসেবে ব্যবহৃত হোক, যেখান থেকে এআই প্রতিষ্ঠান বিনা মূল্যে তথ্য সংগ্রহ করবে, যার জন্য রেডিট অর্থের বিনিময়ে লাইসেন্স করেছে।

২০২৩ সালে ওয়াশিংটন পোস্টের এক বিশ্লেষণে দেখা গেছে, গুগল ও মেটা নিজেদের এআই মডেলকে প্রশিক্ষণ দেওয়ার জন্য ইন্টারনেট আর্কাইভের ডেটাসেট ব্যবহার করেছে। এ ছাড়া ২০২৫ সালের মে মাসে একটি এআই প্রতিষ্ঠান প্রতি সেকেন্ডে হাজার হাজার অনুরোধ পাঠিয়ে আর্কাইভটির সার্ভার অচল করে দিয়েছিল।

সংবাদমাধ্যমের মালিকদের এই সিদ্ধান্তের কড়া সমালোচনা করছেন একাধিক সাংবাদিক। ফাইট ফর দ্য ফিউচার এবং ইলেকট্রনিক ফ্রন্টিয়ার ফাউন্ডেশন একটি খোলাচিঠি তৈরি করেছে, যেখানে শতাধিক সাংবাদিক সই করেছেন। স্বাক্ষরকারীদের মধ্যে বিখ্যাত টিভি উপস্থাপক র‍্যাচেল ম্যাডো ও সাংবাদিক টেলর লরেঞ্জও রয়েছেন। চিঠিতে বলা হয়েছে, আগের প্রজন্মের সাংবাদিকেরা ইতিহাসের সূত্র খুঁজতে লাইব্রেরি বা পত্রিকার পুরোনো ফিজিক্যাল আর্কাইভের ওপর নির্ভর করতেন। বর্তমানে অনেক পত্রিকা বন্ধ হয়ে যাচ্ছে এবং ডিজিটাল আধেয় সংরক্ষণের কোনো স্থায়ী সরকারি ব্যবস্থা নেই। এ অবস্থায় সাংবাদিকতার ইতিহাস রক্ষার দায়িত্ব মূলত ইন্টারনেট আর্কাইভের কাঁধেই বর্তায়।

ওয়েব্যাক মেশিনের পরিচালক মার্ক গ্রাহাম জানিয়েছেন, সংবাদমাধ্যম তাদের গবেষণা করতে পারছে, কারণ ওয়েব্যাক মেশিনের অস্তিত্ব আছে। অথচ একই সঙ্গে তারা আমাদের ব্লক করছে। এটি মুক্ত ইন্টারনেটের ধারণাকে সংকুচিত করছে। ২০১৬ সালে নিউইয়র্ক টাইমস বার্নি স্যান্ডার্সকে নিয়ে লেখা একটি প্রতিবেদন পরিবর্তন করা হয়, যা কেবল ওয়েব্যাক মেশিনের মাধ্যমেই ধরা পড়েছিল। এ ধরনের সম্পাদকীর স্বচ্ছতা ও জবাবদিহি এখন হুমকির মুখে।

যদি বড় বড় সংবাদমাধ্যম এভাবেই নিজেদের ইতিহাস লক করে দেয়, তবে কোনো তথ্যের সত্যতা যাচাই বা অতীতের প্রেক্ষাপট খুঁজে বের করা প্রায় অসম্ভব হয়ে পড়বে বলে ধারণা করা হচ্ছে।

সূত্র: ফোর্বস