কেন পুরোনো গির্জায় এক লাখ কোটি ওয়েবপেজ সংরক্ষণ করা হচ্ছে
যুক্তরাষ্ট্রের সান ফ্রান্সিসকোর প্রেসডিও থেকে সামান্য দূরে গোল্ডেন গেট ব্রিজের পাদদেশে এক জাতীয় উদ্যানের অবস্থান। তার ঠিক কাছে একটি পুরোনো গির্জার অবস্থান। পুরোনো গির্জা হলেও এখন দাঁড়িয়ে আছে ঝকঝকে সাদা ভবন হিসেবে। একসময় এটি ছিল ক্রিশ্চিয়ান সায়েন্টিস্ট চার্চের ঠিকানা। আর এখন ভবনটি ইন্টারনেট ইতিহাসের আর্কাইভ নামে পরিচিতি। এটি একটি অলাভজনক ডিজিটাল লাইব্রেরি। এখানে বেশ কয়েকজন সফটওয়্যার প্রকৌশলী ও গ্রন্থাগারিকদের একটি দল প্রায় ৩০ বছর ধরে ইন্টারনেট দুনিয়ার অনেক ওয়েবসাইটের বিভিন্ন পৃষ্ঠা সংরক্ষণের কাজ করে যাচ্ছেন।
রঙিন কাচের জানালা শোভিত উপাসনালয় ভবনের ভেতরে কান পাতলেই শোনা যায় সার্ভারের গুঞ্জন। এসব সার্ভারে ইন্টারনেট আর্কাইভের ওয়েব্যাক মেশিন বিভিন্ন ওয়েব পৃষ্ঠা সংরক্ষণ করছে। প্রতিদিন অসংখ্য মানুষ এই ওয়েব্যাক মেশিন ব্যবহার করেন। শিক্ষাবিদ থেকে শুরু করে সাংবাদিকদের জন্য বেশ গুরুত্বপূর্ণ এই মেশিন। অতীতে কে কী অনলাইনে প্রকাশ করেছে, তা এখান থেকে জানা যায়। অনেকের কাছে ওয়েব্যাক মেশিন ইন্টারনেটের একটি চলমান ইতিহাসের বই। এ বছরের অক্টোবর মাসে এক লাখ কোটি বা এক ট্রিলিয়ন পৃষ্ঠা সংরক্ষণের মাইলফলক ছুঁয়েছে ইন্টারনেট আর্কাইভ।
ওয়েবসাইট সংরক্ষণ করা আগের চেয়ে এখন আরও বেশি গুরুত্বপূর্ণ ও চ্যালেঞ্জিং। চলতি বছরের জানুয়ারি মাসে যুক্তরাষ্ট্রের হোয়াইট হাউস বিপুল পরিমাণ সরকারি ওয়েবপেজ সরিয়ে ফেলার নির্দেশ দেয়। এদিকে কৃত্রিম বুদ্ধিমত্তা বাস্তব ও কৃত্রিমভাবে তৈরি বিষয়বস্তুর মধ্যকার রেখা ঝাপসা করে দিচ্ছে। কোনো কোনো ক্ষেত্রে ওয়েবসাইট দেখার প্রয়োজনীয়তা বদলে গেছে। ইন্টারনেট দুনিয়ার বেশি অংশ এখন পেওয়ালের আড়ালে বা এআই চ্যাটবটের কথোপকথনে লুকিয়ে রয়েছে। সব কিছু কীভাবে সংরক্ষণ করা যায়, তা খুঁজে বের করার কাজ করছে ইন্টারনেট আর্কাইভ। ইন্টারনেট আর্কাইভ বিভিন্ন সংগীত, টেলিভিশন, সংবাদপত্র, ভিডিও গেম এবং বইও সংরক্ষণ করে। ইন্টারনেট প্রত্নতাত্ত্বিকেরা বিশেষ মেশিন ব্যবহার করে পৃষ্ঠা ধরে ধরে ডিজিটাইজ করে যাচ্ছেন সেখানে।
ইন্টারনেট আর্কাইভের প্রতিষ্ঠাতা ব্রুস্টার কাহলে বলেন, ‘আমরা একটি রেকর্ড রাখার চেষ্টা করছি। মানুষ যেন তা থেকে শিখতে পারে ও একটি উন্নত ভবিষ্যৎ গড়ে তুলতে পারে বা নতুন ধারণা তৈরি করতে পারে। কাহলে ১৯৯৬ সালে আর্কাইভটি তৈরি করেন। তখন এক বছরের সংরক্ষিত ওয়েবপেজ প্রায় ২ টেরাবাইটের হার্ডডিস্ক ড্রাইভে ধরে যেত। এখন আর্কাইভটি প্রতিদিন প্রায় ১৫০ টেরাবাইট বা কোটি কোটি ওয়েবপেজ সংরক্ষণ করছে।’
পুরোনো গির্জায় নিজের সদর দপ্তর স্থাপন করেন কাহলে। কাহলে বলেন, ইন্টারনেট আর্কাইভ গোটা ইন্টারনেটকে একটি লাইব্রেরি হিসেবে পরিবেশন করছে। ওয়েব্যাক মেশিনের পরিচালক মার্ক গ্রাহাম জানান, ওয়েব্যাক মেশিন শুধু ওয়েব পেজের স্ক্রিনশট নেয় না। এটি এর প্রযুক্তিগত স্থাপত্য যেমন কোডের ভাষা সংরক্ষণ করে। সার্ভার কাজ না করলেও ওয়েব্যাক মেশিন আগে ওয়েব পেজ ঠিক যেমন ছিল সেভাবে পুনরায় দেখায়। গ্রন্থাগারিক ও সফটওয়্যার প্রকৌশলীদের নিয়ে গঠিত ইন্টারনেট আর্কাইভ দল এখন প্রতিদিন খবরের ওপর ভিত্তি করে শত শত প্রশ্ন ও প্রম্পট তৈরি করে। সেই প্রশ্ন ও উত্তর উভয়ই রেকর্ড করা হচ্ছে। মানুষ চ্যাটবট থেকে কীভাবে খবর পাচ্ছে তা সংরক্ষণ করা যায়।
অগ্নিকাণ্ড বা বন্যায় সার্ভারের ক্ষতি হওয়ার আশঙ্কায় ইন্টারনেট আর্কাইভের কপি বিশ্বের বিভিন্ন স্থানে রাখা হয়। এই পদ্ধতির পেছনে রাজনৈতিক কারণও রয়েছে। ট্রাম্প প্রশাসন অপছন্দের কনটেন্টের ওপর চাপ সৃষ্টি করতে মিডিয়া কোম্পানির বিরুদ্ধে মামলা দায়ের করে বলে নানামুখী চাপ আছে। এখন আর্কাইভের বেশির ভাগ সার্ভার সান ফ্রান্সিসকোর বাইরে একটি বড় গুদামে রাখা আছে। যদিও সার্ভারের একটি অংশ প্রতীকীভাবে পুরোনো গির্জার মূল উপাসনালয়ে স্থাপন করা হয়েছে। কাহলে বলেন, ‘এই অবস্থানটি ইচ্ছাকৃতভাবে তৈরি করা হয়েছে। বিভিন্ন সার্ভার দেখে মানুষ বুঝবে আমরা সবাই মিলে আমাদের জ্ঞানের সুরক্ষা দিচ্ছি।’
এখন যুক্তরাষ্ট্রের সদর দপ্তর ইন্টারনেট আর্কাইভের প্রায় ২০০ জন কর্মী কাজ করেন। এখানে প্রত্নতাত্ত্বিকেরা বিশেষ মেশিন ব্যবহার করে বই পাতা ধরে ডিজিটাইজ করেন। সবার দেখার জন্য ইউটিউবে এসব সরাসরি সম্প্রচার করা হয়। এই ভবনে মাইক্রোফিল্ম থেকে শুরু করে সিডি ও স্যাটেলাইট টেলিভিশন পর্যন্ত যেকোনো ধরনের সামগ্রীর জন্য সব ধরনের মিডিয়া কনসোল রাখা আছে। ভবনের দারুণ একটি বিষয় হচ্ছে সেখানে তিন ফুট লম্বা ১০০টির বেশি কর্মীর মূর্তি রয়েছে। যেসব কর্মী তিন বছর ধরে কর্মরত থাকেন, তাঁদের মূর্তি স্থাপন করা হয়।
সূত্র: সিএনএন