আমাদের দেশে বর্ষা মৌসুমে অনেক সময়ই বন্যা হয়। আবহাওয়া, নদ-নদীর পানির প্রবাহ, উচ্চতা, পানিনিষ্কাশনের ব্যবস্থা, বাঁধগুলোর অবস্থা—এসব উপাত্ত বা ডেটা বিশ্লেষণ করে এখন কিন্তু বন্যার পূর্বাভাস দেওয়া সম্ভব। শুধু তা–ই নয়, বন্যাকবলিত হওয়ার আগেই কোনো একটি লোকালয় থেকে মানুষ ও সহায়সম্পদ নিরাপদ স্থানে সরিয়ে নিয়ে যেতে হলেও ডেটার সঠিক ব্যবহার প্রয়োজন। কোন রাস্তা দিয়ে, কখন, কোন বাড়িঘর থেকে মানুষ সরিয়ে নিতে হবে—এ ধরনের সিদ্ধান্ত গ্রহণের জন্যও দরকার ডেটা বিশ্লেষণী মেশিন লার্নিং বা কৃত্রিম বুদ্ধিমত্তাসম্পন্ন অ্যালগরিদম।
কৃষিতে সেচের জন্য আমাদের প্রচুর পানি খরচ করতে হয়। সেচের ব্যবস্থা করতে আবার জ্বালানি বা বিদ্যুৎ খরচও আছে। ধরা যাক, আমরা কিছু রোবট তৈরি করলাম, যেগুলো কৃষিজমিতে সেচ দিতে পারে। পানি বেশি দিলে যেমন খরচ বেশি, তেমনি কম দিলেও ক্ষতি। তাহলে আমাদের দরকার মাটিতে পানির পরিমাণ, ফসলের বৃদ্ধি, আবহাওয়ার পূর্বাভাস—এ রকম অনেক ডেটার সমন্বয়ে সিদ্ধান্ত নিতে সক্ষম অ্যালগরিদম, যা রোবটগুলোকে পরিচালিত করবে।
বড় একটা টেলিকমিউনিকেশন কোম্পানি জানতে চায়, তার ব্যবহারকারীদের কী ধরনের ইন্টারনেট প্যাকেজ দিলে তারা বেশি বেশি ব্যবহার করবে এবং তাতে কোম্পানির মুনাফা বাড়বে। ফার্মাসিউটিক্যাল কোম্পানি জানতে চায়, নতুন কোন ওষুধ জীবন রক্ষাকারী হবে বা নতুন ভাইরাসের আক্রমণ থেকে রক্ষা করবে? জিন বা প্রোটিনের সিকোয়েন্স ডেটা বিশ্লেষণ করে এখন এসব প্রশ্নের উত্তর বের করা হচ্ছে। এখন একটা স্মার্টফোনের ক্যামেরা দিয়েই চীনা বা সুইডিশ ভাষায় লেখা কোনো নিবন্ধ সহজে বাংলা বা ইংরেজিতে অনুবাদ করা যাচ্ছে। অল্প কয়েকটি শব্দ বলে দিলে সেটার ওপর ভিত্তি করে আঁকা হয়ে যাচ্ছে ছবি, কিংবা লেখা হচ্ছে ই–মেইল। এই সবই সম্ভব করেছে প্রচুর ডেটা এবং সেগুলো ব্যবহার করে তৈরি করা মেশিন লার্নিং বা এআই অ্যালগরিদম। কেবল তো শুরু। ভবিষ্যতে ডেটার দিগন্ত আরও অবারিত হবে। আর সে জন্যই জানা প্রয়োজন ডেটা সায়েন্স।
ডিজিটাল প্রযুক্তির ব্যাপক প্রসারের সঙ্গে সঙ্গে বাড়ছে ডেটা বা উপাত্ত। প্রতিনিয়ত বিভিন্ন খাতে প্রচুর ডেটা তৈরি হচ্ছে। সবচেয়ে বড় উদাহরণ ই-কমার্স এবং সামাজিক যোগাযোগমাধ্যম। ব্যবসা-বাণিজ্য, কৃষি, চিকিৎসা, অর্থনীতি, ভূ-উপগ্রহ, দুর্যোগ ব্যবস্থাপনা এমনকি সরকার পরিচালনায় এসব ডেটা থেকে সঠিক উপায়ে বিশ্লেষণের মাধ্যমে সিদ্ধান্ত গ্রহণ করতে হয়। ডেটা বা উপাত্ত তৈরি করা থেকে শুরু করে সেগুলো সঠিক উপায়ে সংগ্রহ, প্রক্রিয়াজাতকরণ, সংরক্ষণ, সেখান থেকে নানা রকমের তথ্য গ্রহণ, প্রদর্শন, সিদ্ধান্ত গ্রহণের জন্য পূর্বাভাস প্রদান, ডেটাভিত্তিক সমস্যার সমাধান ও সমাধানের বাস্তবায়ন, ডেটার নিরাপত্তা ও নৈতিক দিক—এসব ডেটা সায়েন্সের আওতাভুক্ত।
ডেটা সায়েন্সের মূল বিষয়গুলোর মধ্যে আছে প্রোগ্রামিং, পরিসংখ্যান, কম্পিউটিং, মেশিন লার্নিং, ডিপ লার্নিং, এআই ইত্যাদি। তা ছাড়া বিভিন্ন প্রায়োগিক ক্ষেত্রে কাজ করার জন্যও ডেটা সায়েন্টিস্টকে তৈরি হতে হয়, কারণ কোথায় নেই এর ব্যবহার! ডেটা সায়েন্সের চাকরির বিজ্ঞাপনগুলোর দিকে তাকালেই দেখা যাবে ছোট-বড় সব প্রতিষ্ঠানেরই এখন প্রয়োজন ডেটা সায়েন্স জানা দক্ষ লোকবল। আগে যেমন কম্পিউটার বা ওয়েব ডেভেলপমেন্ট জানা লোকের প্রয়োজন ছিল অনেক বেশি। মোটের ওপর এটা ডেটা সায়েন্সেরই যুগ।
প্রশ্ন হলো, সবাই কি ডেটা সায়েন্স পড়তে পারবে? উত্তরটা হলো, প্রথমে দরকার আগ্রহ। মৌলিক কিছু জ্ঞান সব বিষয় পড়তেই লাগে, যেমন ভাষা, যুক্তি, গণিত ও বিজ্ঞান। ডেটা সায়েন্সে আজকাল এমন অনেক টুল তৈরি হয়েছে, যেগুলো চালাতে প্রোগ্রামিং জানতে হয় না, গণিতও লাগে না। আবার অল্প প্রোগ্রামিং শিখে নিতে পারলে খুব বেশি গাণিতিক জ্ঞান ছাড়াই ডেটা সায়েন্সের টুলও তৈরি করে ফেলা যায়। আর যদি গণিতের ব্যবহারিক দিকগুলো কারও ভালো লাগে, ডেটা সায়েন্স তার জন্য হবে আদর্শ জায়গা।
বাংলাদেশ এখন একটা রূপান্তর প্রক্রিয়ার মধ্য দিয়ে যাচ্ছে, ডিজিটাল বাংলাদেশ থেকে স্মার্ট বাংলাদেশ। বাইরের অনেক দেশে অনেক আগেই এ প্রক্রিয়া শুরু হয়ে গেছে। আমাদের দক্ষ মানবসম্পদ দরকার, যারা এই রূপান্তরে দেশ ও বিশ্বকে নেতৃত্ব দেবে। এ প্রক্রিয়ায় ডেটা সায়েন্সে স্নাতকেরা মুখ্য ভূমিকা রাখবেন, এতে কোনো সন্দেহ নেই।