এখনো অনেক পথ বাকি, বলছেন ‘গডমাদার অব এআই’

ফেই ফেই লি-কে বলা হয় ‘গডমাদার অব এআই’। তিনি একজন চীনা-মার্কিন কম্পিউটারবিজ্ঞানী। টাইম ম্যাগাজিন এ বছর যাঁদের ‘বর্ষসেরা ব্যক্তিত্ব’ হিসেবে তুলে ধরেছে, তাঁদের মধ্যে স্ট্যানফোর্ডের এই শিক্ষকও আছেন। পড়ুন টাইম ডটকমে লেখা তাঁর একটি নিবন্ধের অনুবাদ।

মো. সাইফুল্লাহ
চীনা-মার্কিন কম্পিউটারবিজ্ঞানী ফেই ফেই লি
ছবি: উইকিমিডিয়া কমনস

১৯৫০ সাল। তখন ‘কম্পিউটিং’ বলতে মূলত স্বয়ংক্রিয় গণনা আর সহজ যুক্তির খেলাকেই বোঝানো হতো। সেই সময়ে অ্যালান টিউরিং এমন এক প্রশ্ন তুলেছিলেন, যার প্রতিধ্বনি আজও শোনা যায়। তিনি বলেছিলেন, ‘যন্ত্র কি চিন্তা করতে পারে?’

অসাধারণ দূরদৃষ্টি ছিল বলেই তিনি এত দূর কল্পনা করতে পেরেছিলেন। তিনি বুঝেছিলেন, বুদ্ধিমত্তা হয়তো একদিন জন্মগত না হয়ে মানুষের নির্মিতও হতে পারে। এই ভাবনাই পরে ‘কৃত্রিম বুদ্ধিমত্তা’ বা আর্টিফিশিয়াল ইন্টেলিজেন্স নামে এক নিরলস বৈজ্ঞানিক অনুসন্ধানের সূচনা করে। কৃত্রিম বুদ্ধিমত্তা নিয়ে কাজ করছি প্রায় ২৫ বছর হলো। আজও কর্মজীবনে আমি টিউরিংয়ের সেই দৃষ্টিভঙ্গি থেকে অনুপ্রাণিত হই। কিন্তু টিউরিং যেমনটা ভেবেছিলেন, সেই পথে আমরা আদতে কতখানি এগিয়েছি? প্রশ্নের উত্তরটা সহজ নয়।

বিমূর্ত কোনো বিষয় বোঝা বা একে কাজে লাগানোর ধরন দিন দিন বদলে যাচ্ছে। আর এ বদলে ভূমিকা রাখছে বড় ভাষাভিত্তিক মডেল বা এলএলএমের মতো শীর্ষস্থানীয় এআই প্রযুক্তি। তবু মনে হয় এই প্রযুক্তিগুলো যেন অন্ধকারে বসে থাকা শব্দের কারিগর। ভাষায় সাবলীল, কিন্তু বাস্তব অভিজ্ঞতায় দুর্বল। তথ্যসমৃদ্ধ, অথচ বাস্তবতার সঙ্গে গভীরভাবে যুক্ত নয়।

কোনো কিছুকে দেখা-শোনা-জানাই আমাদের বুদ্ধিমত্তার ভিত্তি। আমরা যখন নীরবে কিছু দেখি, কিংবা সচেতনভাবে কিছু তৈরির চেষ্টা করি—তখনই চিন্তার ক্ষমতা কাজ করে। এমনকি সবচেয়ে বিমূর্ত বিষয়েও আমাদের যুক্তি ও পরিকল্পনাকে পরিচালিত করে আমাদের ‘চিন্তা’। অন্য মানুষের সঙ্গে বা পরিবেশের সঙ্গে, কথা বলার মাধ্যমে হোক বা শারীরিকভাবে—সব ধরনের মিথস্ক্রিয়ার জন্যই এটি অপরিহার্য। যেদিন যন্ত্রের মধ্যেও এই ক্ষমতা যোগ করা যাবে, সেদিন বাস্তব ও ভার্চ্যুয়াল জগতের সঙ্গে আমাদের যোগাযোগের ধরন আমূল বদলে যাবে। গল্প বলা, রোবোটিকস, বৈজ্ঞানিক আবিষ্কারসহ আরও অনেক ক্ষেত্রে বিপ্লব ঘটবে। এটিই এআইয়ের পরবর্তী ধাপ, আর এ কারণেই ২০২৫ সাল ছিল এত গুরুত্বপূর্ণ।

সত্যি কথা বলতে এআইয়ের চিন্তার সক্ষমতা এখনো মানুষের কাছাকাছি পর্যায়েও পৌঁছায়নি। তবে উল্লেখযোগ্য অগ্রগতি অবশ্যই হয়েছে। লেখা ছাড়াও বিপুল পরিমাণ ছবি, ভিডিও ও অন্যান্য মাল্টিমিডিয়া ডেটার মাধ্যমে প্রশিক্ষিত মাল্টিমোডাল এলএলএমগুলো কিছু প্রাথমিক ধাপের কাজ শুরু করেছে। আজকের এআই ছবি বিশ্লেষণ করতে পারে, প্রশ্নের উত্তর দিতে পারে এবং অত্যন্ত বাস্তবসম্মত ছবি ও ছোট ভিডিও তৈরি করতে পারে।

তবু এখনো অনেক পথ বাকি। বুদ্ধিমান এআই গড়তে হলে আমাদের এলএলএমের চেয়েও বড় ও উচ্চাকাঙ্ক্ষী কিছু দরকার। দরকার ‘ওয়ার্ল্ড মডেল’—এমন নতুন ধরনের জেনারেটিভ মডেল, যেগুলো অর্থগত, ভৌত, জ্যামিতিক ও গতিশীলভাবে বিভিন্ন জটিল, বাস্তব ও ভার্চ্যুয়াল জগৎকে বুঝবে। যুক্তি দিয়ে ভাববে, নতুন কিছু তৈরি করবে। মিথস্ক্রিয়া করার ক্ষেত্রে আজকের এলএলএমের সক্ষমতার অনেক বাইরে যেতে পারবে।

এই প্রযুক্তি এখনো একেবারে প্রাথমিক পর্যায়ে আছে। তবে আশাব্যঞ্জক অগ্রগতি চোখে পড়ছে। সৃজনশীল টুলগুলো ইতিমধ্যেই আসতে শুরু করেছে। ওয়ার্ল্ড ল্যাবসের ‘মার্বেল’ এখনই নির্মাতা ও গল্পকারদের হাতে এসব ক্ষমতা তুলে দিচ্ছে। রোবোটিকস আমাদের বড় লক্ষ্যের স্বপ্ন দেখাচ্ছে, যেখানে ভাবনা ও বাস্তবতার সংযোগ আরও নিখুঁত হবে। বৈজ্ঞানিক এই রূপান্তরের হয়তো সময় লাগবে বেশি, তবে তা মানবকল্যাণে গভীর প্রভাব ফেলবে।

ইতিহাসে এই প্রথমবার আমরা এমন যন্ত্র তৈরি করতে যাচ্ছি, যে যন্ত্রকে আমরা আমাদের সবচেয়ে বড় চ্যালেঞ্জগুলো মোকাবিলায় প্রকৃত সহযোগী হিসেবে বিশ্বাস করতে পারব। ল্যাবরেটরিতে কোনো রোগ বোঝার গতি বাড়ানোর জন্য হোক, কিংবা অসুস্থতা, আঘাত বা বার্ধক্যের মতো সবচেয়ে দুর্বল সময়ে পাশে দাঁড়ানোর জন্যই হোক—সব ক্ষেত্রেই এই প্রযুক্তি আমাদের সহায়ক হতে পারে। আমরা এমন এক প্রযুক্তির একেবারে কাছাকাছি, যা জীবনের সবচেয়ে মূল্যবান দিকগুলোকে আরও সমৃদ্ধ করবে। এ যেন আরও গভীর, আরও অর্থবহ ও আরও ক্ষমতাবান এক জীবনের স্বপ্ন।

