এখনো অনেক পথ বাকি, বলছেন ‘গডমাদার অব এআই’
ফেই ফেই লি-কে বলা হয় ‘গডমাদার অব এআই’। তিনি একজন চীনা-মার্কিন কম্পিউটারবিজ্ঞানী। টাইম ম্যাগাজিন এ বছর যাঁদের ‘বর্ষসেরা ব্যক্তিত্ব’ হিসেবে তুলে ধরেছে, তাঁদের মধ্যে স্ট্যানফোর্ডের এই শিক্ষকও আছেন। পড়ুন টাইম ডটকমে লেখা তাঁর একটি নিবন্ধের অনুবাদ।
১৯৫০ সাল। তখন ‘কম্পিউটিং’ বলতে মূলত স্বয়ংক্রিয় গণনা আর সহজ যুক্তির খেলাকেই বোঝানো হতো। সেই সময়ে অ্যালান টিউরিং এমন এক প্রশ্ন তুলেছিলেন, যার প্রতিধ্বনি আজও শোনা যায়। তিনি বলেছিলেন, ‘যন্ত্র কি চিন্তা করতে পারে?’
অসাধারণ দূরদৃষ্টি ছিল বলেই তিনি এত দূর কল্পনা করতে পেরেছিলেন। তিনি বুঝেছিলেন, বুদ্ধিমত্তা হয়তো একদিন জন্মগত না হয়ে মানুষের নির্মিতও হতে পারে। এই ভাবনাই পরে ‘কৃত্রিম বুদ্ধিমত্তা’ বা আর্টিফিশিয়াল ইন্টেলিজেন্স নামে এক নিরলস বৈজ্ঞানিক অনুসন্ধানের সূচনা করে। কৃত্রিম বুদ্ধিমত্তা নিয়ে কাজ করছি প্রায় ২৫ বছর হলো। আজও কর্মজীবনে আমি টিউরিংয়ের সেই দৃষ্টিভঙ্গি থেকে অনুপ্রাণিত হই। কিন্তু টিউরিং যেমনটা ভেবেছিলেন, সেই পথে আমরা আদতে কতখানি এগিয়েছি? প্রশ্নের উত্তরটা সহজ নয়।
বিমূর্ত কোনো বিষয় বোঝা বা একে কাজে লাগানোর ধরন দিন দিন বদলে যাচ্ছে। আর এ বদলে ভূমিকা রাখছে বড় ভাষাভিত্তিক মডেল বা এলএলএমের মতো শীর্ষস্থানীয় এআই প্রযুক্তি। তবু মনে হয় এই প্রযুক্তিগুলো যেন অন্ধকারে বসে থাকা শব্দের কারিগর। ভাষায় সাবলীল, কিন্তু বাস্তব অভিজ্ঞতায় দুর্বল। তথ্যসমৃদ্ধ, অথচ বাস্তবতার সঙ্গে গভীরভাবে যুক্ত নয়।
কোনো কিছুকে দেখা-শোনা-জানাই আমাদের বুদ্ধিমত্তার ভিত্তি। আমরা যখন নীরবে কিছু দেখি, কিংবা সচেতনভাবে কিছু তৈরির চেষ্টা করি—তখনই চিন্তার ক্ষমতা কাজ করে। এমনকি সবচেয়ে বিমূর্ত বিষয়েও আমাদের যুক্তি ও পরিকল্পনাকে পরিচালিত করে আমাদের ‘চিন্তা’। অন্য মানুষের সঙ্গে বা পরিবেশের সঙ্গে, কথা বলার মাধ্যমে হোক বা শারীরিকভাবে—সব ধরনের মিথস্ক্রিয়ার জন্যই এটি অপরিহার্য। যেদিন যন্ত্রের মধ্যেও এই ক্ষমতা যোগ করা যাবে, সেদিন বাস্তব ও ভার্চ্যুয়াল জগতের সঙ্গে আমাদের যোগাযোগের ধরন আমূল বদলে যাবে। গল্প বলা, রোবোটিকস, বৈজ্ঞানিক আবিষ্কারসহ আরও অনেক ক্ষেত্রে বিপ্লব ঘটবে। এটিই এআইয়ের পরবর্তী ধাপ, আর এ কারণেই ২০২৫ সাল ছিল এত গুরুত্বপূর্ণ।
সত্যি কথা বলতে এআইয়ের চিন্তার সক্ষমতা এখনো মানুষের কাছাকাছি পর্যায়েও পৌঁছায়নি। তবে উল্লেখযোগ্য অগ্রগতি অবশ্যই হয়েছে। লেখা ছাড়াও বিপুল পরিমাণ ছবি, ভিডিও ও অন্যান্য মাল্টিমিডিয়া ডেটার মাধ্যমে প্রশিক্ষিত মাল্টিমোডাল এলএলএমগুলো কিছু প্রাথমিক ধাপের কাজ শুরু করেছে। আজকের এআই ছবি বিশ্লেষণ করতে পারে, প্রশ্নের উত্তর দিতে পারে এবং অত্যন্ত বাস্তবসম্মত ছবি ও ছোট ভিডিও তৈরি করতে পারে।
তবু এখনো অনেক পথ বাকি। বুদ্ধিমান এআই গড়তে হলে আমাদের এলএলএমের চেয়েও বড় ও উচ্চাকাঙ্ক্ষী কিছু দরকার। দরকার ‘ওয়ার্ল্ড মডেল’—এমন নতুন ধরনের জেনারেটিভ মডেল, যেগুলো অর্থগত, ভৌত, জ্যামিতিক ও গতিশীলভাবে বিভিন্ন জটিল, বাস্তব ও ভার্চ্যুয়াল জগৎকে বুঝবে। যুক্তি দিয়ে ভাববে, নতুন কিছু তৈরি করবে। মিথস্ক্রিয়া করার ক্ষেত্রে আজকের এলএলএমের সক্ষমতার অনেক বাইরে যেতে পারবে।
এই প্রযুক্তি এখনো একেবারে প্রাথমিক পর্যায়ে আছে। তবে আশাব্যঞ্জক অগ্রগতি চোখে পড়ছে। সৃজনশীল টুলগুলো ইতিমধ্যেই আসতে শুরু করেছে। ওয়ার্ল্ড ল্যাবসের ‘মার্বেল’ এখনই নির্মাতা ও গল্পকারদের হাতে এসব ক্ষমতা তুলে দিচ্ছে। রোবোটিকস আমাদের বড় লক্ষ্যের স্বপ্ন দেখাচ্ছে, যেখানে ভাবনা ও বাস্তবতার সংযোগ আরও নিখুঁত হবে। বৈজ্ঞানিক এই রূপান্তরের হয়তো সময় লাগবে বেশি, তবে তা মানবকল্যাণে গভীর প্রভাব ফেলবে।
ইতিহাসে এই প্রথমবার আমরা এমন যন্ত্র তৈরি করতে যাচ্ছি, যে যন্ত্রকে আমরা আমাদের সবচেয়ে বড় চ্যালেঞ্জগুলো মোকাবিলায় প্রকৃত সহযোগী হিসেবে বিশ্বাস করতে পারব। ল্যাবরেটরিতে কোনো রোগ বোঝার গতি বাড়ানোর জন্য হোক, কিংবা অসুস্থতা, আঘাত বা বার্ধক্যের মতো সবচেয়ে দুর্বল সময়ে পাশে দাঁড়ানোর জন্যই হোক—সব ক্ষেত্রেই এই প্রযুক্তি আমাদের সহায়ক হতে পারে। আমরা এমন এক প্রযুক্তির একেবারে কাছাকাছি, যা জীবনের সবচেয়ে মূল্যবান দিকগুলোকে আরও সমৃদ্ধ করবে। এ যেন আরও গভীর, আরও অর্থবহ ও আরও ক্ষমতাবান এক জীবনের স্বপ্ন।