বিজ্ঞানী, প্রযুক্তিবিদ ও পেশাজীবিদের মিলনকেন্দ্র

“সেমান্টিক সেগমেন্টেশন এখনো আন-সলভড প্রবলেম—আমি সেটাই নিয়ে কাজ করে যাচ্ছি।”—ড. আলিমুর রেজা

biggani orgMarch 16, 20261 Mins read6 Views

কৃত্রিম বুদ্ধিমত্তার দুনিয়া যত চকচকে মনে হোক না কেন, ভেতরে ভেতরে এখনো অনেক ‘অসম্পূর্ণ প্রশ্ন’ রয়ে গেছে। আমরা যখন দেখি—ফোনের ক্যামেরা মুখ চিনে ফেলছে, গাড়ি নিজে নিজে রাস্তা ধরছে, কিংবা কোনো অ্যাপ ছবির ভেতরের বস্তু বলে দিচ্ছে—তখন মনে হয়, যন্ত্র বুঝি মানুষের মতোই দেখে ফেলেছে। কিন্তু ড. আলিমুর রেজা আমাদের থামিয়ে দিয়ে বলেন, “দেখা”টা আসলে এত সহজ নয়।

সেমান্টিক সেগমেন্টেশন (ছবিকে অর্থপূর্ণ অংশে ভাগ করে প্রতিটি অংশকে নাম দেওয়া) বুঝতে হলে প্রথমে একটি ছবিকে কল্পনা করুন মানচিত্র হিসেবে। মানচিত্রে যেমন নদী, রাস্তা, মাঠ—সব আলাদা রঙে চিহ্নিত থাকে, সেমান্টিক সেগমেন্টেশনও ছবির ভেতরে ঠিক তেমনভাবে “মানুষ”, “দেয়াল”, “মেঝে”, “চেয়ার”—এই সব কিছুকে আলাদা করে চিহ্নিত করে। শুধু “এখানে মানুষ আছে” বলা যথেষ্ট নয়; বরং ছবির কোন কোন পিক্সেল (ছবির ক্ষুদ্র রঙিন কণা) মানুষ—এটা নির্দিষ্ট করে দিতে হয়। কারণ রোবট বা স্বয়ংক্রিয় যন্ত্র যদি একটি ঘরে চলাফেরা করে, তাকে জানতে হবে কোনটা হাঁটার পথ, কোনটা বাধা, কোনটা নড়ছে, কোনটা স্থির।

কিন্তু সমস্যা হলো—বাস্তব পৃথিবী কখনোই একরকম থাকে না। আপনার ঘরের মেঝে সকালে একরকম আলোতে দেখায়, সন্ধ্যায় অন্যরকম। কারও শার্টের রং ক্যামেরায় ভিন্ন দেখাতে পারে। দেয়ালে ছায়া পড়লে সেটাকে ‘নতুন বস্তু’ ভেবে ভুল হতে পারে। আর ক্যামেরার কোণ বদলালে একই জিনিসের আকৃতি বদলে যায়। ড. আলিমুর রেজা ইঙ্গিত দেন, সেগমেন্টেশন যে আজও ‘সম্পূর্ণ সমাধান’ নয়, তার পেছনে বড় কারণ—এই প্রযুক্তি অত্যন্ত বেশি নির্ভর করে মেশিন লার্নিং (ডেটা থেকে শেখার পদ্ধতি)-এর ওপর। অর্থাৎ যন্ত্রকে কী ধরনের উদাহরণ দেখানো হচ্ছে, কতটা বৈচিত্র্যময় ডেটা আছে, এবং মডেল কতটা শক্তিশালী—এসবের উপর ফল নির্ভর করে।

এখানেই গবেষণার আসল উত্তেজনা। কারণ একটি সেগমেন্টেশন মডেল যতই ভালো হোক, নতুন পরিবেশে—নতুন শহরে, নতুন ঘরে, ভিন্ন ক্যামেরায়—তার পারফরম্যান্স নেমে যেতে পারে। মানুষ যেমন অল্প চর্চায় নতুন ধরনের প্রশ্নে ভুল করে, মেশিনও তেমনই। তবে পার্থক্য হলো, মানুষ ভুল থেকে স্বাভাবিকভাবে শিখে ফেলে—কিন্তু মেশিনকে সেই শেখাটা আলাদা করে তৈরি করতে হয়। এই কারণেই গবেষকেরা নতুন পদ্ধতি, নতুন ডেটাসেট, নতুন মডেল-আর্কিটেকচার (নেটওয়ার্কের গঠন) নিয়ে পরীক্ষা করেন—যাতে যন্ত্র ‘পরিস্থিতি’ বদলালেও স্থিরভাবে বুঝতে পারে।

ড. আলিমুর রেজা শুধু ঘরের ভেতরের দৃশ্যে থেমে থাকেননি; তিনি দেখিয়েছেন, সেগমেন্টেশনের চ্যালেঞ্জ আরও বড় হয় যখন পরিবেশটাই মানুষের অভিজ্ঞতার বাইরে—যেমন পানির নিচের জগৎ। পানির নিচে আলো কম, রঙ বিকৃত হয়, দৃশ্য ঝাপসা থাকে—ফলে সাধারণ ভিশন প্রযুক্তি ভেঙে পড়ে। তার সাম্প্রতিক কাজের একটি অংশ এই বাস্তবতার দিকেই এগোয়: কীভাবে পানির নিচের নানা অবজেক্টকে সঠিকভাবে আলাদা করা যায়। এর প্রয়োগ ভবিষ্যতে মাছের স্বাস্থ্য পর্যবেক্ষণ, অ্যাকুয়াকালচার (মাছচাষ) মনিটরিং কিংবা সামুদ্রিক জীববৈচিত্র্য পর্যবেক্ষণে কাজে লাগতে পারে—আর বাংলাদেশে মৎস্যখাত যেহেতু গুরুত্বপূর্ণ, তাই এই গবেষণার বাস্তব প্রাসঙ্গিকতাও সহজেই চোখে পড়ে।

সব মিলিয়ে ড. আলিমুর রেজার বক্তব্যের মূল শিক্ষা—এআইকে ম্যাজিক না ভেবে বিজ্ঞান হিসেবে দেখা। “অসম্পূর্ণ সমস্যাই” বিজ্ঞানকে টেনে নিয়ে যায় সামনে। আর সেই পথেই তৈরি হয় ভবিষ্যতের রোবট—যে শুধু চলবে না, চারপাশ বুঝে চলবে।

পূর্ণ সাক্ষাৎকারে ড. আলিমুর রেজা তার শিক্ষা–যাত্রা, গবেষণার খুঁটিনাটি, রোবটের ভবিষ্যৎ, এবং এআই ব্যবহারের বাস্তব প্রশ্নগুলো আরও বিস্তারিতভাবে বলেছেন। নিম্নে ড. আলিমুর রেজার পূর্ণ সাক্ষাৎকারটি পড়ুন এবং ইউটিউবে দেখুন।