আপনি হয়তো কখনো ভেবেছেন, একটি ছবি তো সমতল—তাতে গভীরতা নেই। তাহলে ছবির ভেতর থেকে কীভাবে ত্রিমাত্রিক (3D) আকার বেরিয়ে আসে? ড. আলিমুর রেজা এই প্রশ্নের দিকেই আমাদের নিয়ে যান যখন তিনি বলেন, ইমেজ থেকে ত্রিমাত্রিক রিকনস্ট্রাকশন একটি গুরুত্বপূর্ণ গবেষণা সমস্যা। সহজ ভাষায়, ত্রিমাত্রিক রিকনস্ট্রাকশন (ছবি বা ভিডিও দেখে কোনো বস্তু/পরিবেশকে ত্রিমাত্রিকভাবে পুনর্গঠন) মানে হলো এমন একটি পদ্ধতি, যেখানে ক্যামেরায় তোলা একাধিক ছবি বিশ্লেষণ করে কম্পিউটার বুঝতে চেষ্টা করে—বস্তুটি কতটা গভীর, কোন অংশ সামনে, কোন অংশ পেছনে, আর আসল আকৃতিটা কেমন।
এটি বোঝার জন্য একটি পরিচিত উদাহরণ ধরা যাক। আপনি যখন একটি চেয়ারকে এক দিক থেকে দেখেন, তখন তার এক পাশ বেশি দেখা যায়। কিন্তু চেয়ারকে যদি আপনি দুই-তিন দিক থেকে দেখেন, ধীরে ধীরে আপনার মাথায় একটি পূর্ণ ত্রিমাত্রিক ধারণা তৈরি হয়—কোথায় হাতল, কোথায় পিঠের অংশ, কোথায় পা। মানুষের মস্তিষ্ক এই কাজটা খুব স্বাভাবিকভাবেই করে। ত্রিমাত্রিক রিকনস্ট্রাকশন প্রযুক্তি মূলত যন্ত্রকে সেই একই কাজ শেখায়: বিভিন্ন কোণ থেকে পাওয়া দৃশ্য মিলিয়ে একটি পূর্ণ ত্রিমাত্রিক মডেল বানানো।
ড. আলিমুর রেজা আরও একটি গুরুত্বপূর্ণ কথা বলেন—ত্রিমাত্রিক মডেল তৈরি করতে প্রচলিতভাবে অনেক সময় মানুষকে হাতে ধরে মডেল বানাতে হয়। ত্রিমাত্রিক প্রিন্টিংয়ের কথা আমরা সবাই শুনেছি: আপনি যেটা প্রিন্ট করতে চান, তার একটি ত্রিমাত্রিক ডিজাইন ফাইল লাগবে। কিন্তু সেই ফাইলটি তৈরি করাটাই অনেক সময় শ্রমসাধ্য কাজ। এখানেই ত্রিমাত্রিক রিকনস্ট্রাকশন বড় সম্ভাবনা তৈরি করে। যদি ছবি থেকেই মডেল বানানো যায়, তাহলে হাতে করে সব সময় ডিজাইন করার প্রয়োজন কমে যেতে পারে। অর্থাৎ যন্ত্র যদি দেখতে পারাকে শেখে, তাহলে সে বানাতেও শেখার এক ধাপ কাছে চলে যায়।
এখন প্রশ্ন হলো, এতে আমাদের দৈনন্দিন জীবনে কী লাভ? ড. আলিমুর রেজা একটি সহজ উদাহরণ দেন: ভবিষ্যতে আপনার হাতে যদি শক্তিশালী ত্রিমাত্রিক রিকনস্ট্রাকশন সলিউশন থাকে, তাহলে আপনি মোবাইল ফোন দিয়ে কোনো জায়গার এক-দুইটি ছবি তুলেই সেই জায়গার ত্রিমাত্রিক রূপ দেখতে পারবেন। এটি শুধু কৌতূহলের খেলনা নয়; এর বাস্তব প্রয়োগ আছে। যেমন, অনলাইন কেনাকাটায় একটি পণ্য ত্রিমাত্রিক ভিউতে দেখা, ঘরের ভেতর কোনো আসবাব রাখলে কেমন দেখাবে তা আগে থেকেই বোঝা, বা নির্মাণকাজে কোনো জায়গার মাপ ও কাঠামো দ্রুত ধারণা করা। প্রযুক্তিকে আপনি এক ধরনের “ডিজিটাল টেপ মেজার” ভাবতে পারেন, যা শুধু মাপই নেয় না—পুরো আকৃতিও গঠন করে।
রোবটিক্সের সঙ্গে এই প্রযুক্তির সম্পর্ক আরও গভীর। একটি রোবট যদি ঘরে চলাফেরা করে, তাকে শুধু সামনে কী আছে তা জানলেই হবে না; তাকে দূরত্ব বুঝতে হবে, বাধার গভীরতা বুঝতে হবে, কোথায় ফাঁকা জায়গা আছে তা বুঝতে হবে। ত্রিমাত্রিক রিকনস্ট্রাকশন রোবটকে পরিবেশের ত্রিমাত্রিক মানচিত্র বানাতে সাহায্য করতে পারে। ফলে রোবটের চলাচল আরও নিরাপদ ও দক্ষ হতে পারে। অন্যভাবে বললে, সেমান্টিক সেগমেন্টেশন যেভাবে ছবির ভেতরের ‘কি আছে’ তা শেখায়, ত্রিমাত্রিক রিকনস্ট্রাকশন শেখায় ‘কোথায় কতটা দূরে’ এবং ‘আকৃতিটা কেমন’।
তবে ড. আলিমুর রেজা মনে করিয়ে দেন, এই কাজটি সহজ নয়। কারণ বাস্তব ছবিতে আলো বদলায়, ছায়া পড়ে, বস্তু আংশিক আড়াল হয়, কখনো প্রতিফলন দেখা যায়—এসব কারণে ত্রিমাত্রিক তথ্য বের করা কঠিন হয়ে পড়ে। আগে এই কাজ অনেকটাই ক্লাসিক্যাল কম্পিউটার ভিশন পদ্ধতিতে করা হতো; এখন এআই বিশেষ করে ডিপ লার্নিং (নিউরাল নেটওয়ার্কভিত্তিক শেখা) ব্যবহার করে এই কাজকে আরও সফল করার চেষ্টা চলছে। অর্থাৎ যন্ত্রকে শুধু নিয়ম শেখানো নয়, যন্ত্রকে উদাহরণ দেখে নিয়ম তৈরি করতে শেখানো—এটাই আজকের বড় পরিবর্তন।
বাংলাদেশের প্রেক্ষাপটেও ত্রিমাত্রিক রিকনস্ট্রাকশনের সম্ভাবনা আছে। যেমন, পুরাকীর্তি ও ঐতিহ্য সংরক্ষণে গুরুত্বপূর্ণ স্থাপনার ত্রিমাত্রিক নথি তৈরি, দুর্যোগের পর ক্ষয়ক্ষতি মূল্যায়নে দ্রুত মানচিত্র তৈরি, বা শিক্ষায় বিজ্ঞান-প্রযুক্তির হাতে-কলমে শেখায় ত্রিমাত্রিক ভিজ্যুয়ালাইজেশন ব্যবহার। আপনি যদি কখনো দেখেন, একটি জটিল যন্ত্রের ছবি দেখে বোঝা কঠিন—কিন্তু ত্রিমাত্রিক মডেল ঘোরালে বোঝা সহজ—তাহলে আপনি এই প্রযুক্তির শিক্ষামূল্যও বুঝতে পারবেন। এটি শিক্ষার্থীদের জন্য কেবল গবেষণার বিষয় নয়, শেখার ভাষাও বদলে দিতে পারে।
ড. আলিমুর রেজার বক্তব্য থেকে একটি শিক্ষণীয় বার্তা পাওয়া যায়: আজকের গণিত, প্রোগ্রামিং এবং কৌতূহল—এই তিনটি মিলে আগামী দিনের প্রযুক্তিকে বাস্তব করে। আপনি যদি ছবি দেখে ‘ভেতরের গঠন’ বুঝতে শেখেন, তাহলে আপনি শুধু কম্পিউটারকে শেখাচ্ছেন না; আপনি নিজেকেও শেখাচ্ছেন—দুনিয়াকে নতুন চোখে দেখতে।
পূর্ণ সাক্ষাৎকারে ড. আলিমুর রেজা তার শিক্ষা–যাত্রা, গবেষণার খুঁটিনাটি, রোবটের ভবিষ্যৎ, এবং এআই ব্যবহারের বাস্তব প্রশ্নগুলো আরও বিস্তারিতভাবে বলেছেন। নিম্নে ড. আলিমুর রেজার পূর্ণ সাক্ষাৎকারটি পড়ুন এবং ইউটিউবে দেখুন।

Leave a comment