আইও সম্মেলনে গুগলের নতুন চমক

আহমেদ ইফতেখার
Printed Edition

গুগল আইও সম্মেলন অনুষ্ঠিত হয়েছে গত মঙ্গল ও বুধবার। দু’দিনের এ সম্মেলনে গুগল সার্চের এআই মোড, ডিপ রিসার্চ, ক্যানভাস, জিমেইল, গুগল মিটসহ ইমাজেন-৪, ভিও-৩ এবং লিরিয়া-২ এআই মডেল ও টুলের নতুন সংস্করণও প্রদর্শন করেছে প্রতিষ্ঠানটি। এছাড়াও জেমিনির হালনাগাদ সংস্করণের পাশাপাশি চলচ্চিত্র নির্মাণের জন্য এআই টুল, অ্যাসিনক্রোনাস এআই কোডিং এজেন্টসহ এআইভিত্তিক বিভিন্ন পণ্য ও প্রযুক্তি দেখিয়েছে। আই/ও সম্মেলনে প্রদর্শন করা নতুন প্রযুক্তি ও সুবিধাগুলো নিয়ে লিখেছেন আহমেদ ইফতেখার-

সম্মেলনে এআই মডেল জেমিনি ২.৫ ফ্ল্যাশ ও প্রোতে নতুন সুবিধা যুক্তের ঘোষণা দিয়েছে গুগল, যার মধ্যে অন্যতম হলো- ‘ডিপ থিঙ্ক’। বিশ্লেষণধর্মী সুবিধাটি এআই ব্যবহারকারীদের প্রশ্নের উত্তর দেয়ার আগে একাধিক সম্ভাব্য উত্তর তৈরি করে রাখতে পারে। এর ফলে ব্যবহারকারীরা চাইলে বিভিন্ন কাজের উপযোগী প্রয়োজনীয় উত্তর জানতে পারবেন। প্রাথমিকভাবে নির্দিষ্ট কিছু ব্যবহারকারী জেমিনি এপিআইয়ের মাধ্যমে সুবিধাটি ব্যবহারের সুযোগ পাবেন। এ সুবিধার পাশাপাশি নেটিভ অডিও আউটপুট ও উন্নত নিরাপত্তাব্যবস্থাও যুক্ত করা হয়েছে জেমিনির নতুন মডেলগুলোয়।

‘ফ্লো’ নামের নতুন এআই টুলটি সিনেমার কৃত্রিম দৃশ্য ও ক্লিপ তৈরি করতে পারে। এটি গুগলের উন্নত এআই মডেল ভিও, ইমাজেন ও জেমিনির মাধ্যমে ব্যবহারকারীদের নির্দেশমতো সিনেমার দৃশ্য তৈরি করে দেবে। শুধু তাই নয়, ব্যবহারকারীরা চাইলে কৃত্রিমভাবে তৈরি সিনেমার দৃশ্যগুলো সম্পাদনা, ক্যামেরা অ্যাঙ্গেল নিয়ন্ত্রণ ও ভিজ্যুয়াল ব্যবস্থাপনা করতে পারবেন।

ভিও-৩ হলো গুগলের নতুন টেক্সট-টু-ভিডিও জেনারেটর। লেখা থেকে ভিডিও তৈরি করতে সক্ষম ভিডিও জেনারেটরটির মাধ্যমে এবার রাস্তায় চলা গাড়ির শব্দ, পাখির ডাক যুক্তের পাশাপাশি বিভিন্ন চরিত্রের মুখে সংলাপ শোনা যাবে। অন্যদিকে ইমাজেন-৪ এখন ২-কে রেজল্যুশনের ছবি তৈরি করতে পারবে এবং তাতে সূক্ষ্ম বিষয়বস্তু যেমন পানির ফোঁটা বা পশুর লোমও স্পষ্ট দেখা যাবে। এ ছাড়া মিউজিক জেনারেটর লিরিয়া-২ এর মাধ্যমে ইউটিউব শর্টস তৈরি করতে পারবেন নির্মাতারা।

জেমিনি-২.৫ প্রো-নির্ভর ‘জুলস’ মূলত একটি এআই কোডিং এজেন্ট, যা নিজে থেকে কোড পড়ে বুঝতে পারার পাশাপাশি নতুন কোডও লিখতে পারে। এর ফলে ব্যবহারকারীরা কোডিং এজেন্টটির মাধ্যমে কোডিংয়ের বিভিন্ন তথ্য জানার পাশাপাশি নিজে থেকেই ত্রুটি শনাক্ত করতে পারবে। ব্যাকগ্রাউন্ডে স্বয়ংক্রিয়ভাবে কাজ করায় কোডিংয়ের ব্যাখ্যা, পরিকল্পনা ও পরিবর্তিত কোডের বিবরণও জানাতে পারে জুলস।

জেমিনি লাইভ অপশনে নতুন করে ক্যামেরা ও স্ক্রিন শেয়ার সুবিধা যুক্ত করা হয়েছে। এর ফলে ফোনের পর্দায় বা ক্যামেরায় দেখা ছবির বিষয়ে জেমিনির সাথে সরাসরি কথা বলা যাবে। এ ছাড়া জেমিনির ডেস্কটপ সংস্করণ আনারও ঘোষণা দিয়েছে গুগল। প্রাথমিকভাবে এসব সুবিধা শুধু যুক্তরাষ্ট্রে বসবাসকারী এআই প্রো ও আলট্রা গ্রাহকদের জন্য উন্মুক্ত করা হবে।

নিজেদের এআই এজেন্ট তৈরির পরিকল্পনার নাম ‘মেরিনার’ রেখেছে গুগল। এ বছর চালু হবে প্রকল্পটি এবং টুল হিসেবে কাজ করবে এটি, যা ব্যবহারকারীদের জন্য স্বয়ংক্রিয়ভাবে ইন্টারনেটে কাজ করতে পারবে।

ব্যবহারকারীরা এ এজেন্টটিকে ওয়েবনির্ভর কাজ দিতে পারবেন। যেমন- কোন শহরে যেতে চান সেখানকার হোটেল খোঁজা বা বাইক সারানোর জন্য কোনো নির্দিষ্ট পণ্য খোঁজার কাজটি এজেন্টটিকে দিতে পারেন। এরপর এআই টুলটি নিজেই সেই কাজটি সম্পন্ন করবে বলে দাবি কোম্পানিটির।

গুগলের জেমিনাই এআইসহ নতুন হেডসেট ও চশমা তৈরির পরিকল্পনা নতুন কিছু নয়। কারণ এগুলো গত বছরই আনার ঘোষণা দিয়েছিল কোম্পানিটি। তবে নিজেদের প্রথম হেডসেট ‘প্রজেক্ট মোহান’ উন্মোচন করেছে গুগল, যা স্যামসাংয়ের সাথে মিলে তৈরি হচ্ছে ও এ বছরের শেষ দিকে বাজারে আসবে।

এ ছাড়া, প্রথমবারের মতো নিজেদের ‘অ্যান্ড্রয়েড এক্সআর’ দিয়ে তৈরি চশমার ঝলক দেখিয়েছে গুগল, যা জেমিনাইয়ের মাধ্যমে চলবে। এ চশমাটি ব্যবহারকারীর আশপাশের দৃশ্য ও শব্দের ওপর ভিত্তি করে প্রাসঙ্গিক প্রশ্নের উত্তর দিতে পারবে।

গুগল তাদের সার্চ ইঞ্জিনকে সম্পূর্ণভাবে এআইভিত্তিক করার ঘোষণা দিয়েছে। এর ফলে ব্যবহারকারীদের সার্চ অভিজ্ঞতা বর্তমানের তুলনায় আরো উন্নত হবে। এআই মোড মূলত এক ধরনের পরিপূর্ণ এআই সার্চ সুবিধা, যার মাধ্যমে যেকোনো বিষয়ের ফলোআপ প্রশ্ন করার পাশাপাশি ওয়েব লিংক বিশ্লেষণ এবং ব্যবহারকারীর ধরন অনুযায়ী অনুসন্ধান করা যাবে। এআই মোডে পণ্য খোঁজার সময় ব্যবহারকারীদের সামনে ‘শপিং গ্রাফ’ নামে নতুন একটি প্যানেল প্রদর্শন করবে গুগল। এর ফলে গুগলে বর্তমানের তুলনায় আরো বেশি পছন্দ অনুযায়ী ছবি ও তথ্য দেখা যাবে।