Google Veo
গুগল অবশেষে অত্যন্ত প্রত্যাশিত বার্ষিক ডেভেলপারদের সম্মেলন সম্পন্ন করেছে, এবং এআই ছিল কেন্দ্রবিন্দু। মাউন্টেন ভিউ, ক্যালিফোর্নিয়া, সম্প্রতি Google I/O ইভেন্টের আয়োজন করেছে, যা গ্রাহকদের কাছে AI এর ভবিষ্যত প্রদর্শন করেছে।
এটিতে দুটি নতুন জেনারেটিভ এআই প্রযুক্তির প্রবর্তন দেখা গেছে, যার মধ্যে রয়েছে ভিও এবং ইমেজেন 3। ভিও একটি ভিডিও-উৎপাদনকারী এআই ইঞ্জিন, অনেকটা ওপেনএআই-এর সোরার মতো, যা পাঠ্য বার্তা ব্যবহার করে ভিডিও তৈরি করে। Imagen 3, ইতিমধ্যে, Google দ্বারা বর্তমান পর্যন্ত সেরা টেক্সট-উৎপাদনকারী চিত্র হিসাবে বাজারজাত করা হয়েছে।

গুগল ভিও
Google Veo হল Google এর সবচেয়ে উন্নত ভিডিও-উৎপাদনকারী AI। এটি বিভিন্ন জেনারে শীর্ষস্থানীয়, 1080p ফিল্ম তৈরি করার ক্ষমতা রাখে। এটি টাইমল্যাপস এবং এরিয়াল শটগুলির মতো সিনেমাটিক ধারণা সম্পর্কেও সচেতন এবং এটি একটি চলচ্চিত্র নির্মাতার কল্পনার সাথে মেলে এমন প্রভাব দিতে পারে। Veo ভিডিও তৈরিতে বিপ্লব ঘটাতে প্রস্তুত, এমন একটি টুল অফার করে যা বাস্তবতা এবং সুসংগততা বজায় রেখে প্রম্পটের সারাংশ ক্যাপচার করে।

অবশেষে, OpenAI এর সোরা টেক্সট-টু-ভিডিও জেনারেটরের সাম্প্রতিক আত্মপ্রকাশের সাথে, একই সেক্টরে Google-এর একটি সম্ভাব্য প্রতিদ্বন্দ্বী রয়েছে। Veo-এর সম্ভাব্যতা প্রদর্শনের জন্য, Google আইকনিক ফিল্মমেকার ডোনাল্ড গ্লোভার এবং তার সৃজনশীল স্টুডিও, গিলগা-এর সাথে একটি প্রকল্পের যৌথ আয়োজন করেছে। প্রজেক্টটি সৃজনশীল প্রক্রিয়ার অংশ হিসাবে AI এর সক্ষমতার ইঙ্গিত করার সময় পেশাদার চিত্রগ্রহণে Veo-এর প্রকৃত মূল্য এবং সম্ভাবনাকে বোঝায়। অনেক নির্মাতা যাদের ব্যক্তিগত আমন্ত্রণ পাঠানো হয়েছে তাদের একটি পরীক্ষায় প্রাথমিক অ্যাক্সেস থাকবে, যাতে তারা VideoFX-এ Veo-এর বৈশিষ্ট্যগুলি নিয়ে পরীক্ষা করতে পারে।
Google Imagen 3
উপরন্তু, Google Imagen 3 একটি AI মডেল হিসাবে ঘোষণা করা হয়েছিল যা পাঠ্য কোডগুলি থেকে ব্যতিক্রমী-মানের ছবি তৈরি করে। এটিকে একটি বিশাল পদক্ষেপ হিসাবে সংজ্ঞায়িত করা হয়েছিল কারণ ইমেজেন 3 এখন পর্যন্ত সমস্ত প্রম্পট থেকে স্পষ্ট এবং সীমিত দৃষ্টিকোণ বিভ্রান্তির সাথে সবচেয়ে আলোক-বাস্তববাদী অফার তৈরি করেছে। সর্বোপরি, স্বতন্ত্র পাঠ্যের গুরুত্ব রয়েছে যে মডেলটি প্রম্পটের সাথে মেলে এমন চিত্রগুলি কতটা ভালভাবে তৈরি করেছে তার মধ্যে।

সূক্ষ্ম দানাদার বন্যপ্রাণী প্রতিকৃতি থেকে শুরু করে নাটকীয় ল্যান্ডস্কেপ শট পর্যন্ত, ইমেজেন 3-এর ক্ষমতাগুলি বিস্তৃত প্রম্পটের জন্য তৈরি করা ফটো-পুরানো চিত্রগুলি দ্বারা প্রদর্শিত হয়েছিল, যা বিভিন্ন বিভাগের সূক্ষ্মতা এবং ফ্লেয়ার ক্যাপচার করে। মডেলের উন্নত টেক্সট রেন্ডারিং কাস্টম বার্তা থেকে আনুষ্ঠানিক উপস্থাপনা পর্যন্ত ব্যবহারের ক্ষেত্রে নতুন সম্ভাবনা উন্মুক্ত করে। “Imagen 3 হল আমাদের সম্ভাব্য টেক্সট-টু-ইমেজ মডেল।
যখন এটি চিত্রগুলি তৈরি করে, তখন প্রাক্তন মডেলগুলির তুলনায় একটি বাস্তব ছবির বিশেষ অসুবিধার জন্য তারা ঘাড় এবং ঘাড়ের ফটোরিয়ালিস্টিক দেখায়, “গুগলের মুখপাত্র জো পিকক একটি ব্লগ পোস্টে লিখেছেন৷ আজ অবধি, কিছু কিছু অবদানকারীকে ImageFX ব্যক্তিগত প্রবণতার মাধ্যমে Imagen 3-এ একচেটিয়া অ্যাক্সেস দেওয়া হয়েছে, যদিও Vertex AI-এর মাধ্যমে অ্যাক্সেস খুব দূরবর্তী ভবিষ্যতে ঘটবে বলে পরিকল্পনা করা হয়েছে।
FAQs
কি Veo অনন্য করে তোলে?
Veo বিভিন্ন শৈলীতে উচ্চ-মানের ভিডিও তৈরি করতে পারে, “টাইমল্যাপস” এবং “এরিয়াল শট” এর মতো সিনেমাটিক ধারণাগুলি বুঝতে পারে, এটি চলচ্চিত্র নির্মাতাদের জন্য একটি বহুমুখী হাতিয়ার করে তোলে।
কিভাবে নির্মাতারা Imagen 3 অ্যাক্সেস করতে পারেন?
নির্বাচিত নির্মাতারা ImageFX এর মাধ্যমে একটি ব্যক্তিগত পূর্বরূপের মাধ্যমে Imagen 3 অ্যাক্সেস করতে পারেন। Google বৃহত্তর উপলব্ধতার জন্য অপেক্ষা তালিকায় যোগদান করতে উত্সাহিত করে এবং এটি শীঘ্রই Vertex AI-তে একত্রিত হবে৷

