লেখা থেকে মিউজিক তৈরি করছে গুগলের এআই টুল MusicLM

লেখা থেকে মিউজিক তৈরি করছে গুগলের এআই টুল

লেখা থেকে মিউজিক তৈরি করছে গুগলের এআই টুল MusicLM 

গুগল মিউজিকএলএম নামে একটি নতুন জেনারেটিভ এআই মডেল ঘোষণা করেছে যা যেকোন লিখিত বিবরণ থেকে 24kHz সঙ্গীত অডিও তৈরি করতে পারে। উদাহরণস্বরূপ: আপনি যদি এই এআই মডেলে “একটি বিকৃত গিটার রিফ সহ একটি প্রশান্তিদায়ক বেহালার সুর” অনুসন্ধান করেন, আপনি মিনিটের মধ্যে সেই প্রম্পটের উপর ভিত্তি করে সঙ্গীত শুনতে পাবেন।

মূলত, গুগল এই এআই মডেলকে অনেকগুলো মিউজিক থেকে ডেটাসেটে প্রশিক্ষণ দিয়েছে। এছাড়াও, MusicCaps হল একটি ডেটাসেট যা ৫,৫২১ মিউজিক-লিরিক ব্যবহার করে। MusicCaps অডিও ক্লিপগুলি Google-এর অডিওসেট থেকে আসে এবং ২ মিলিয়ন YouTube ভিডিও থেকে ১০-সেকেন্ডের সাউন্ড ক্লিপগুলি আসে৷

মিউজিকএলএম দুটি অংশে কাজ করে – প্রথমে এটি অডিও টোকেনগুলির একটি ক্রম নেয় এবং সেগুলিকে শব্দার্থিক টোকেনে প্রশিক্ষণ দেয়। পরবর্তী ধাপ হল ব্যবহারকারীর ক্যাপশন এবং অডিও ইনপুট সহ মিউজিক প্রসেস শুরু করা। পুরো প্রক্রিয়াটি অডিওএলএম নামক একটি এআই মডেল যা আগে Google দ্বারা তৈরি করা হয়েছিল সেটিসহ সাউন্ডস্ট্রিয়ান এবং মুলানের মতো উপাদানগুলির উপর ভিত্তি করে তৈরি করা হয়েছে, ।

গুগল জানায়, মিউজিকএলএম অডিওর গুণমান এবং গানের বর্ণনার ক্ষেত্রে আগের সমস্ত এআই মিউজিক জেনারেটরকে পরাজিত করবে। মিউজিকএলএম এর ডেমোনস্ট্রেশন পেজে  গুগলের এআই মডেল দ্বারা তৈরি অনেক নমুনা রয়েছে। এই উৎপন্ন মিউজিকের সাথে রয়েছে চমৎকার টেক্সট বর্ণনা, যা থেকে এই মিউজিকগুলি তৈরি করা হয়েছে। আবার কিছু নমুনায় ভোকালও আছে কিন্তু সেগুলো এখনও খুব ভালোভাবে বিকশিত হয়নি।

এছাড়াও একটি শর্ট কমান্ড প্রম্পট থেকে মিউজিকএলএম  ৫ মিনিটের মিউজিক জেনারেট করে তার উৎপাদন ক্ষমতা প্রদর্শন করে। ফলে এই নতুন AI মোটামুটি ইমেজ ক্যাপশন ব্যবহার করে সঙ্গীত তৈরি করতে ব্যবহার করা যেতে পারে।

মিউজিকএলএম নমুনা পেজটি বাঁশি, সেলো, গিটার ইত্যাদির মতো একটি নির্দিষ্ট যন্ত্র অনুকরণ করার জন্য MusicLM-এর ক্ষমতা বর্ণনা করে। মিউজিকএলএম বিভিন্ন অবস্থান, ধরণ এবং সময়ের উপর ভিত্তি করে ডিমান্ড অনুযায়ী সঙ্গীত তৈরি করতে পারে।

আমাদের জন্য এআই-উত্পন্ন সঙ্গীতের ধারণাটি নতুন নয়। এর আগেও আমরা প্রচুর মিউজিক জেনারেটর দেখেছ্র। কিন্তু কোনো কোম্পানি গুগলের কাছাকাছি আসেনি। Riffusion নামে একটি AI প্রকল্প একইভাবে লিখিত বর্ণনা থেকে সঙ্গীত তৈরি করার ক্ষমতা প্রদর্শন করছে। গুগল তার বৈজ্ঞানিক গবেষণাপত্র মিউজিকএলএম-এ টুলটির উল্লেখ করেছে এবং বলেছে যে নতুন টুলটি সব ক্ষেত্রে আগেরটিকে ছাড়িয়ে যাবে।


আরো পড়ুনঃ HTML কি এবং কিভাবে কাজ করে?

 

 

Leave a Comment

Your email address will not be published. Required fields are marked *