০৯/০৪/২০২৬, ১৮:২৬ অপরাহ্ণ
    spot_img

    এ সপ্তাহের সেরা

    সম্পর্কিত পোস্ট

    মাইক্রোসফট নিয়ে এলো নতুন এআই

    জেড নিউজ, ঢাকা:

    সহজলভ্য এআই মডেল নিয়ে নতুন করে আলোচনায় এলো মাইক্রোসফট। যার নাম মেই ট্রান্সক্রাইব ওয়ান। এটি সরাসরি গুগল উদ্ভাবিত জেমেনি ৩.১ ফ্ল্যাশ সংস্করণকে চ্যালেঞ্জ ছুড়েছে। বলতে গেলে, মাইক্রোসফটের নতুন এআই ট্রান্সক্রিপশন মডেলের সমীকরণে বিশ্বের সবচেয়ে মানোন্নত এআই স্পিচ-টু- টেক্সট মডেল। শুধু ভয়েস পরিষেবায় নয়; বেশ কিছু বিষয়ে জেমিনিকে প্রতিযোগিতায় ফেলবে মাইক্রোসফট।

    নতুন মাইলফলক

    কিছুদিনের মধ্যেই মাইক্রোসফট তিনটি নতুন এআই মডেল উন্মোচন করেছে। যার মধ্যে রয়েছে মেই সিরিজের ট্রান্সক্রাইব ওয়ান, ভয়েস ওয়ান আর ইমেজ টু সংস্করণ। এসব যথাক্রমে স্পিচ-টু- টেক্সট রূপান্তর; বাস্তবের সঙ্গে মিল রেখে কণ্ঠস্বর তৈরি আর ইমেজ জেনারেশন তৈরি করতে পারে। এটি ট্রান্সক্রাইবের তৃতীয় এআই সংস্করণ।

    মাইক্রোসফট কতটা এগিয়ে

    নতুন সংস্করণে ট্রান্সক্রাইব ওয়ানের স্পিচ-টু- টেক্সট মডেলটি ৩.৯ শতাংশ গড় শব্দ ত্রুটি হারে ইংরেজি, জার্মান, ফরাসি, ইতালিয়ান, স্প্যানিশ, হিন্দি ছাড়া এখন ২৫টি ভাষায় কাজ করতে পারদর্শী। হিসাব বলছে, গুগলের জেমিনি ৩.১ ফ্ল্যাশ লাইট সংস্করণ ২২টি ভাষায় কাজ করতে পারে। এই হিসাবে শুরুতে গুগলের চেয়ে এগিয়েছে মাইক্রোসফট।

    গতি ও সাশ্রয়ী

    মেই ট্রান্সক্রাইব ওয়ান অ্যাজুর ফাস্টের চেয়ে ২.৫ গুণ দ্রুত ও ঘণ্টায় ০.৩৬ মার্কিন ডলার খরচ করতে হয় এই পরিষেবা পেতে।

    টিমস ও কোপাইলট

    নতুন সিরিজে ট্রান্সক্রাইব ওয়ান সংস্করণে রয়েছে কোপাইলটের ভয়েস মোড। বর্তমানে এটি কোপাইলটে অডিও এক্সপ্রেশন্স আর কোপাইলট পডকাস্ট প্ল্যাটফর্মে ব্যবহৃত হচ্ছে। মাইক্রোসফট টিমসে কথা বলতে ট্রান্সক্রিপশন সুবিধার জন্য এটি সক্রিয় করা হয়েছে।

    অন্যদিকে মিটিং আর্কাইভ, সাবটাইটেল তৈরি, পডকাস্ট ট্রান্সক্রিপশন করতেও এটি ব্যবহৃত হয়। ভয়েস ওয়ান মাত্র এক সেকেন্ডে ৬০ সেকেন্ডের অডিও তৈরি করতে সক্ষম।

    বিশেষজ্ঞরা বলছেন, মাইক্রোসফটের এমন উদ্ভাবন সত্যিকার অর্থেই এআইর জগতে ওপেনএআই আর গুগলের মতো টেক সংস্থাকে দারুণ প্রতিযোগিতার মুখোমুখি করবে।

    LEAVE A REPLY

    Please enter your comment!
    Please enter your name here

    জনপ্রিয়