«انویدیا» از هوش مصنوعی رونمایی کرد که به پیام متنی صدا می‌بخشد

شرکت انویدیا مدل جدید هوش مصنوعی خود موسوم به «فوگاتو»(Fugatto) را معرفی کرد که می‌تواند به پیام‌های متنی، صدا ببخشد. این مدل همچنین می‌تواند فایل‌های صوتی موجود را تغییر دهد. به گزارش ایسنا، شرکت انویدیا(NVIDIA) یک مدل آزمایشی جدید هوش مصنوعی مولد را معرفی کرده است که آن را به عنوان مدل هوش مصنوعی همه‌کاره […]

شرکت انویدیا مدل جدید هوش مصنوعی خود موسوم به «فوگاتو»(Fugatto) را معرفی کرد که می‌تواند به پیام‌های متنی، صدا ببخشد. این مدل همچنین می‌تواند فایل‌های صوتی موجود را تغییر دهد.

به گزارش ایسنا، شرکت انویدیا(NVIDIA) یک مدل آزمایشی جدید هوش مصنوعی مولد را معرفی کرده است که آن را به عنوان مدل هوش مصنوعی همه‌کاره در حوزه صوت و صدا توصیف می‌کند.

به نقل از انگجت، این مدل با نام کامل Foundational Generative Audio Transformer Opus 1 به اختصار فوگاتو(Fugatto) نامیده می‌شود و می‌تواند دستورات را از پیام‌های متنی دریافت کند و از آنها برای ایجاد آهنگ یا تغییر موسیقی، صدا و فایل‌های صوتی موجود استفاده کند.

این مدل توسط گروهی از محققان هوش مصنوعی از سراسر جهان طراحی شده است و انویدیا می‌گوید که «قابلیت‌های چند لهجه‌ای و چند زبانه» آن را قوی‌تر کرده است.

رافائل واله(Rafael Valle) یکی از محققان این پروژه و مدیر تحقیقات صوتی کاربردی در انویدیا می‌گوید: ما می‌خواستیم مدلی بسازیم که صدا را مانند انسان‌ها درک و تولید کند.

انویدیا برخی از سناریوهای احتمالی در دنیای واقعی را فهرست کرده است که در آن «فوگاتو» می‌تواند در کارهای خود از آن استفاده کند. به عنوان مثال، تولیدکنندگان موسیقی می‌توانند از این فناوری برای تولید سریع یک نمونه اولیه برای یک ایده آهنگ استفاده کنند که سپس می‌توانند به راحتی آن را ویرایش کنند تا سبک‌ها، صداها و سازهای مختلف را امتحان کنند.

عموم مردم نیز می‌توانند از آن برای تولید محتواهای مربوط به ابزارهای یادگیری زبان با صدای دلخواه خود استفاده کنند و توسعه‌دهندگان بازی‌های ویدیوئی هم می‌توانند از آن برای ایجاد تغییراتی از محتواهای از پیش ضبط‌شده برای متناسب کردن تغییرات در بازی بر اساس انتخاب‌ها و اقدامات بازیکنان استفاده کنند.

علاوه بر این، محققان دریافتند که این مدل می‌تواند وظایفی را که بخشی از پیش‌آموزش آن نیست، با برخی تنظیمات دقیق انجام دهد. این مدل می‌تواند دستورالعمل‌هایی را که به طور جداگانه بر روی آنها آموزش داده شده است، ترکیب کند. مانند تولید گفتاری که با لهجه‌ای خاص عصبانی به نظر می‌رسد یا صدای آواز پرندگان در حین وقوع یک طوفان و رعد و برق.

این مدل همچنین می‌تواند صداهایی تولید کند که در طول زمان تغییر می‌کنند، مانند تغییر صدای بارش یک باران طوفانی.

انویدیا هنوز اعلام نکرده است که آیا امکان دسترسی عمومی به فوگاتو را فراهم می‌کند یا خیر، اما این مدل اولین فناوری هوش مصنوعی مولد نیست که می‌تواند اصوات و صداها را از پیام‌های متنی ایجاد کند.

شرکت متا قبلا یک هوش مصنوعی منبع‌باز منتشر کرده است که می‌تواند صداها را از توضیحات متنی ایجاد کند. گوگل نیز دارای هوش مصنوعی تبدیل متن به موسیقی خود به نام MusicLM است که افراد می‌توانند از طریق وب‌سایت AI Test Kitchen به آن دسترسی داشته باشند.

انتهای پیام

Source link

ارسال : jamnews

برچسب ها

این مطلب بدون برچسب می باشد.

زن طبیعت‌گرد ردپاهایی از دوران ماقبل دایناسورها را در آلپ ایتالیا کشف کرد

زنی در آلپ ایتالیا، به‌طور تصادفی پرده از راز زیست‌بومی ۲۸۰ میلیون ساله برداشت. این کشف که شامل فسیل ردپاهای حیوانات، فسیل‌های گیاهی و حتی آثاری از قطرات باران بود، نگاه پژوهشگران را به یکی از قدیمی‌ترین زیست‌بوم‌های مربوط به دوران پیش از دایناسورها جلب کرد. داستان کشف قطعه‌ای از زیست‌بومی شگفت‌انگیز، از یک روز […]

نوبیا Z70 اولترا روانه بازارهای جهانی شد

نوبیا Z70 اولترا با نمایشگر اولد ۶/۸۵ اینچی با رزولوشن ۱.5K و نرخ نوسازی ۱۴۴ هرتز و تراشه اسنپدراگون ۸ الیت و حداکثر ۲۴ گیگابایت رم به بازارهای جهانی عرضه شد است که عملکردی روان و قدرتمند را تضمین می‌کند. به گزارش تک‌ناک، شرکت نوبیا که اوایل ماه جاری میلادی گوشی پرچم‌دار Z70 اولترا را […]

قایق برقی پرنده کاندیلا برای حمل گردشگران به دریاچه تاهو می‌رود

شرکت نوآور سوئدی Candela که در زمینه ساخت شناورهای برقی پرنده فعالیت می‌کند، اعلام کرده است که قایق مسافربری P-12 برای اولین بار به ایالات متحده می‌رود. این شناور با همکاری شرکت Fly Tahoe، زمان سفر گردشگران به استراحتگاه‌های اسکی دریاچه تاهو را به طور چشمگیری کاهش خواهد داد. به گزارش دپارتمان اخبار تکنولوژی رسانه […]

چهره ملکه تی بازسازی شد / مادربزرگ فرعون بزرگ

به گزارش خبرآنلاین، در این بازسازی، چشم، بینی و دهان را به تصویر اضافه و با ساختار استخوانی کاملاً سالم ملکه هماهنگ شده است. سپس مو، ابرو و مژه به تصویر افزوده و چهره‌ای زنده از این مومیایی خلق شده است. نتیجه نهایی، زنی با موهای بلند و تیره، چشمان درشت قهوه‌ای رنگ و پوستی […]

«انویدیا» از هوش مصنوعی رونمایی کرد که به پیام متنی صدا می‌بخشد

نوشته های مشابه

زن طبیعت‌گرد ردپاهایی از دوران ماقبل دایناسورها را در آلپ ایتالیا کشف کرد

نوبیا Z70 اولترا روانه بازارهای جهانی شد

قایق برقی پرنده کاندیلا برای حمل گردشگران به دریاچه تاهو می‌رود

چهره ملکه تی بازسازی شد / مادربزرگ فرعون بزرگ

ارسال دیدگاه

ویژه خبری

دفاع مقدس نقاط مختلف این حادثه ارزشمند را برجسته کرد

فساد گسترده در کشور مربوط به یک جناح خاص نیست

راه‌آهن “چابهار ـ زاهدان” منطقه را متحول می کند

پیشرفت‌های ایران دوست و دشمن را متعجب کرده است

سیـاسی

دفاع مقدس نقاط مختلف این حادثه ارزشمند را برجسته کرد

ترامپ حاکمیت اسرائیل بر کرانه باختری را اعمال خواهد کرد

مردم دست به‌ دست هم دهند، مردم‌سالاری تشکیل می‌شود

نقض قانون اساسی در بررسی لایحه بودجه در کمیسیون تلفیق!

اقتـصادی

راه‌آهن “چابهار ـ زاهدان” منطقه را متحول می کند

پذیرش بیماران کرونایی در قم افزایش یافت

نخستین گوجه‌فرنگی شبیه به انگور تولید شد

تصویب لایحه بودجه ۹۹ وضعیت معیشتی مردم را بدتر می‌کند

مذهـبی

تمدن نوین اسلامی با تکیه بر حرکت عظیم اربعین ممکن می‌شود

نصب حفاظی با ۳۶ متر طول، پیرامون حرم حضرت عباس (ع)

مجید مجیدی با حضور در مشهد با تولیت آستان قدس دیدار کرد

طرح جدید بانکداری به ربا رسمیت می‌بخشد

فرهنگـی

پیشرفت‌های ایران دوست و دشمن را متعجب کرده است

جامعیت آقای خامنه‌ای در هیچ یک از علمای اسلام نیست

جذب ۲۵ هزار نفر از معلمان حق التدریسی اجرایی خواهد شد

مراسم آغاز سال تحصیلی دانشگاه‌ها در دانشگاه تهران آغاز شد

اجـتماعی