«انویدیا» از هوش مصنوعی رونمایی کرد که به پیام متنی صدا می‌بخشد

شرکت انویدیا مدل جدید هوش مصنوعی خود موسوم به «فوگاتو»(Fugatto) را معرفی کرد که می‌تواند به پیام‌های متنی، صدا ببخشد. این مدل همچنین می‌تواند فایل‌های صوتی موجود را تغییر دهد. به گزارش ایسنا، شرکت انویدیا(NVIDIA) یک مدل آزمایشی جدید هوش مصنوعی مولد را معرفی کرده است که آن را به عنوان مدل هوش مصنوعی همه‌کاره […]

شرکت انویدیا مدل جدید هوش مصنوعی خود موسوم به «فوگاتو»(Fugatto) را معرفی کرد که می‌تواند به پیام‌های متنی، صدا ببخشد. این مدل همچنین می‌تواند فایل‌های صوتی موجود را تغییر دهد.

به گزارش ایسنا، شرکت انویدیا(NVIDIA) یک مدل آزمایشی جدید هوش مصنوعی مولد را معرفی کرده است که آن را به عنوان مدل هوش مصنوعی همه‌کاره در حوزه صوت و صدا توصیف می‌کند.

به نقل از انگجت، این مدل با نام کامل Foundational Generative Audio Transformer Opus 1 به اختصار فوگاتو(Fugatto) نامیده می‌شود و می‌تواند دستورات را از پیام‌های متنی دریافت کند و از آنها برای ایجاد آهنگ یا تغییر موسیقی، صدا و فایل‌های صوتی موجود استفاده کند.

این مدل توسط گروهی از محققان هوش مصنوعی از سراسر جهان طراحی شده است و انویدیا می‌گوید که «قابلیت‌های چند لهجه‌ای و چند زبانه» آن را قوی‌تر کرده است.

رافائل واله(Rafael Valle) یکی از محققان این پروژه و مدیر تحقیقات صوتی کاربردی در انویدیا می‌گوید: ما می‌خواستیم مدلی بسازیم که صدا را مانند انسان‌ها درک و تولید کند.

انویدیا برخی از سناریوهای احتمالی در دنیای واقعی را فهرست کرده است که در آن «فوگاتو» می‌تواند در کارهای خود از آن استفاده کند. به عنوان مثال، تولیدکنندگان موسیقی می‌توانند از این فناوری برای تولید سریع یک نمونه اولیه برای یک ایده آهنگ استفاده کنند که سپس می‌توانند به راحتی آن را ویرایش کنند تا سبک‌ها، صداها و سازهای مختلف را امتحان کنند.

عموم مردم نیز می‌توانند از آن برای تولید محتواهای مربوط به ابزارهای یادگیری زبان با صدای دلخواه خود استفاده کنند و توسعه‌دهندگان بازی‌های ویدیوئی هم می‌توانند از آن برای ایجاد تغییراتی از محتواهای از پیش ضبط‌شده برای متناسب کردن تغییرات در بازی بر اساس انتخاب‌ها و اقدامات بازیکنان استفاده کنند.

علاوه بر این، محققان دریافتند که این مدل می‌تواند وظایفی را که بخشی از پیش‌آموزش آن نیست، با برخی تنظیمات دقیق انجام دهد. این مدل می‌تواند دستورالعمل‌هایی را که به طور جداگانه بر روی آنها آموزش داده شده است، ترکیب کند. مانند تولید گفتاری که با لهجه‌ای خاص عصبانی به نظر می‌رسد یا صدای آواز پرندگان در حین وقوع یک طوفان و رعد و برق.

این مدل همچنین می‌تواند صداهایی تولید کند که در طول زمان تغییر می‌کنند، مانند تغییر صدای بارش یک باران طوفانی.

انویدیا هنوز اعلام نکرده است که آیا امکان دسترسی عمومی به فوگاتو را فراهم می‌کند یا خیر، اما این مدل اولین فناوری هوش مصنوعی مولد نیست که می‌تواند اصوات و صداها را از پیام‌های متنی ایجاد کند.

شرکت متا قبلا یک هوش مصنوعی منبع‌باز منتشر کرده است که می‌تواند صداها را از توضیحات متنی ایجاد کند. گوگل نیز دارای هوش مصنوعی تبدیل متن به موسیقی خود به نام MusicLM است که افراد می‌توانند از طریق وب‌سایت AI Test Kitchen به آن دسترسی داشته باشند.

انتهای پیام

Source link

ارسال : jamnews

برچسب ها

این مطلب بدون برچسب می باشد.

سیستم عملیات از راه دور برای تاکسی‌های رباتیک «تسلا» راه‌اندازی می‌شود

همان طور که شرکت «تسلا» برای راه‌اندازی یک سرویس تاکسی رباتیک در سال‌های آینده آماده می‌شود، به نظر می‌رسد در حال ایجاد یک گروه عملیات از راه دور است. به گزارش ایسنا، فهرست مشاغل اخیر شرکت «تسلا»(Tesla) نشان‌ می‌دهد این شرکت در حال استخدام مهندس نرم‌افزار برای کمک به توسعه یک سیستم عملیات از راه […]

ویدیو/ آیا خودروهای برقی در ایران آینده‌ای روشن خواهند داشت؟

صنعت خودرو با همه فراز ‌و فرودهایش همچنان پیشتاز است و غول‌های خودروسازی برای تسخیر بازارهای جهانی با عرضه خودروهای مجهز به فناوری‌های نوین رقابتی تنگاتنگ دارند. ایران هم برای استفاده از خودروهای برقی پیش‌قدم شده تا از مزایای خودروهای برقی بی‌بهره نماند. خبرنگار: مریم همتی / گوینده: جهانگیر داداش‌زاده / تدوینگر: محمدرضا زمانیان Source […]

شاسی‌بلند آئودی Q5 Sportback 2025 معرفی شد؛ طراحی جذاب و موتور ۶ سیلندر ۳۶۲ اسب‌بخاری

آئودی با معرفی نسل جدید Q5 اسپرت‌بک ۲۰۲۵، باردیگر استانداردهای جدیدی را در کلاس کراس‌اورهای لوکس اسپرت تعیین کرد. این خودرو که رقیبی سرسخت برای مرسدس‌بنز GLC کوپه و بی‌ام‌و X4 محسوب می‌شود، با طراحی جذاب و عملکرد قدرتمند و فناوری‌های پیشرفته خود توانسته است توجه بسیاری از علاقه‌مندان به خودرو را به خود جلب […]

«انویدیا» از هوش مصنوعی رونمایی کرد که به پیام متنی صدا می‌بخشد

نوشته های مشابه

صفحهٔ درخواستی شما یافت نشد.

سیستم عملیات از راه دور برای تاکسی‌های رباتیک «تسلا» راه‌اندازی می‌شود

ویدیو/ آیا خودروهای برقی در ایران آینده‌ای روشن خواهند داشت؟

شاسی‌بلند آئودی Q5 Sportback 2025 معرفی شد؛ طراحی جذاب و موتور ۶ سیلندر ۳۶۲ اسب‌بخاری

ارسال دیدگاه

ویژه خبری

دفاع مقدس نقاط مختلف این حادثه ارزشمند را برجسته کرد

فساد گسترده در کشور مربوط به یک جناح خاص نیست

راه‌آهن “چابهار ـ زاهدان” منطقه را متحول می کند

پیشرفت‌های ایران دوست و دشمن را متعجب کرده است

سیـاسی

دفاع مقدس نقاط مختلف این حادثه ارزشمند را برجسته کرد

ترامپ حاکمیت اسرائیل بر کرانه باختری را اعمال خواهد کرد

مردم دست به‌ دست هم دهند، مردم‌سالاری تشکیل می‌شود

نقض قانون اساسی در بررسی لایحه بودجه در کمیسیون تلفیق!

اقتـصادی

راه‌آهن “چابهار ـ زاهدان” منطقه را متحول می کند

پذیرش بیماران کرونایی در قم افزایش یافت

نخستین گوجه‌فرنگی شبیه به انگور تولید شد

تصویب لایحه بودجه ۹۹ وضعیت معیشتی مردم را بدتر می‌کند

مذهـبی

تمدن نوین اسلامی با تکیه بر حرکت عظیم اربعین ممکن می‌شود

نصب حفاظی با ۳۶ متر طول، پیرامون حرم حضرت عباس (ع)

مجید مجیدی با حضور در مشهد با تولیت آستان قدس دیدار کرد

طرح جدید بانکداری به ربا رسمیت می‌بخشد

فرهنگـی

پیشرفت‌های ایران دوست و دشمن را متعجب کرده است

جامعیت آقای خامنه‌ای در هیچ یک از علمای اسلام نیست

جذب ۲۵ هزار نفر از معلمان حق التدریسی اجرایی خواهد شد

مراسم آغاز سال تحصیلی دانشگاه‌ها در دانشگاه تهران آغاز شد

اجـتماعی