تصویرسازی هوش مصنوعی از خیابان‌ها با گوش دادن به صدای آنها

هر خیابانی صدای خاص خود را دارد که اکنون هوش مصنوعی می‌تواند از شنیدن آن برای تولید تصاویر آنها استفاده کند. به گزارش ایسنا، در حالی که هم اکنون مدل‌های هوش مصنوعی وجود دارند که جلوه‌های صوتی را برای مطابقت با تصاویر بی‌صدا از خیابان‌ها و مکان‌های دیگر تولید می‌کنند، یک فناوری جدید آزمایشی دقیقاً […]

هر خیابانی صدای خاص خود را دارد که اکنون هوش مصنوعی می‌تواند از شنیدن آن برای تولید تصاویر آنها استفاده کند.

به گزارش ایسنا، در حالی که هم اکنون مدل‌های هوش مصنوعی وجود دارند که جلوه‌های صوتی را برای مطابقت با تصاویر بی‌صدا از خیابان‌ها و مکان‌های دیگر تولید می‌کنند، یک فناوری جدید آزمایشی دقیقاً برعکس عمل می‌کند و تصاویر را با دقت عجیبی از صدای خیابان‌ها تولید می‌کند.

به نقل از نیو اطلس، پروفسور یوهائو کانگ و همکارانش از دانشگاه تگزاس در آستین، یک مدل تبدیل صدا به تصویر را بر روی مجموعه داده‌ای از کلیپ‌های صوتی و تصویری ۱۰ ثانیه‌ای آموزش داده‌اند.

این کلیپ‌ها شامل تصاویر ثابت و صدای محیطی بود که از ویدیوهای یوتیوب از خیابان‌های شهری و روستایی در آمریکای شمالی، آسیا و اروپا گرفته شده بود.

این سیستم با استفاده از الگوریتم‌های یادگیری عمیق، نه تنها یاد گرفت که کدام صداها با کدام موارد درون تصاویر مطابقت دارند، بلکه همچنین تشخیص داد که کیفیت صدا با کدام محیط بصری مطابقت دارد.

هنگامی که آموزش این سیستم کامل شد، هوش مصنوعی وظیفه تولید تصاویر را بر اساس صدای محیطی ضبط شده از ۱۰۰ کلیپ دیگر که از خیابان‌ها ضبط شده بود، بر عهده گرفت و برای هر ویدیو یک تصویر تولید کرد.

متعاقباً گروهی از داوران انسانی هر یک از آن تصاویر را در کنار دو تصویر تولید شده از خیابان‌های دیگر مشاهده کردند، در حالی که به صدای ویدیویی که تصویر بر اساس آن ساخته شده بود، گوش می‌دادند. وقتی از آنها خواسته شد که تشخیص دهند کدام یک از این سه تصویر با موسیقی متن مطابقت دارد و آنها به طور متوسط با ۸۰ درصد دقت تواستند تشخیص دهند.

علاوه بر این، هنگامی که تصاویر تولید شده توسط رایانه تجزیه و تحلیل شد، تصاویر تولید شده از آسمان، فضای سبز و ساختمان‌ها به شدت با تصاویر واقعی موجود در ویدئوهای اصلی مرتبط بود.

در واقع در بسیاری از موارد، تصاویر تولید شده، شرایط نوری ویدئوهای منبع، مانند آسمان آفتابی، ابری یا شبانه را نیز منعکس می‌کردند. این ممکن است با عواملی مانند کاهش صدای ترافیک در شب یا صدای حشرات شبانه امکان‌پذیر شده باشد.

اگرچه این فناوری می‌تواند کاربردهایی مانند دریافت یک ایده تقریبی از محل ضبط صدا در پزشکی قانونی داشته باشد، اما هدف این مطالعه بیشتر بررسی این است که چگونه صدا به حس مکان ما کمک می‌کند.

دانشمندان این مطالعه می‌گویند: نتایج می‌تواند دانش ما را در مورد تأثیر ادراکات دیداری و شنیداری بر سلامت روان انسان افزایش دهد و همچنین ممکن است شیوه‌های طراحی شهری را بهینه کند و کیفیت کلی زندگی در جوامع را بهبود بخشد.

این مطالعه در مجله Nature منتشر شده است.

انتهای پیام

Source link

ارسال : jamnews

برچسب ها

این مطلب بدون برچسب می باشد.

دستیابی دانش‌بنیان‌ها به دانش فنی تولید پودرهای فلزی با خلوص ۹۹.۹ درصد برای قطعه‌سازی

گروه تحقیق و توسعه یکی از شرکت‌های دانش‌بنیان به دانش فنی تولید پودرهای فلزی برای کاربرد در قطعه‌سازی و الکترودسازی دست یافتند. پارسا بیریائی، عضو تیم تحقیق و توسعه این شرکت‌ دانش بنیان در گفت‌وگو با ایسنا، گفت: محصولات تولیدی این شرکت، پودرهای بر پایه فلز با درصد خلوص بیش از ۹۹.۹ درصد به روش […]

با این برنامه آیفون را برای شناسایی جاسوس‌افزار پگاسوس اسکن کنید

به‌تازگی اپلیکیشنی منتشر شده است که امکان می‌دهد تا با هزینه‌ی یک دلار، گوشی آیفون را به‌طور منظم برای شناسایی بدافزار Pegasus اسکن کنید؛ بدافزاری که می‌تواند تقریباً به تمام داده‌های گوشی دسترسی پیدا کند. گروه NSO جاسوس‌افزاری به نام پگاسوس تولید می‌کند. این شرکت آسیب‌پذیری‌های به‌اصطلاح روز صفر که برای اپل ناشناخته هستند، از […]

شرکت OpenAI دوره ۱۲ روزه معرفی محصولات جدید خود را با نام “Shipmas” آغاز می‌کند

شرکت OpenAI در یک دوره ۱۲ روزه، نوآوری‌های نوینی از جمله مدل ویدیویی Sora و یک مدل استدلالی جدید را معرفی خواهد کرد. به گزارش تکناک، این شرکت با این رویداد پرشور، قصد دارد پیشرفت‌های چشمگیری در حوزه هوش مصنوعی را به نمایش بگذارد و آینده این فناوری را شکل دهد. شرکت OpenAI، استارتاپ پیشرو […]

احیای ایده Touch Bar با Flexbar برای اپل دوباره مطرح شد

گروهی از مهندسان با معرفی Flexbar، به ایده نوار لمسی محبوب اپل، Touch Bar، جان تازه‌ای بخشیده‌اند. به گزارش سرویس اخبار فناوری رسانه تکنولوژی تکنا، Flexbar که در واقع نسخه‌ای مستقل و قابل حمل از نوار لمسی مک‌بوک پرو است، می‌تواند از طریق USB به انواع دستگاه‌ها از جمله کامپیوترهای رومیزی، لپ‌تاپ‌ها و حتی تبلت‌ها […]

تصویرسازی هوش مصنوعی از خیابان‌ها با گوش دادن به صدای آنها

نوشته های مشابه

دستیابی دانش‌بنیان‌ها به دانش فنی تولید پودرهای فلزی با خلوص ۹۹.۹ درصد برای قطعه‌سازی

با این برنامه آیفون را برای شناسایی جاسوس‌افزار پگاسوس اسکن کنید

شرکت OpenAI دوره ۱۲ روزه معرفی محصولات جدید خود را با نام “Shipmas” آغاز می‌کند

احیای ایده Touch Bar با Flexbar برای اپل دوباره مطرح شد

ارسال دیدگاه

ویژه خبری

دفاع مقدس نقاط مختلف این حادثه ارزشمند را برجسته کرد

فساد گسترده در کشور مربوط به یک جناح خاص نیست

راه‌آهن “چابهار ـ زاهدان” منطقه را متحول می کند

پیشرفت‌های ایران دوست و دشمن را متعجب کرده است

سیـاسی

دفاع مقدس نقاط مختلف این حادثه ارزشمند را برجسته کرد

ترامپ حاکمیت اسرائیل بر کرانه باختری را اعمال خواهد کرد

مردم دست به‌ دست هم دهند، مردم‌سالاری تشکیل می‌شود

نقض قانون اساسی در بررسی لایحه بودجه در کمیسیون تلفیق!

اقتـصادی

راه‌آهن “چابهار ـ زاهدان” منطقه را متحول می کند

پذیرش بیماران کرونایی در قم افزایش یافت

نخستین گوجه‌فرنگی شبیه به انگور تولید شد

تصویب لایحه بودجه ۹۹ وضعیت معیشتی مردم را بدتر می‌کند

مذهـبی

تمدن نوین اسلامی با تکیه بر حرکت عظیم اربعین ممکن می‌شود

نصب حفاظی با ۳۶ متر طول، پیرامون حرم حضرت عباس (ع)

مجید مجیدی با حضور در مشهد با تولیت آستان قدس دیدار کرد

طرح جدید بانکداری به ربا رسمیت می‌بخشد

فرهنگـی

پیشرفت‌های ایران دوست و دشمن را متعجب کرده است

جامعیت آقای خامنه‌ای در هیچ یک از علمای اسلام نیست

جذب ۲۵ هزار نفر از معلمان حق التدریسی اجرایی خواهد شد

مراسم آغاز سال تحصیلی دانشگاه‌ها در دانشگاه تهران آغاز شد

اجـتماعی