نام کاربری یا نشانی ایمیل
رمز عبور
مرا به خاطر بسپار
هر خیابانی صدای خاص خود را دارد که اکنون هوش مصنوعی میتواند از شنیدن آن برای تولید تصاویر آنها استفاده کند. به گزارش ایسنا، در حالی که هم اکنون مدلهای هوش مصنوعی وجود دارند که جلوههای صوتی را برای مطابقت با تصاویر بیصدا از خیابانها و مکانهای دیگر تولید میکنند، یک فناوری جدید آزمایشی دقیقاً […]
هر خیابانی صدای خاص خود را دارد که اکنون هوش مصنوعی میتواند از شنیدن آن برای تولید تصاویر آنها استفاده کند.
به گزارش ایسنا، در حالی که هم اکنون مدلهای هوش مصنوعی وجود دارند که جلوههای صوتی را برای مطابقت با تصاویر بیصدا از خیابانها و مکانهای دیگر تولید میکنند، یک فناوری جدید آزمایشی دقیقاً برعکس عمل میکند و تصاویر را با دقت عجیبی از صدای خیابانها تولید میکند.
به نقل از نیو اطلس، پروفسور یوهائو کانگ و همکارانش از دانشگاه تگزاس در آستین، یک مدل تبدیل صدا به تصویر را بر روی مجموعه دادهای از کلیپهای صوتی و تصویری ۱۰ ثانیهای آموزش دادهاند.
این کلیپها شامل تصاویر ثابت و صدای محیطی بود که از ویدیوهای یوتیوب از خیابانهای شهری و روستایی در آمریکای شمالی، آسیا و اروپا گرفته شده بود.
این سیستم با استفاده از الگوریتمهای یادگیری عمیق، نه تنها یاد گرفت که کدام صداها با کدام موارد درون تصاویر مطابقت دارند، بلکه همچنین تشخیص داد که کیفیت صدا با کدام محیط بصری مطابقت دارد.
هنگامی که آموزش این سیستم کامل شد، هوش مصنوعی وظیفه تولید تصاویر را بر اساس صدای محیطی ضبط شده از ۱۰۰ کلیپ دیگر که از خیابانها ضبط شده بود، بر عهده گرفت و برای هر ویدیو یک تصویر تولید کرد.
متعاقباً گروهی از داوران انسانی هر یک از آن تصاویر را در کنار دو تصویر تولید شده از خیابانهای دیگر مشاهده کردند، در حالی که به صدای ویدیویی که تصویر بر اساس آن ساخته شده بود، گوش میدادند. وقتی از آنها خواسته شد که تشخیص دهند کدام یک از این سه تصویر با موسیقی متن مطابقت دارد و آنها به طور متوسط با ۸۰ درصد دقت تواستند تشخیص دهند.
علاوه بر این، هنگامی که تصاویر تولید شده توسط رایانه تجزیه و تحلیل شد، تصاویر تولید شده از آسمان، فضای سبز و ساختمانها به شدت با تصاویر واقعی موجود در ویدئوهای اصلی مرتبط بود.
در واقع در بسیاری از موارد، تصاویر تولید شده، شرایط نوری ویدئوهای منبع، مانند آسمان آفتابی، ابری یا شبانه را نیز منعکس میکردند. این ممکن است با عواملی مانند کاهش صدای ترافیک در شب یا صدای حشرات شبانه امکانپذیر شده باشد.
اگرچه این فناوری میتواند کاربردهایی مانند دریافت یک ایده تقریبی از محل ضبط صدا در پزشکی قانونی داشته باشد، اما هدف این مطالعه بیشتر بررسی این است که چگونه صدا به حس مکان ما کمک میکند.
دانشمندان این مطالعه میگویند: نتایج میتواند دانش ما را در مورد تأثیر ادراکات دیداری و شنیداری بر سلامت روان انسان افزایش دهد و همچنین ممکن است شیوههای طراحی شهری را بهینه کند و کیفیت کلی زندگی در جوامع را بهبود بخشد.
این مطالعه در مجله Nature منتشر شده است.
انتهای پیام
Source link
این مطلب بدون برچسب می باشد.
گروه تحقیق و توسعه یکی از شرکتهای دانشبنیان به دانش فنی تولید پودرهای فلزی برای کاربرد در قطعهسازی و الکترودسازی دست یافتند. پارسا بیریائی، عضو تیم تحقیق و توسعه این شرکت دانش بنیان در گفتوگو با ایسنا، گفت: محصولات تولیدی این شرکت، پودرهای بر پایه فلز با درصد خلوص بیش از ۹۹.۹ درصد به روش […]
بهتازگی اپلیکیشنی منتشر شده است که امکان میدهد تا با هزینهی یک دلار، گوشی آیفون را بهطور منظم برای شناسایی بدافزار Pegasus اسکن کنید؛ بدافزاری که میتواند تقریباً به تمام دادههای گوشی دسترسی پیدا کند. گروه NSO جاسوسافزاری به نام پگاسوس تولید میکند. این شرکت آسیبپذیریهای بهاصطلاح روز صفر که برای اپل ناشناخته هستند، از […]
شرکت OpenAI در یک دوره ۱۲ روزه، نوآوریهای نوینی از جمله مدل ویدیویی Sora و یک مدل استدلالی جدید را معرفی خواهد کرد. به گزارش تکناک، این شرکت با این رویداد پرشور، قصد دارد پیشرفتهای چشمگیری در حوزه هوش مصنوعی را به نمایش بگذارد و آینده این فناوری را شکل دهد. شرکت OpenAI، استارتاپ پیشرو […]
گروهی از مهندسان با معرفی Flexbar، به ایده نوار لمسی محبوب اپل، Touch Bar، جان تازهای بخشیدهاند. به گزارش سرویس اخبار فناوری رسانه تکنولوژی تکنا، Flexbar که در واقع نسخهای مستقل و قابل حمل از نوار لمسی مکبوک پرو است، میتواند از طریق USB به انواع دستگاهها از جمله کامپیوترهای رومیزی، لپتاپها و حتی تبلتها […]