نام کاربری یا نشانی ایمیل
رمز عبور
مرا به خاطر بسپار
اپل از همکاری جدید خود با انویدیا برای تسریع استنتاج مدلهای زبانی بزرگ با استفاده از فناوری منبع باز Recurrent Drafter (یا به اختصار ReDrafter) خبر داد. این همکاری به منظور حل چالشهای محاسباتی در تولید توکنهای خودکار طراحی شده است که نقش مهمی در بهبود کارایی و کاهش تاخیر در برنامههای کاربردی LLM (مدلهای […]
اپل از همکاری جدید خود با انویدیا برای تسریع استنتاج مدلهای زبانی بزرگ با استفاده از فناوری منبع باز Recurrent Drafter (یا به اختصار ReDrafter) خبر داد. این همکاری به منظور حل چالشهای محاسباتی در تولید توکنهای خودکار طراحی شده است که نقش مهمی در بهبود کارایی و کاهش تاخیر در برنامههای کاربردی LLM (مدلهای زبانی بزرگ) دارند.
به گزارش سرویس رسانه اخبار فناوری تکنا، فناوری ReDrafter که اپل آن را در نوامبر ۲۰۲۴ معرفی کرد، با استفاده از مدل پیشنویس شبکه عصبی بازگشتی (RNN)، جستجوی پرتویی و توجه پویای درخت، رویکردی مبتنی بر رمزگشایی احتمالی را اتخاذ میکند. بر اساس ارزیابیهای اپل، این روش توانسته است تا ۲.۷ برابر توکن بیشتری در ثانیه نسبت به روشهای سنتی تولید کند.
ReDrafter از طریق ادغام با چارچوب TensorRT-LLM انویدیا، امکان استنتاج سریعتر مدلهای زبانی بزرگ را بر روی پردازندههای گرافیکی انویدیا فراهم میآورد. این پردازندهها به طور گسترده در محیطهای تولید استفاده میشوند. برای سازگاری با الگوریتمهای ReDrafter، انویدیا عملگرهای جدیدی معرفی کرده و عملگرهای موجود را در TensorRT-LLM تنظیم کرده است. این فناوری اکنون برای توسعهدهندگانی که به دنبال بهینهسازی عملکرد مدلهای بزرگمقیاس هستند، در دسترس قرار گرفته است.
علاوه بر افزایش سرعت، اپل معتقد است که ReDrafter قادر به کاهش تاخیر برای کاربران است، در حالی که نیاز به GPU کمتری دارد. این بهبود کارایی نه تنها هزینههای محاسباتی را کاهش میدهد، بلکه مصرف انرژی را هم پایین میآورد. این ویژگیها برای سازمانهایی که به مدیریت استقرارهای هوش مصنوعی بزرگمقیاس مشغول هستند، حیاتی به شمار میآید.
اگرچه تمرکز این همکاری در حال حاضر بر روی زیرساختهای انویدیا است، اما احتمال دارد که در آینده مزایای مشابهی به GPUهای رقیب مانند AMD یا Intel نیز گسترش یابد.
انور لئون از مسئولان انویدیا، در این باره میگوید: «این همکاری باعث تقویت TensorRT-LLM شده و به جامعه LLM این امکان را میدهد که مدلهای پیچیدهتری را توسعه دهد و به راحتی آنها را با این پلتفرم مستقر کند. این ویژگیهای جدید امکانات جدیدی را ایجاد میکنند و ما منتظر نسل بعدی مدلهای پیشرفتهای هستیم که از قابلیتهای TensorRT-LLM بهرهمند خواهند شد.»
Source link
این مطلب بدون برچسب می باشد.
شیائومی در حال برنامهریزی برای عرضه گوشی هوشمندی با باتری قدرتمند ۷۵۰۰ میلیآمپرساعتی در سال ۲۰۲۵ است. به گزارش تکناک، شیائومی قصد دارد تا سال ۲۰۲۵ گوشی هوشمندی با باتری ۷۵۰۰ میلیآمپرساعتی روانه بازار کند. این خبر نشاندهنده پیشرفت غول فناوری چینی در استفاده از فناوری باتریهای سیلیکونکربنی است که به تولید گوشیهای سبکتر و […]
به گزارش خبرآنلاین، xDrive در واقع سیستم چهار چرخ محرک بی ام و است که باعث بهبود کشش و پایداری خودرو در شرایط مختلف رانندگی میشود. این سیستم سال ۲۰۰۳ و روی خودروهایی همچون X3 E83 و X5 E53 فیس لیفت معرفی شد هرچند در طول این سالها بهروزرسانیهای زیادی روی آن صورت گرفت تا […]
احتمالاً آدرس را اشتباه تایپ کردهاید. شما به طور خودکار به صفحهٔ اول هدایت خواهید شد. برای دسترسی سریعتر بر روی خانه یا جستجو کلیک کنید. Source link
Morning Brief بخشی از مجموعهی جدید هوش مصنوعی سامسونگ است که اطلاعات مربوطبه برنامههای منتخب صبح را جمعآوری میکند؛ اطلاعاتی مانند وضعیت آبوهوا و دادههای خواب، البته درصورتیکه از گجتهای پوشیدنی سامسونگ استفاده کنید. قابلیت مذکور احتمالاً بخشی از One UI 7 خواهد بود و به دستگاههای جدید سامسونگ محدود نمیشود. در ادامهی ویدیو، اولین […]