نام کاربری یا نشانی ایمیل
رمز عبور
مرا به خاطر بسپار
اپل از همکاری جدید خود با انویدیا برای تسریع استنتاج مدلهای زبانی بزرگ با استفاده از فناوری منبع باز Recurrent Drafter (یا به اختصار ReDrafter) خبر داد. این همکاری به منظور حل چالشهای محاسباتی در تولید توکنهای خودکار طراحی شده است که نقش مهمی در بهبود کارایی و کاهش تاخیر در برنامههای کاربردی LLM (مدلهای […]
اپل از همکاری جدید خود با انویدیا برای تسریع استنتاج مدلهای زبانی بزرگ با استفاده از فناوری منبع باز Recurrent Drafter (یا به اختصار ReDrafter) خبر داد. این همکاری به منظور حل چالشهای محاسباتی در تولید توکنهای خودکار طراحی شده است که نقش مهمی در بهبود کارایی و کاهش تاخیر در برنامههای کاربردی LLM (مدلهای زبانی بزرگ) دارند.
به گزارش سرویس رسانه اخبار فناوری تکنا، فناوری ReDrafter که اپل آن را در نوامبر ۲۰۲۴ معرفی کرد، با استفاده از مدل پیشنویس شبکه عصبی بازگشتی (RNN)، جستجوی پرتویی و توجه پویای درخت، رویکردی مبتنی بر رمزگشایی احتمالی را اتخاذ میکند. بر اساس ارزیابیهای اپل، این روش توانسته است تا ۲.۷ برابر توکن بیشتری در ثانیه نسبت به روشهای سنتی تولید کند.
ReDrafter از طریق ادغام با چارچوب TensorRT-LLM انویدیا، امکان استنتاج سریعتر مدلهای زبانی بزرگ را بر روی پردازندههای گرافیکی انویدیا فراهم میآورد. این پردازندهها به طور گسترده در محیطهای تولید استفاده میشوند. برای سازگاری با الگوریتمهای ReDrafter، انویدیا عملگرهای جدیدی معرفی کرده و عملگرهای موجود را در TensorRT-LLM تنظیم کرده است. این فناوری اکنون برای توسعهدهندگانی که به دنبال بهینهسازی عملکرد مدلهای بزرگمقیاس هستند، در دسترس قرار گرفته است.
علاوه بر افزایش سرعت، اپل معتقد است که ReDrafter قادر به کاهش تاخیر برای کاربران است، در حالی که نیاز به GPU کمتری دارد. این بهبود کارایی نه تنها هزینههای محاسباتی را کاهش میدهد، بلکه مصرف انرژی را هم پایین میآورد. این ویژگیها برای سازمانهایی که به مدیریت استقرارهای هوش مصنوعی بزرگمقیاس مشغول هستند، حیاتی به شمار میآید.
اگرچه تمرکز این همکاری در حال حاضر بر روی زیرساختهای انویدیا است، اما احتمال دارد که در آینده مزایای مشابهی به GPUهای رقیب مانند AMD یا Intel نیز گسترش یابد.
انور لئون از مسئولان انویدیا، در این باره میگوید: «این همکاری باعث تقویت TensorRT-LLM شده و به جامعه LLM این امکان را میدهد که مدلهای پیچیدهتری را توسعه دهد و به راحتی آنها را با این پلتفرم مستقر کند. این ویژگیهای جدید امکانات جدیدی را ایجاد میکنند و ما منتظر نسل بعدی مدلهای پیشرفتهای هستیم که از قابلیتهای TensorRT-LLM بهرهمند خواهند شد.»
Source link
این مطلب بدون برچسب می باشد.
به گزارش خبرآنلاین، ین مقاله به معرفی شش بمبافکن در حال خدمت اختصاص دارد هرچند برخی از آنها به زودی جای خود را به نسل ششم بمبافکنهایی همچون B-21 رایدر امریکا و H-20 چین خواهند داد. B-52H استراتوفورتس به نقل از پدال، بی ۵۲ برد بلند در سال ۱۹۵۵ تولید و وارد ارتش آمریکا شده […]
هند بهطور روزافزون درحال اثبات توانمندیهای برنامهی فضایی قدرتمند خود است. روز پنجشنبه، دو ماهوارهی آزمایشی از سازمان پژوهشهای فضایی هند (ایسرو) با موفقیت در مدار زمین به یکدیگر متصل شدند و هند را به چهارمین کشوری تبدیل کردند که به توانایی پهلوگیری و اتصال فضایی دست پیدا میکند. سه کشور دیگر صاحب این فناوری، […]
مایکروسافت کاربران را وادار میکند تا بهروزرسانی اجباری نسخه 24H2 ویندوز ۱۱ را دریافت کنند. به گزارش تکناک، مایکروسافت بهروزرسانی اجباری به ویندوز ۱۱ نسخه 24H2 را شروع کرده است. این نسخه که از اول اکتبر ۲۰۲۴ منتشر شد، اکنون به مرحلهای رسیده که دستگاههای واجدشرایط دارای نسخههای 22H2 و 23H2 بهطور خودکار به نسخه […]
برای ورزشکاران حرفهای، انتخاب کفش ورزشی مناسب چیزی فراتر از یک خرید ساده است؛ این انتخاب میتواند عاملی تعیینکننده در عملکرد، راحتی و پیشگیری از آسیبهای ورزشی باشد. اما در میان انبوه گزینهها و برندهای موجود، پیدا کردن کفشی که تمامی این ویژگیها را داشته باشد، به چالشی جدی تبدیل شده است. امروزه با پیشرفت […]