نام کاربری یا نشانی ایمیل
رمز عبور
مرا به خاطر بسپار
علیبابا مدل زبانی بزرگ جدیدی به نام Qwen with Questions را معرفی کرده که در مقایسه با مدل o1-preview شرکت OpenAI، در بخش استدلال قویتر است. به گزارش تکناک، علیبابا مدل جدیدی از خانواده در حال گسترش Qwen خود به نام Qwen with Questions (QwQ) را منتشر کرده است. این مدل بهعنوان رقیب اصلی مدل […]
علیبابا مدل زبانی بزرگ جدیدی به نام Qwen with Questions را معرفی کرده که در مقایسه با مدل o1-preview شرکت OpenAI، در بخش استدلال قویتر است.
به گزارش تکناک، علیبابا مدل جدیدی از خانواده در حال گسترش Qwen خود به نام Qwen with Questions (QwQ) را منتشر کرده است. این مدل بهعنوان رقیب اصلی مدل استدلالیo1 شرکت OpenAI معرفی شده است. درحالحاضر، مدل جدید علیبابا در حالت پیشنمایش قرار دارد و پیشبینی میشود که نسخههای بهبودیافتهتری از آن در آینده منتشر شود.
ونچربیت مینویسد که مدل QwQ مانند سایر مدلهای بزرگ استدلالی (LRM) از منابع پردازشی اضافی در زمان استنباط استفاده میکند. این منابع اضافی به مدل اجازه میدهند تا پاسخهای خود را بازبینی و خطاهای احتمالی را اصلاح کند. این ویژگی باعث میشود QwQ در انجام وظایف نیازمند به استدلال منطقی و برنامهریزی مانند حل مسائل ریاضی و برنامهنویسی، کارایی بیشتری داشته باشد.
طبق آزمایشها، مدل QwQ در مقایسه با مدل o1-preview از OpenAI در معیارهای مختلف عملکرد بهتری از خود نشان داده است. این مدل در ارزیابیهای AIME و MATH که تواناییهای مدل در حل مسائل ریاضی را بررسی میکند، از o1-preview پیشی گرفته است. در معیار GPQA که برای سنجش استدلال علمی طراحی شده، QwQ توانسته است از مدل o1-mini نیز عملکرد بهتری داشته باشد. بااینحال، در آزمونهای LiveCodeBench که به ارزیابی مهارتهای برنامهنویسی اختصاص دارد، مدل QwQ از o1 ضعیفتر عمل میکند؛ اما هنوزهم از سایر مدلهای پیشرفته مانند GPT-4o و Claude 3.5 Sonnet بهتر است.
برخلاف مدلهای مشابه مانند o1 که توسط OpenAI منتشر شدهاند، علیبابا مدل QwQ را بهصورت منبعباز در اختیار عموم قرار داده است. این یعنی توسعهدهندگان و پژوهشگران میتوانند کد و فرایندهای داخلی مدل را مشاهده کنند و از آن برای بهبود و گسترش آن استفاده کنند. این مدل تحت مجوز Apache 2.0 نیز منتشر شده است و این یعنی میتوان از آن برای اهداف تجاری نیز بهره برد.
علیبابا با انتشار بیانیهای مدل QwQ را معرفی کرده و فرایند تفکر آن را شرح داده است. طبق این بیانیه، هنگامی که به مدل زمان کافی برای تأمل و پرسش و بازتاب داده میشود، درک آن از مفاهیم پیچیده مانند ریاضیات و برنامهنویسی رشد میکند. به گفته تیم توسعه، این فرایند به بهبود چشمگیر در حل مسائل پیچیده و دستیابی به دستاوردهای بزرگ در این زمینهها منجر میشود.
این توضیحات مشابه به روشهای موجود در سایر مدلهای استدلالی است که معمولاً با تولید توکنهای بیشتر و بازبینی پاسخهای خود، تلاش میکنند تا اشتباهات را اصلاح کنند. مدل Marco-o1 که اخیراً علیبابا منتشر کرده است، از Monte Carlo Tree Search (MCTS) و خودبازتابی در زمان استنباط استفاده میکند تا شاخههای مختلف استدلال را ایجاد و بهترین پاسخ را انتخاب کند.
مدل Qwen with Questions علیبابا نیز با برخی محدودیتها روبهرو است. علیبابا به مشکل ترکیب زبانها و گیرکردن در حلقههای استدلال دایرهای اشاره کرده است. این مشکلات نشاندهنده نیاز به بهبود بیشتر درزمینه پردازش زبان و استدلال در مدلهای پیچیده است.
انتشار مدل Qwen with Questions علیبابا در شرایطی رخ داده است که رقابت درزمینه مدلهای استدلالی (LRM) در حال افزایش است. مدل o1 شرکت OpenAI بهعنوان نقطه عطفی در توسعه مدلهای استدلالی شناخته میشود. بهعلاوه، مدلهای دیگری مانند R1-Lite-Preview از آزمایشگاه DeepSeek و LLaVA-o1 که محققان چینی توسعه دادهاند، بهدنبال رقابت با o1 هستند. این مدلها عمدتاً از استراتژیهای استدلال در زمان استنباط برای بهبود عملکرد خود استفاده میکنند.
تمرکز بر مدلهای بزرگ استدلالی درحالی صورت میگیرد که روند مقیاسبندی مدلهای هوش مصنوعی با مشکلاتی مواجه شده است. طبق گزارشها، آزمایشگاههای هوش مصنوعی مانند OpenAI و دیپمایند گوگل با کاهش بازده در آموزش مدلهای بزرگ روبهرو هستند. جمعآوری دادههای باکیفیت برای آموزش مدلها بهدلیل محدودیتهای موجود در دسترسی به دادههای جدید و حجیم نیز پیچیدهتر شده است.
در این میان، استفاده از مقیاس استنباط در مدلهای استدلالی میتواند راهحلی نوآورانه برای بهبود عملکرد نسل بعدی مدلهای هوش مصنوعی باشد. گزارشها حاکی از آن است که OpenAI از مدل o1 برای تولید دادههای استدلال مصنوعی بهمنظور آموزش نسلهای بعدی مدلهای خود استفاده میکند.
انتشار مدل Qwen with Questions علیبابا نشاندهنده گام جدیدی در رقابت میان مدلهای استدلالی است. با توجه به قابلیتهای منحصربهفرد این مدل در بهبود فرایند استدلال و رفع خطاها، پیشبینی میشود که رقابت در این زمینه در آینده نزدیک شدت بیشتری پیدا کند. این مدل همراه با سایر مدلهای مشابه، میتواند تحولی در راهحلهای هوش مصنوعی و آینده استدلال مصنوعی ایجاد کند.
منبع: تکنک
این مطلب بدون برچسب می باشد.
گروه فولکسواگن ضمن بازنگری در رویکرد فروش خودرو های برقی خود در بازارهای اصلی اروپایی، میخواهد از مدل فروش مستقیم به مشتری (DTC) که الهامگرفته از استراتژی تسلا است، فاصله بگیرد و به شیوههای سنتیتر فروش روی بیاورد. دلایل تغییر رویکرد فولکسواگن، پیچیدگیهای موجود در اجرای مدل فروش مستقیم و کندی نرخ پذیرش خودروهای برقی […]
شیائومی قصد دارد تبلت گیمینگ با تراشه قدرتمند دیمنسیتی ۹۴۰۰ روانه بازار کند. این دستگاه به احتمال زیاد عضوی از تبلتهای سری ردمی خواهد بود. به گزارش تکناک، شیائومی بهزودی تبلت گیمینگ جدید خود را با پردازنده قدرتمند دیمنسیتی ۹۴۰۰رونمایی میکند. اطلاعات این محصول را دیجیتال چت استیشن اخیراً فاش کرده است. مشخصات اولیه و […]
تیمی بینالمللی از دانشمندان، در یک مطالعه جامع، موفق به کشف رازهای ژنتیکی گندم شدهاند. این دستاورد که در مجله معتبر Nature منتشر شده است، به ما درک عمیقتری از تکامل گندم و چگونگی سازگاری آن با محیطهای مختلف میدهد. به گزارش دپارتمان اخبار علمی رسانه فناوری تکنا، در این پژوهش دانشمندان موفق شدند ۱۷ […]
فاصلهی زیادی تا رونمایی از گلکسی S25 باقی نمانده است. تصاویر فاششده از سینی سیمکارت گلکسی S25 و گلکسی S25 پلاس، رنگبندی پرچمدار جدید کرهایها را بهنمایش میگذارند. بر اساس تصاویر فاششده، میتوان انتظار داشت که پرچمدارهای جدید سامسونگ در رنگهای سبز، مشکی، ارغوانی و آبی دردسترس قرار بگیرند. مشخص نیست آیا رنگهای دیگری نیز […]