علی‌بابا مدل جدید Qwen with Questions را منتشر کرد

علی‌بابا مدل زبانی بزرگ جدیدی به نام Qwen with Questions را معرفی کرده که در مقایسه با مدل o1-preview شرکت OpenAI، در بخش استدلال قوی‌تر است. به گزارش تک‌ناک، علی‌بابا مدل جدیدی از خانواده در حال گسترش Qwen خود به نام Qwen with Questions (QwQ) را منتشر کرده است. این مدل به‌عنوان رقیب اصلی مدل […]


علی‌بابا مدل زبانی بزرگ جدیدی به نام Qwen with Questions را معرفی کرده که در مقایسه با مدل o1-preview شرکت OpenAI، در بخش استدلال قوی‌تر است.

به گزارش تک‌ناک، علی‌بابا مدل جدیدی از خانواده در حال گسترش Qwen خود به نام Qwen with Questions (QwQ) را منتشر کرده است. این مدل به‌عنوان رقیب اصلی مدل استدلالیo1 شرکت OpenAI معرفی شده است. در‌حال‌حاضر، مدل جدید علی‌بابا در حالت پیش‌نمایش قرار دارد و پیش‌بینی می‌شود که نسخه‌های بهبودیافته‌تری از آن در آینده منتشر شود.

ویژگی‌های خاص Qwen with Questions علی‌بابا

ونچربیت می‌نویسد که مدل QwQ مانند سایر مدل‌های بزرگ استدلالی (LRM) از منابع پردازشی اضافی در زمان استنباط استفاده می‌کند. این منابع اضافی به مدل اجازه می‌دهند تا پاسخ‌های خود را بازبینی و خطاهای احتمالی را اصلاح کند. این ویژگی باعث می‌شود QwQ در انجام وظایف نیازمند به استدلال منطقی و برنامه‌ریزی مانند حل مسائل ریاضی و برنامه‌نویسی، کارایی بیشتری داشته باشد.

نتایج آزمایش‌ها

طبق آزمایش‌ها، مدل QwQ در مقایسه با مدل o1-preview از OpenAI در معیارهای مختلف عملکرد بهتری از خود نشان داده است. این مدل در ارزیابی‌های AIME و MATH که توانایی‌های مدل در حل مسائل ریاضی را بررسی می‌کند، از o1-preview پیشی گرفته است. در معیار GPQA که برای سنجش استدلال علمی طراحی شده، QwQ توانسته است از مدل o1-mini نیز عملکرد بهتری داشته باشد. با‌این‌حال، در آزمون‌های LiveCodeBench که به ارزیابی مهارت‌های برنامه‌نویسی اختصاص دارد، مدل QwQ از o1 ضعیف‌تر عمل می‌کند؛ اما هنوز‌هم از سایر مدل‌های پیشرفته مانند GPT-4o و Claude 3.5 Sonnet بهتر است.

مزایای منبع‌باز و مجوز تجاری

برخلاف مدل‌های مشابه مانند o1 که توسط OpenAI منتشر شده‌اند، علی‌بابا مدل QwQ را به‌صورت منبع‌باز در اختیار عموم قرار داده است. این یعنی توسعه‌دهندگان و پژوهشگران می‌توانند کد و فرایندهای داخلی مدل را مشاهده کنند و از آن برای بهبود و گسترش آن استفاده کنند. این مدل تحت مجوز Apache 2.0 نیز منتشر شده است و این یعنی می‌توان از آن برای اهداف تجاری نیز بهره برد.

ویژگی‌های خاص QwQ علی‌بابا: مدل استدلالی با قابلیت اصلاح خودکار

فرایند تفکر مدل؛ کشف لحظات تأمل

علی‌بابا با انتشار بیانیه‌ای مدل QwQ را معرفی کرده و فرایند تفکر آن را شرح داده است. طبق این بیانیه، هنگامی که به مدل زمان کافی برای تأمل و پرسش و بازتاب داده می‌شود، درک آن از مفاهیم پیچیده مانند ریاضیات و برنامه‌نویسی رشد می‌کند. به گفته تیم توسعه، این فرایند به بهبود چشمگیر در حل مسائل پیچیده و دستیابی به دستاوردهای بزرگ در این زمینه‌ها منجر می‌شود.

این توضیحات مشابه به روش‌های موجود در سایر مدل‌های استدلالی است که معمولاً با تولید توکن‌های بیشتر و بازبینی پاسخ‌های خود، تلاش می‌کنند تا اشتباهات را اصلاح کنند. مدل Marco-o1 که اخیراً علی‌بابا منتشر کرده است، از Monte Carlo Tree Search (MCTS) و خودبازتابی در زمان استنباط استفاده می‌کند تا شاخه‌های مختلف استدلال را ایجاد و بهترین پاسخ را انتخاب کند.

مدل Qwen with Questions علی‌بابا نیز با برخی محدودیت‌ها روبه‌رو است. علی‌بابا به مشکل ترکیب زبان‌ها و گیر‌کردن در حلقه‌های استدلال دایره‌ای اشاره کرده است. این مشکلات نشان‌دهنده نیاز به بهبود بیشتر درزمینه‌ پردازش زبان و استدلال در مدل‌های پیچیده است.

آینده مدل‌های استدلالی

انتشار مدل Qwen with Questions علی‌بابا در شرایطی رخ داده است که رقابت درزمینه مدل‌های استدلالی (LRM) در حال افزایش است. مدل o1 شرکت OpenAI به‌عنوان نقطه‌ عطفی در توسعه مدل‌های استدلالی شناخته می‌شود. به‌علاوه، مدل‌های دیگری مانند R1-Lite-Preview از آزمایشگاه DeepSeek و LLaVA-o1 که محققان چینی توسعه داده‌اند، به‌دنبال رقابت با o1 هستند. این مدل‌ها عمدتاً از استراتژی‌های استدلال در زمان استنباط برای بهبود عملکرد خود استفاده می‌کنند.

تمرکز بر مدل‌های بزرگ استدلالی در‌حالی صورت می‌گیرد که روند مقیاس‌بندی مدل‌های هوش مصنوعی با مشکلاتی مواجه شده است. طبق گزارش‌ها، آزمایشگاه‌های هوش مصنوعی مانند OpenAI و دیپ‌مایند گوگل با کاهش بازده در آموزش مدل‌های بزرگ روبه‌رو هستند. جمع‌آوری داده‌های باکیفیت برای آموزش مدل‌ها به‌دلیل محدودیت‌های موجود در دسترسی به داده‌های جدید و حجیم نیز پیچیده‌تر شده است.

در‌ این میان، استفاده از مقیاس استنباط در مدل‌های استدلالی می‌تواند راه‌حلی نوآورانه برای بهبود عملکرد نسل بعدی مدل‌های هوش مصنوعی باشد. گزارش‌ها حاکی از آن است که OpenAI از مدل o1 برای تولید داده‌های استدلال مصنوعی به‌منظور آموزش نسل‌های بعدی مدل‌های خود استفاده می‌کند.

انتشار مدل Qwen with Questions علی‌بابا نشان‌دهنده گام جدیدی در رقابت میان مدل‌های استدلالی است. با توجه به قابلیت‌های منحصر‌به‌فرد این مدل در بهبود فرایند استدلال و رفع خطاها، پیش‌بینی می‌شود که رقابت در این زمینه در آینده نزدیک شدت بیشتری پیدا کند. این مدل همراه با سایر مدل‌های مشابه، می‌تواند تحولی در راه‌حل‌های هوش مصنوعی و آینده استدلال مصنوعی ایجاد کند.



منبع: تکنک