علی‌بابا مدل جدید Qwen with Questions را منتشر کرد

علی‌بابا مدل زبانی بزرگ جدیدی به نام Qwen with Questions را معرفی کرده که در مقایسه با مدل o1-preview شرکت OpenAI، در بخش استدلال قوی‌تر است. به گزارش تک‌ناک، علی‌بابا مدل جدیدی از خانواده در حال گسترش Qwen خود به نام Qwen with Questions (QwQ) را منتشر کرده است. این مدل به‌عنوان رقیب اصلی مدل […]

علی‌بابا مدل زبانی بزرگ جدیدی به نام Qwen with Questions را معرفی کرده که در مقایسه با مدل o1-preview شرکت OpenAI، در بخش استدلال قوی‌تر است.

به گزارش تک‌ناک، علی‌بابا مدل جدیدی از خانواده در حال گسترش Qwen خود به نام Qwen with Questions (QwQ) را منتشر کرده است. این مدل به‌عنوان رقیب اصلی مدل استدلالیo1 شرکت OpenAI معرفی شده است. در‌حال‌حاضر، مدل جدید علی‌بابا در حالت پیش‌نمایش قرار دارد و پیش‌بینی می‌شود که نسخه‌های بهبودیافته‌تری از آن در آینده منتشر شود.

ویژگی‌های خاص Qwen with Questions علی‌بابا

ونچربیت می‌نویسد که مدل QwQ مانند سایر مدل‌های بزرگ استدلالی (LRM) از منابع پردازشی اضافی در زمان استنباط استفاده می‌کند. این منابع اضافی به مدل اجازه می‌دهند تا پاسخ‌های خود را بازبینی و خطاهای احتمالی را اصلاح کند. این ویژگی باعث می‌شود QwQ در انجام وظایف نیازمند به استدلال منطقی و برنامه‌ریزی مانند حل مسائل ریاضی و برنامه‌نویسی، کارایی بیشتری داشته باشد.

نتایج آزمایش‌ها

طبق آزمایش‌ها، مدل QwQ در مقایسه با مدل o1-preview از OpenAI در معیارهای مختلف عملکرد بهتری از خود نشان داده است. این مدل در ارزیابی‌های AIME و MATH که توانایی‌های مدل در حل مسائل ریاضی را بررسی می‌کند، از o1-preview پیشی گرفته است. در معیار GPQA که برای سنجش استدلال علمی طراحی شده، QwQ توانسته است از مدل o1-mini نیز عملکرد بهتری داشته باشد. با‌این‌حال، در آزمون‌های LiveCodeBench که به ارزیابی مهارت‌های برنامه‌نویسی اختصاص دارد، مدل QwQ از o1 ضعیف‌تر عمل می‌کند؛ اما هنوز‌هم از سایر مدل‌های پیشرفته مانند GPT-4o و Claude 3.5 Sonnet بهتر است.

مزایای منبع‌باز و مجوز تجاری

برخلاف مدل‌های مشابه مانند o1 که توسط OpenAI منتشر شده‌اند، علی‌بابا مدل QwQ را به‌صورت منبع‌باز در اختیار عموم قرار داده است. این یعنی توسعه‌دهندگان و پژوهشگران می‌توانند کد و فرایندهای داخلی مدل را مشاهده کنند و از آن برای بهبود و گسترش آن استفاده کنند. این مدل تحت مجوز Apache 2.0 نیز منتشر شده است و این یعنی می‌توان از آن برای اهداف تجاری نیز بهره برد.

ویژگی‌های خاص QwQ علی‌بابا: مدل استدلالی با قابلیت اصلاح خودکار

فرایند تفکر مدل؛ کشف لحظات تأمل

علی‌بابا با انتشار بیانیه‌ای مدل QwQ را معرفی کرده و فرایند تفکر آن را شرح داده است. طبق این بیانیه، هنگامی که به مدل زمان کافی برای تأمل و پرسش و بازتاب داده می‌شود، درک آن از مفاهیم پیچیده مانند ریاضیات و برنامه‌نویسی رشد می‌کند. به گفته تیم توسعه، این فرایند به بهبود چشمگیر در حل مسائل پیچیده و دستیابی به دستاوردهای بزرگ در این زمینه‌ها منجر می‌شود.

این توضیحات مشابه به روش‌های موجود در سایر مدل‌های استدلالی است که معمولاً با تولید توکن‌های بیشتر و بازبینی پاسخ‌های خود، تلاش می‌کنند تا اشتباهات را اصلاح کنند. مدل Marco-o1 که اخیراً علی‌بابا منتشر کرده است، از Monte Carlo Tree Search (MCTS) و خودبازتابی در زمان استنباط استفاده می‌کند تا شاخه‌های مختلف استدلال را ایجاد و بهترین پاسخ را انتخاب کند.

مدل Qwen with Questions علی‌بابا نیز با برخی محدودیت‌ها روبه‌رو است. علی‌بابا به مشکل ترکیب زبان‌ها و گیر‌کردن در حلقه‌های استدلال دایره‌ای اشاره کرده است. این مشکلات نشان‌دهنده نیاز به بهبود بیشتر درزمینه‌ پردازش زبان و استدلال در مدل‌های پیچیده است.

آینده مدل‌های استدلالی

انتشار مدل Qwen with Questions علی‌بابا در شرایطی رخ داده است که رقابت درزمینه مدل‌های استدلالی (LRM) در حال افزایش است. مدل o1 شرکت OpenAI به‌عنوان نقطه‌ عطفی در توسعه مدل‌های استدلالی شناخته می‌شود. به‌علاوه، مدل‌های دیگری مانند R1-Lite-Preview از آزمایشگاه DeepSeek و LLaVA-o1 که محققان چینی توسعه داده‌اند، به‌دنبال رقابت با o1 هستند. این مدل‌ها عمدتاً از استراتژی‌های استدلال در زمان استنباط برای بهبود عملکرد خود استفاده می‌کنند.

تمرکز بر مدل‌های بزرگ استدلالی در‌حالی صورت می‌گیرد که روند مقیاس‌بندی مدل‌های هوش مصنوعی با مشکلاتی مواجه شده است. طبق گزارش‌ها، آزمایشگاه‌های هوش مصنوعی مانند OpenAI و دیپ‌مایند گوگل با کاهش بازده در آموزش مدل‌های بزرگ روبه‌رو هستند. جمع‌آوری داده‌های باکیفیت برای آموزش مدل‌ها به‌دلیل محدودیت‌های موجود در دسترسی به داده‌های جدید و حجیم نیز پیچیده‌تر شده است.

در‌ این میان، استفاده از مقیاس استنباط در مدل‌های استدلالی می‌تواند راه‌حلی نوآورانه برای بهبود عملکرد نسل بعدی مدل‌های هوش مصنوعی باشد. گزارش‌ها حاکی از آن است که OpenAI از مدل o1 برای تولید داده‌های استدلال مصنوعی به‌منظور آموزش نسل‌های بعدی مدل‌های خود استفاده می‌کند.

انتشار مدل Qwen with Questions علی‌بابا نشان‌دهنده گام جدیدی در رقابت میان مدل‌های استدلالی است. با توجه به قابلیت‌های منحصر‌به‌فرد این مدل در بهبود فرایند استدلال و رفع خطاها، پیش‌بینی می‌شود که رقابت در این زمینه در آینده نزدیک شدت بیشتری پیدا کند. این مدل همراه با سایر مدل‌های مشابه، می‌تواند تحولی در راه‌حل‌های هوش مصنوعی و آینده استدلال مصنوعی ایجاد کند.

منبع: تکنک

ارسال : jamnews

برچسب ها

این مطلب بدون برچسب می باشد.

رنگ‌بندی گوشی‌های خانواده گلکسی S25 فاش شد

فاصله‌ی زیادی تا رونمایی از گلکسی S25 باقی نمانده است. تصاویر فاش‌شده از سینی سیم‌کارت گلکسی S25 و گلکسی S25 پلاس، رنگ‌بندی پرچمدار جدید کره‌ای‌ها را به‌نمایش می‌گذارند. بر اساس تصاویر فاش‌شده، می‌توان انتظار داشت که پرچمدارهای جدید سامسونگ در رنگ‌های سبز، مشکی، ارغوانی و آبی دردسترس قرار بگیرند. مشخص نیست آیا رنگ‌های دیگری نیز […]

متا کابل زیردریایی ۱۰ میلیارد دلاری برای پشتیبانی از ترافیک جهانی اینترنت می‌سازد

متا کابل زیردریایی به ارزش ۱۰ میلیارد دلار می‌سازد تا زیرساخت‌های ارتباطی‌اش را گسترش دهد و به ارائه خدمات بهتر و سریع‌تر به کاربران در سراسر جهان کمک کند. به گزارش تک‌ناک، متا قصد دارد کابل فیبرنوری زیردریایی با طول بیش از ۴۰,۰۰۰ کیلومتر بسازد که مسیر آن به‌طور کامل از ایالات متحده، هند، آفریقای‌جنوبی، […]

کلیه شهرهای بزرگ کشور با مشکل آب شرب مواجهند/به‌ جای انتقال پایتخت توزیع عادلانه شغل و درآمد صورت گیرد

مدیر بخش زلزله مرکز تحقیقات راه، مسکن و شهرسازی با اشاره به جاذبه‌های شهر تهران با بیان اینکه اگر در انتقال پایتخت به دنبال این هستیم که از جمعیت ۲۰ میلیون نفری از دماوند تا قزوین کاسته شود، محقق نخواهد شد، گفت: در حال حاضر میزان آلودگی هوا و ترافیک در کلان‌شهرهای اصفهان، اهواز، بندرعباس، […]

دست نانو؛ انقلابی در تشخیص و درمان ویروسی

محققان دانشگاه ایلینوی موفق به ساخت یک دست بسیار کوچک یا “نانوگیرنده” شده‌اند که می‌تواند در تشخیص و درمان بیماری‌هایی مانند کووید-۱۹ بسیار موثر باشد. این دست نانو که از یک رشته DNA تا شده ساخته شده است، قادر است ویروس‌ها را با دقت و سرعت بسیار بالا شناسایی کند و حتی از ورود آن‌ها […]

لینک کوتاه

لـیـنـک زیـر را کـپـی کـنـیـد !

https://jam.tamasnews.ir/?p=8187

ویژگی‌های خاص Qwen with Questions علی‌بابا

نتایج آزمایش‌ها

مزایای منبع‌باز و مجوز تجاری

فرایند تفکر مدل؛ کشف لحظات تأمل

آینده مدل‌های استدلالی

نوشته های مشابه

ارسال دیدگاه

ویژه خبری

سیـاسی

اقتـصادی

مذهـبی

فرهنگـی

اجـتماعی