علی‌بابا مدل جدید Qwen with Questions را منتشر کرد

علی‌بابا مدل زبانی بزرگ جدیدی به نام Qwen with Questions را معرفی کرده که در مقایسه با مدل o1-preview شرکت OpenAI، در بخش استدلال قوی‌تر است. به گزارش تک‌ناک، علی‌بابا مدل جدیدی از خانواده در حال گسترش Qwen خود به نام Qwen with Questions (QwQ) را منتشر کرده است. این مدل به‌عنوان رقیب اصلی مدل […]

علی‌بابا مدل زبانی بزرگ جدیدی به نام Qwen with Questions را معرفی کرده که در مقایسه با مدل o1-preview شرکت OpenAI، در بخش استدلال قوی‌تر است.

به گزارش تک‌ناک، علی‌بابا مدل جدیدی از خانواده در حال گسترش Qwen خود به نام Qwen with Questions (QwQ) را منتشر کرده است. این مدل به‌عنوان رقیب اصلی مدل استدلالیo1 شرکت OpenAI معرفی شده است. در‌حال‌حاضر، مدل جدید علی‌بابا در حالت پیش‌نمایش قرار دارد و پیش‌بینی می‌شود که نسخه‌های بهبودیافته‌تری از آن در آینده منتشر شود.

ویژگی‌های خاص Qwen with Questions علی‌بابا

ونچربیت می‌نویسد که مدل QwQ مانند سایر مدل‌های بزرگ استدلالی (LRM) از منابع پردازشی اضافی در زمان استنباط استفاده می‌کند. این منابع اضافی به مدل اجازه می‌دهند تا پاسخ‌های خود را بازبینی و خطاهای احتمالی را اصلاح کند. این ویژگی باعث می‌شود QwQ در انجام وظایف نیازمند به استدلال منطقی و برنامه‌ریزی مانند حل مسائل ریاضی و برنامه‌نویسی، کارایی بیشتری داشته باشد.

نتایج آزمایش‌ها

طبق آزمایش‌ها، مدل QwQ در مقایسه با مدل o1-preview از OpenAI در معیارهای مختلف عملکرد بهتری از خود نشان داده است. این مدل در ارزیابی‌های AIME و MATH که توانایی‌های مدل در حل مسائل ریاضی را بررسی می‌کند، از o1-preview پیشی گرفته است. در معیار GPQA که برای سنجش استدلال علمی طراحی شده، QwQ توانسته است از مدل o1-mini نیز عملکرد بهتری داشته باشد. با‌این‌حال، در آزمون‌های LiveCodeBench که به ارزیابی مهارت‌های برنامه‌نویسی اختصاص دارد، مدل QwQ از o1 ضعیف‌تر عمل می‌کند؛ اما هنوز‌هم از سایر مدل‌های پیشرفته مانند GPT-4o و Claude 3.5 Sonnet بهتر است.

مزایای منبع‌باز و مجوز تجاری

برخلاف مدل‌های مشابه مانند o1 که توسط OpenAI منتشر شده‌اند، علی‌بابا مدل QwQ را به‌صورت منبع‌باز در اختیار عموم قرار داده است. این یعنی توسعه‌دهندگان و پژوهشگران می‌توانند کد و فرایندهای داخلی مدل را مشاهده کنند و از آن برای بهبود و گسترش آن استفاده کنند. این مدل تحت مجوز Apache 2.0 نیز منتشر شده است و این یعنی می‌توان از آن برای اهداف تجاری نیز بهره برد.

ویژگی‌های خاص QwQ علی‌بابا: مدل استدلالی با قابلیت اصلاح خودکار

فرایند تفکر مدل؛ کشف لحظات تأمل

علی‌بابا با انتشار بیانیه‌ای مدل QwQ را معرفی کرده و فرایند تفکر آن را شرح داده است. طبق این بیانیه، هنگامی که به مدل زمان کافی برای تأمل و پرسش و بازتاب داده می‌شود، درک آن از مفاهیم پیچیده مانند ریاضیات و برنامه‌نویسی رشد می‌کند. به گفته تیم توسعه، این فرایند به بهبود چشمگیر در حل مسائل پیچیده و دستیابی به دستاوردهای بزرگ در این زمینه‌ها منجر می‌شود.

این توضیحات مشابه به روش‌های موجود در سایر مدل‌های استدلالی است که معمولاً با تولید توکن‌های بیشتر و بازبینی پاسخ‌های خود، تلاش می‌کنند تا اشتباهات را اصلاح کنند. مدل Marco-o1 که اخیراً علی‌بابا منتشر کرده است، از Monte Carlo Tree Search (MCTS) و خودبازتابی در زمان استنباط استفاده می‌کند تا شاخه‌های مختلف استدلال را ایجاد و بهترین پاسخ را انتخاب کند.

مدل Qwen with Questions علی‌بابا نیز با برخی محدودیت‌ها روبه‌رو است. علی‌بابا به مشکل ترکیب زبان‌ها و گیر‌کردن در حلقه‌های استدلال دایره‌ای اشاره کرده است. این مشکلات نشان‌دهنده نیاز به بهبود بیشتر درزمینه‌ پردازش زبان و استدلال در مدل‌های پیچیده است.

آینده مدل‌های استدلالی

انتشار مدل Qwen with Questions علی‌بابا در شرایطی رخ داده است که رقابت درزمینه مدل‌های استدلالی (LRM) در حال افزایش است. مدل o1 شرکت OpenAI به‌عنوان نقطه‌ عطفی در توسعه مدل‌های استدلالی شناخته می‌شود. به‌علاوه، مدل‌های دیگری مانند R1-Lite-Preview از آزمایشگاه DeepSeek و LLaVA-o1 که محققان چینی توسعه داده‌اند، به‌دنبال رقابت با o1 هستند. این مدل‌ها عمدتاً از استراتژی‌های استدلال در زمان استنباط برای بهبود عملکرد خود استفاده می‌کنند.

تمرکز بر مدل‌های بزرگ استدلالی در‌حالی صورت می‌گیرد که روند مقیاس‌بندی مدل‌های هوش مصنوعی با مشکلاتی مواجه شده است. طبق گزارش‌ها، آزمایشگاه‌های هوش مصنوعی مانند OpenAI و دیپ‌مایند گوگل با کاهش بازده در آموزش مدل‌های بزرگ روبه‌رو هستند. جمع‌آوری داده‌های باکیفیت برای آموزش مدل‌ها به‌دلیل محدودیت‌های موجود در دسترسی به داده‌های جدید و حجیم نیز پیچیده‌تر شده است.

در‌ این میان، استفاده از مقیاس استنباط در مدل‌های استدلالی می‌تواند راه‌حلی نوآورانه برای بهبود عملکرد نسل بعدی مدل‌های هوش مصنوعی باشد. گزارش‌ها حاکی از آن است که OpenAI از مدل o1 برای تولید داده‌های استدلال مصنوعی به‌منظور آموزش نسل‌های بعدی مدل‌های خود استفاده می‌کند.

انتشار مدل Qwen with Questions علی‌بابا نشان‌دهنده گام جدیدی در رقابت میان مدل‌های استدلالی است. با توجه به قابلیت‌های منحصر‌به‌فرد این مدل در بهبود فرایند استدلال و رفع خطاها، پیش‌بینی می‌شود که رقابت در این زمینه در آینده نزدیک شدت بیشتری پیدا کند. این مدل همراه با سایر مدل‌های مشابه، می‌تواند تحولی در راه‌حل‌های هوش مصنوعی و آینده استدلال مصنوعی ایجاد کند.

منبع: تکنک

ارسال : jamnews

برچسب ها

این مطلب بدون برچسب می باشد.

دردسر جدید فولکس‌واگن؛ توقف فروش مستقیم خودرو برقی به‌دلیل استقبال کم

گروه فولکس‌واگن ضمن بازنگری در رویکرد فروش خودرو های برقی خود در بازارهای اصلی اروپایی، می‌خواهد از مدل فروش مستقیم به مشتری (DTC) که الهام‌گرفته از استراتژی تسلا است، فاصله بگیرد و به شیوه‌های سنتی‌تر فروش روی بیاورد. دلایل تغییر رویکرد فولکس‌واگن، پیچیدگی‌های موجود در اجرای مدل فروش مستقیم و کندی نرخ پذیرش خودروهای برقی […]

شیائومی تبلت گیمینگ با پردازنده دیمنسیتی ۹۴۰۰ تولید خواهد کرد

شیائومی قصد دارد تبلت گیمینگ با تراشه قدرتمند دیمنسیتی ۹۴۰۰ روانه بازار کند. این دستگاه به احتمال زیاد عضوی از تبلت‌های سری ردمی خواهد بود. به گزارش تک‌ناک، شیائومی به‌زودی تبلت گیمینگ جدید خود را با پردازنده قدرتمند دیمنسیتی ۹۴۰۰رونمایی می‌کند. اطلاعات این محصول را دیجیتال چت استیشن اخیراً فاش کرده است. مشخصات اولیه و […]

محققان موفق به کشف رازهای ژنتیکی گندم شدند

تیمی بین‌المللی از دانشمندان، در یک مطالعه جامع، موفق به کشف رازهای ژنتیکی گندم شده‌اند. این دستاورد که در مجله معتبر Nature منتشر شده است، به ما درک عمیق‌تری از تکامل گندم و چگونگی سازگاری آن با محیط‌های مختلف می‌دهد. به گزارش دپارتمان اخبار علمی رسانه فناوری تکنا، در این پژوهش دانشمندان موفق شدند ۱۷ […]

رنگ‌بندی گوشی‌های خانواده گلکسی S25 فاش شد

فاصله‌ی زیادی تا رونمایی از گلکسی S25 باقی نمانده است. تصاویر فاش‌شده از سینی سیم‌کارت گلکسی S25 و گلکسی S25 پلاس، رنگ‌بندی پرچمدار جدید کره‌ای‌ها را به‌نمایش می‌گذارند. بر اساس تصاویر فاش‌شده، می‌توان انتظار داشت که پرچمدارهای جدید سامسونگ در رنگ‌های سبز، مشکی، ارغوانی و آبی دردسترس قرار بگیرند. مشخص نیست آیا رنگ‌های دیگری نیز […]

لینک کوتاه

لـیـنـک زیـر را کـپـی کـنـیـد !

https://jam.tamasnews.ir/?p=8187

ویژگی‌های خاص Qwen with Questions علی‌بابا

نتایج آزمایش‌ها

مزایای منبع‌باز و مجوز تجاری

فرایند تفکر مدل؛ کشف لحظات تأمل

آینده مدل‌های استدلالی

نوشته های مشابه

ارسال دیدگاه

ویژه خبری

سیـاسی

اقتـصادی

مذهـبی

فرهنگـی

اجـتماعی