نام کاربری یا نشانی ایمیل
رمز عبور
مرا به خاطر بسپار
علیبابا مدل زبانی بزرگ جدیدی به نام Qwen with Questions را معرفی کرده که در مقایسه با مدل o1-preview شرکت OpenAI، در بخش استدلال قویتر است. به گزارش تکناک، علیبابا مدل جدیدی از خانواده در حال گسترش Qwen خود به نام Qwen with Questions (QwQ) را منتشر کرده است. این مدل بهعنوان رقیب اصلی مدل […]
علیبابا مدل زبانی بزرگ جدیدی به نام Qwen with Questions را معرفی کرده که در مقایسه با مدل o1-preview شرکت OpenAI، در بخش استدلال قویتر است.
به گزارش تکناک، علیبابا مدل جدیدی از خانواده در حال گسترش Qwen خود به نام Qwen with Questions (QwQ) را منتشر کرده است. این مدل بهعنوان رقیب اصلی مدل استدلالیo1 شرکت OpenAI معرفی شده است. درحالحاضر، مدل جدید علیبابا در حالت پیشنمایش قرار دارد و پیشبینی میشود که نسخههای بهبودیافتهتری از آن در آینده منتشر شود.
ونچربیت مینویسد که مدل QwQ مانند سایر مدلهای بزرگ استدلالی (LRM) از منابع پردازشی اضافی در زمان استنباط استفاده میکند. این منابع اضافی به مدل اجازه میدهند تا پاسخهای خود را بازبینی و خطاهای احتمالی را اصلاح کند. این ویژگی باعث میشود QwQ در انجام وظایف نیازمند به استدلال منطقی و برنامهریزی مانند حل مسائل ریاضی و برنامهنویسی، کارایی بیشتری داشته باشد.
طبق آزمایشها، مدل QwQ در مقایسه با مدل o1-preview از OpenAI در معیارهای مختلف عملکرد بهتری از خود نشان داده است. این مدل در ارزیابیهای AIME و MATH که تواناییهای مدل در حل مسائل ریاضی را بررسی میکند، از o1-preview پیشی گرفته است. در معیار GPQA که برای سنجش استدلال علمی طراحی شده، QwQ توانسته است از مدل o1-mini نیز عملکرد بهتری داشته باشد. بااینحال، در آزمونهای LiveCodeBench که به ارزیابی مهارتهای برنامهنویسی اختصاص دارد، مدل QwQ از o1 ضعیفتر عمل میکند؛ اما هنوزهم از سایر مدلهای پیشرفته مانند GPT-4o و Claude 3.5 Sonnet بهتر است.
برخلاف مدلهای مشابه مانند o1 که توسط OpenAI منتشر شدهاند، علیبابا مدل QwQ را بهصورت منبعباز در اختیار عموم قرار داده است. این یعنی توسعهدهندگان و پژوهشگران میتوانند کد و فرایندهای داخلی مدل را مشاهده کنند و از آن برای بهبود و گسترش آن استفاده کنند. این مدل تحت مجوز Apache 2.0 نیز منتشر شده است و این یعنی میتوان از آن برای اهداف تجاری نیز بهره برد.
علیبابا با انتشار بیانیهای مدل QwQ را معرفی کرده و فرایند تفکر آن را شرح داده است. طبق این بیانیه، هنگامی که به مدل زمان کافی برای تأمل و پرسش و بازتاب داده میشود، درک آن از مفاهیم پیچیده مانند ریاضیات و برنامهنویسی رشد میکند. به گفته تیم توسعه، این فرایند به بهبود چشمگیر در حل مسائل پیچیده و دستیابی به دستاوردهای بزرگ در این زمینهها منجر میشود.
این توضیحات مشابه به روشهای موجود در سایر مدلهای استدلالی است که معمولاً با تولید توکنهای بیشتر و بازبینی پاسخهای خود، تلاش میکنند تا اشتباهات را اصلاح کنند. مدل Marco-o1 که اخیراً علیبابا منتشر کرده است، از Monte Carlo Tree Search (MCTS) و خودبازتابی در زمان استنباط استفاده میکند تا شاخههای مختلف استدلال را ایجاد و بهترین پاسخ را انتخاب کند.
مدل Qwen with Questions علیبابا نیز با برخی محدودیتها روبهرو است. علیبابا به مشکل ترکیب زبانها و گیرکردن در حلقههای استدلال دایرهای اشاره کرده است. این مشکلات نشاندهنده نیاز به بهبود بیشتر درزمینه پردازش زبان و استدلال در مدلهای پیچیده است.
انتشار مدل Qwen with Questions علیبابا در شرایطی رخ داده است که رقابت درزمینه مدلهای استدلالی (LRM) در حال افزایش است. مدل o1 شرکت OpenAI بهعنوان نقطه عطفی در توسعه مدلهای استدلالی شناخته میشود. بهعلاوه، مدلهای دیگری مانند R1-Lite-Preview از آزمایشگاه DeepSeek و LLaVA-o1 که محققان چینی توسعه دادهاند، بهدنبال رقابت با o1 هستند. این مدلها عمدتاً از استراتژیهای استدلال در زمان استنباط برای بهبود عملکرد خود استفاده میکنند.
تمرکز بر مدلهای بزرگ استدلالی درحالی صورت میگیرد که روند مقیاسبندی مدلهای هوش مصنوعی با مشکلاتی مواجه شده است. طبق گزارشها، آزمایشگاههای هوش مصنوعی مانند OpenAI و دیپمایند گوگل با کاهش بازده در آموزش مدلهای بزرگ روبهرو هستند. جمعآوری دادههای باکیفیت برای آموزش مدلها بهدلیل محدودیتهای موجود در دسترسی به دادههای جدید و حجیم نیز پیچیدهتر شده است.
در این میان، استفاده از مقیاس استنباط در مدلهای استدلالی میتواند راهحلی نوآورانه برای بهبود عملکرد نسل بعدی مدلهای هوش مصنوعی باشد. گزارشها حاکی از آن است که OpenAI از مدل o1 برای تولید دادههای استدلال مصنوعی بهمنظور آموزش نسلهای بعدی مدلهای خود استفاده میکند.
انتشار مدل Qwen with Questions علیبابا نشاندهنده گام جدیدی در رقابت میان مدلهای استدلالی است. با توجه به قابلیتهای منحصربهفرد این مدل در بهبود فرایند استدلال و رفع خطاها، پیشبینی میشود که رقابت در این زمینه در آینده نزدیک شدت بیشتری پیدا کند. این مدل همراه با سایر مدلهای مشابه، میتواند تحولی در راهحلهای هوش مصنوعی و آینده استدلال مصنوعی ایجاد کند.
منبع: تکنک
این مطلب بدون برچسب می باشد.
فاصلهی زیادی تا رونمایی از گلکسی S25 باقی نمانده است. تصاویر فاششده از سینی سیمکارت گلکسی S25 و گلکسی S25 پلاس، رنگبندی پرچمدار جدید کرهایها را بهنمایش میگذارند. بر اساس تصاویر فاششده، میتوان انتظار داشت که پرچمدارهای جدید سامسونگ در رنگهای سبز، مشکی، ارغوانی و آبی دردسترس قرار بگیرند. مشخص نیست آیا رنگهای دیگری نیز […]
متا کابل زیردریایی به ارزش ۱۰ میلیارد دلار میسازد تا زیرساختهای ارتباطیاش را گسترش دهد و به ارائه خدمات بهتر و سریعتر به کاربران در سراسر جهان کمک کند. به گزارش تکناک، متا قصد دارد کابل فیبرنوری زیردریایی با طول بیش از ۴۰,۰۰۰ کیلومتر بسازد که مسیر آن بهطور کامل از ایالات متحده، هند، آفریقایجنوبی، […]
مدیر بخش زلزله مرکز تحقیقات راه، مسکن و شهرسازی با اشاره به جاذبههای شهر تهران با بیان اینکه اگر در انتقال پایتخت به دنبال این هستیم که از جمعیت ۲۰ میلیون نفری از دماوند تا قزوین کاسته شود، محقق نخواهد شد، گفت: در حال حاضر میزان آلودگی هوا و ترافیک در کلانشهرهای اصفهان، اهواز، بندرعباس، […]
محققان دانشگاه ایلینوی موفق به ساخت یک دست بسیار کوچک یا “نانوگیرنده” شدهاند که میتواند در تشخیص و درمان بیماریهایی مانند کووید-۱۹ بسیار موثر باشد. این دست نانو که از یک رشته DNA تا شده ساخته شده است، قادر است ویروسها را با دقت و سرعت بسیار بالا شناسایی کند و حتی از ورود آنها […]