نام کاربری یا نشانی ایمیل
رمز عبور
مرا به خاطر بسپار
شرکت OpenAI امشب مدل هوش مصنوعی جدید GPT-4.5 را با اسم رمز Orion به صورت اختصاصی برای کاربران اشتراک ChatGPT Pro منتشر کرد. به گزارش تکناک این مدل که بزرگترین نسخه تاکنون توسعهیافته توسط این شرکت محسوب میشود، با استفاده از توان پردازشی و دادههای بیشتری نسبت به مدلهای قبلی آموزش دیده است. مدل پیشرفته […]
شرکت OpenAI امشب مدل هوش مصنوعی جدید GPT-4.5 را با اسم رمز Orion به صورت اختصاصی برای کاربران اشتراک ChatGPT Pro منتشر کرد.
به گزارش تکناک این مدل که بزرگترین نسخه تاکنون توسعهیافته توسط این شرکت محسوب میشود، با استفاده از توان پردازشی و دادههای بیشتری نسبت به مدلهای قبلی آموزش دیده است.
با وجود افزایش مقیاس، شرکت OpenAI در مقالهای اعلام کرده که GPT-4.5 را یک مدل پیشرفته در حوزه هوش مصنوعی نمیداند. این مدل از امروز برای مشترکان ChatGPT Pro که ماهانه ۲۰۰ دلار پرداخت میکنند، در دسترس قرار گرفته و کاربران پلنهای پولی API نیز میتوانند از آن استفاده کنند. مشتریانی که در پلن ChatGPT Plus و ChatGPT Team ثبتنام کردهاند، به گفته سخنگوی شرکت OpenAI در TechCrunch، هفته آینده به این مدل دسترسی خواهند داشت.
مدل جدید بر پایه همان روشی توسعه یافته که شرکت OpenAI در ساخت نسخههای قبلی به کار گرفته بودیعنی افزایش قابلتوجه توان پردازشی و دادهها در مرحله پیشآموزش بدون نظارت. در نسلهای قبلی، این رویکرد باعث بهبود عملکرد در زمینههایی مانند ریاضیات، نگارش و کدنویسی شده بود. شرکت OpenAI تأکید دارد که افزایش مقیاس در GPT-4.5 به این مدل «دانش عمیقتر از جهان» و «هوش احساسی بالاتر» بخشیده است. با این حال، برخی نشانهها حاکی از آن است که افزایش دادهها و پردازش دیگر مانند گذشته، بهبود چشمگیری ایجاد نمیکند.
در چندین آزمون هوش مصنوعی، GPT-4.5 عملکردی ضعیفتر از مدلهای جدیدتر شرکتهای DeepSeek و Anthropic و حتی برخی مدلهای استدلالی خود شرکت OpenAI داشته است. از سوی دیگر، هزینه اجرای این مدل بسیار بالاست و این شرکت در حال بررسی ادامه ارائه آن در API در بلندمدت است.
در یک پست وبلاگی، شرکت OpenAI اعلام کرد:
«ما GPT-4.5 را بهعنوان یک پیشنمایش پژوهشی منتشر کردهایم تا درک بهتری از نقاط قوت و محدودیتهای آن داشته باشیم. همچنان در حال بررسی تواناییهای این مدل هستیم و مشتاقیم ببینیم کاربران چگونه از آن استفاده میکنند.»
شرکت OpenAI تأکید کرده که GPT-4.5 قرار نیست جایگزین مستقیم GPT-4o باشد، مدلی که بخش عمده API و ChatGPT را تأمین میکند. این مدل از قابلیتهایی مانند آپلود فایل و تصویر و ابزار canvas پشتیبانی میکند، اما برخی ویژگیها مانند حالت مکالمه دوطرفه واقعی را ندارد.
با این حال، در برخی از بنچمارکها، GPT-4.5 عملکردی بهتر از GPT-4o و سایر مدلهای موجود نشان داده است. در آزمون SimpleQA که دقت مدلها را در پاسخ به سوالات واقعی میسنجد، GPT-4.5 عملکرد بهتری نسبت به GPT-4o و مدلهای استدلالی o1 و o3-mini داشته است. به گفته شرکت OpenAI، این مدل در مقایسه با بسیاری از مدلهای دیگر کمتر دچار خطای توهمی میشود، به این معنا که احتمال ارائه اطلاعات نادرست در آن کمتر است.
با این حال، عملکرد این مدل در حوزه کدنویسی متفاوت بوده است. در آزمون SWE-Bench Verified، که مدلها را در حل مسائل برنامهنویسی ارزیابی میکند، عملکرد GPT-4.5 مشابه GPT-4o و o3-mini بوده اما از مدلهای deep research شرکت OpenAI و Claude 3.7 Sonnet شرکت Anthropic ضعیفتر عمل کرده است. در آزمون دیگری با عنوان SWE-Lancer که توانایی مدلها در توسعه ویژگیهای نرمافزاری را بررسی میکند، GPT-4.5 بهتر از GPT-4o و o3-mini عمل کرده اما همچنان پایینتر از deep research قرار گرفته است.
در آزمونهای علمی مانند AIME و GPQA، GPT-4.5 نتوانسته به سطح مدلهای استدلالی پیشرفتهای مانند o3-mini، DeepSeek’s R1 و Claude 3.7 Sonnet برسد، اما در مقایسه با مدلهای غیراستدلالی عملکرد خوبی داشته است.
شرکت OpenAI ادعا میکند که برخی از برتریهای GPT-4.5 را نمیتوان به سادگی در بنچمارکها اندازهگیری کرد. این مدل قادر است نیات انسانی را بهتر درک کند، در پاسخهای خود لحنی گرمتر و طبیعیتر داشته باشد و در وظایف خلاقانه مانند نگارش و طراحی بهتر عمل کند.
در یک آزمایش غیررسمی، شرکت OpenAI از GPT-4.5 و دو مدل دیگر، GPT-4o و o3-mini، خواست تا یک اسب تکشاخ در فرمت SVG طراحی کنند. از میان این مدلها، فقط GPT-4.5 توانست تصویری قابلقبول از یک اسب تکشاخ تولید کند.
در آزمایشی دیگر، از این مدلها خواسته شد که به جمله «من پس از مردود شدن در آزمون، حال خوبی ندارم» پاسخ دهند. GPT-4o و o3-mini اطلاعات مفیدی ارائه کردند، اما پاسخ GPT-4.5 از نظر اجتماعی مناسبترین و همدلانهترین واکنش را داشت.
شرکت OpenAI در پست وبلاگی خود نوشت:
«ما امیدواریم از طریق این انتشار، تصویر کاملتری از تواناییهای GPT-4.5 به دست آوریم، چرا که میدانیم بنچمارکهای دانشگاهی همیشه نشاندهنده کاربرد واقعی مدلها نیستند.»
شرکت OpenAI ادعا میکند که GPT-4.5 «در مرز قابلیتهای یادگیری بدون نظارت» قرار دارد، اما محدودیتهای این مدل به نظر میرسد که فرضیه ادامهدار بودن قوانین مقیاسپذیری را زیر سوال میبرد.
Ilya Sutskever یکی از بنیانگذاران شرکت ، در دسامبر گذشته اظهار کرده بود که «ما به سقف دادهها رسیدهایم» و «پیشآموزش به شکل کنونی آن بدون شک پایان خواهد یافت». این نگرانی پیشتر نیز توسط سرمایهگذاران و پژوهشگران هوش مصنوعی مطرح شده بود.
برای عبور از این چالش، شرکت OpenAI و سایر فعالان این حوزه تمرکز خود را به مدلهای استدلالی معطوف کردهاند. این مدلها نسبت به مدلهای سنتی زمان و توان پردازشی بیشتری برای حل مسائل صرف میکنند، اما دقت بالاتری دارند.
شرکت OpenAI قصد دارد سری GPT را با مدلهای استدلالی o ترکیب کند و این فرایند از GPT-5 که قرار است اواخر امسال منتشر شود، آغاز خواهد شد. هرچند GPT-4.5 نتوانسته انتظارات را به طور کامل برآورده کند و گزارش شده که هزینه آموزشی بسیار بالایی داشته و چندین بار به تعویق افتاده، اما این مدل احتمالاً بهعنوان مرحلهای میانی برای توسعه نسل بعدی هوش مصنوعی محسوب میشود.
منبع: تکنک
این مطلب بدون برچسب می باشد.
مودم C1 5G در آیفون 16e حدود ۴۰ درصد سریعتر از مودم اسنپدراگون X71 موجود در آیفون ۱۶ پرو مکس است؛ ولی C1 5G از پشتیبانی mmWave بیبهره نیست. به گزارش تکناک، اپل ممکن است در طراحی آیفون 16e و مودم 5G C1 آن، با حذف پشتیبانی از mmWave، برخی از جنبهها را نادیده گرفته […]
دانشمندان میگویند رباتهای کوچک شبیه به اسپرم انسان میتوانند در مراقبت از باروری و دارورسانی کمک کننده باشند. این رباتها با اندازههای بین ۱۰ تا ۲۰ سانتیمتر، در مایعاتی شبیه به مایعات بدن انسان مورد آزمایش قرار خواهند گرفت. به گزارش ایسنا، شناگران رباتیک کوچک که بر اساس سلولهای باکتریایی و اسپرمی مدلسازی شدهاند، میتوانند […]
اگرت در مطالعه سال ۲۰۱۷ خود، دیانای فراوانترین گونهها را توالییابی کرد. هرچند شناسایی دقیق تمام گونههای باکتری امکانپذیر نبود، پنج مورد از فراوانترین گونهها ارتباط نزدیکی با باکتریهایی داشتند که در افراد دارای سیستم ایمنی ضعیف موجب عفونت میشوند. اقدامات خاصی مثل گرم کردن در مایکروویو یا شستن با آب داغ و صابون هم […]
گزارشها حاکی از آن است که سامسونگ قصد دارد گلکسی S25 اج را در تاریخ ۱۶ آوریل مصادف با ۲۷ فروردین ۱۴۰۴ معرفی کند، که احتمالاً با طراحی جدید و ویژگیهای بهبودیافته در نمایشگر و عملکرد عرضه خواهد شد. به گزارش تکناک، این گوشی که نسخهای باریکتر از پرچمدار جدید سامسونگ محسوب میشود، در رنگهای […]