نام کاربری یا نشانی ایمیل
رمز عبور
مرا به خاطر بسپار
مایکروسافت دو مدل هوش مصنوعی Phi-4-mini و Phi-4-multimodal از سری Phi-4 را معرفی کرد. Phi-4-mini برای کارهایی مانند ریاضیات، برنامهنویسی و استدلال بهینهسازی شده است و مدل Phi-4-multimodal در پردازش متن، تصویر و گفتار، برتری دارد. مدل زبانی کوچک Phi-4-mini، کوچکترین عضو خانوادهی Phi-4 محسوب میشود و با ۳٫۸ میلیارد پارامتر بهگونهای طراحی شده است […]
مایکروسافت دو مدل هوش مصنوعی Phi-4-mini و Phi-4-multimodal از سری Phi-4 را معرفی کرد. Phi-4-mini برای کارهایی مانند ریاضیات، برنامهنویسی و استدلال بهینهسازی شده است و مدل Phi-4-multimodal در پردازش متن، تصویر و گفتار، برتری دارد.
مدل زبانی کوچک Phi-4-mini، کوچکترین عضو خانوادهی Phi-4 محسوب میشود و با ۳٫۸ میلیارد پارامتر بهگونهای طراحی شده است تا در انجام وظایف مبتنیبر پرامپت متنی، سرعت و عملکرد بالایی داشته باشد. مایکروسافت ادعا میکند که این مدل با وجود فشردهبودن، در کارهایی مانند استدلال، حل مسائل ریاضی، برنامهنویسی و پیروی از دستورالعملها، از بسیاری از مدلهای زبانی بزرگ بهتر عمل میکند.
Phi-4-mini از یک مبدل متراکم با ویژگی توجه به پرامپتهای گروهی استفاده میکند و میتواند توالیهایی به طول حداکثر ۱۲۸,۰۰۰ توکن را پردازش کند.
بهگفتهی مایکروسافت، فراخوانی توابع، پیروی از دستورات و استدلال، قابلیتهای قدرتمندی هستند که به مدلهای زبانی کوچک مانند Phi-4-mini اجازه میدهند به دانش بیرونی دسترسی پیدا کنند. فراخوانی توابع به مدل این امکان را میدهد که بهراحتی با رابطهای برنامهنویسی (API) تعامل داشته باشد.
زمانی که کاربر درخواستی ارائه میدهد، Phi-4-Mini میتواند استدلال کند، توابع مرتبط را شناسایی و با پارامترهای مناسب فراخوانی کند، خروجیهای توابع را دریافت و نتایج را در پاسخهای خود یکپارچه کند. این سیستم، سامانهای مبتنیبر قابلیتهای توسعهپذیر ایجاد میکند که در آن، قابلیتهای مدل با اتصال به ابزارهای خارجی، رابطهای برنامهنویسی و منابع داده قابل ارتقا است. بهعنوان مثال، میتوان از این مدل برای کنترل دستگاههای خانهی هوشمند استفاده کرد.
براساس مقالهی مایکروسافت، Phi-4-mini در چند معیار مهم از بسیاری از مدلهای هوش مصنوعی رقیب بهتر عمل میکند. نمودار نشان میدهد که مدل زبانی کوچک Phi-4-mini در آزمون GSM8K، در حل مسائل ریاضی امتیاز بسیار خوبی بهدست آورده و با کسب امتیاز حدود ۸۸ درصد، در جایگاه سوم قرار گرفته است.
مدل Phi-4-mini همچنین در آزمونهای برنامهنویسی (HumanEval) و کارهای استدلالمحور (BigBench Hard CoT) عملکرد خوبی دارد. در حالی که مدلهایی مانند Llama-3.1-8B و Llama-3.2-3B در برخی آزمونها بهتر عمل میکنند، Phi-4-mini در همهی معیارها عملکرد پایداری را حفظ کرده است.
در مورد Phi-4-multimodal که در پردازش متن، تصویر و گفتار عملکرد بهتری دارد، مایکروسافت میگوید که در چند معیار کلیدی نسبت به مدل جدید Gemini 2.0 Flash گوگل کمی ضعیفتر است.
خالق ویندوز مینویسد: «این مدل [Phi-4-multimodal] یکی از معدود مدلهایی است که میتواند خلاصهسازی گفتار را با موفقیت پیادهسازی کند و به سطوح عملکردی قابل مقایسه با مدل GPT-4o دست یابد. این مدل درمقایسهبا مدلهایی مانند Gemini-2.0-Flash و GPT-4o-realtime-preview در پاسخ به سؤالات گفتاری (QA) فاصله دارد، زیرا اندازهی کوچکتر مدل به ظرفیت کمتر برای حفظ دانش واقعی QA منجر میشود. کارهایی در حال انجام است تا قابلیت مذکور در نسخههای بعدی بهبود یابد.»
ویژو چن، معاون هوش مصنوعی مایکروسافت میگوید: «Phi-4-multimodal ابزارهای محلی کامپیوترهای کوپایلتپلاس را پشتیبانی خواهد کرد و قدرت مدلهای زبانی کوچک (SLM) پیشرفتهی مایکروسافت را بدون اتلاف انرژی ارائه میدهد. این یکپارچگی به افزایش بهرهوری، خلاقیت و تجربیات آموزشی کمک میکند و به بخشی استاندارد از پلتفرم توسعهدهندهی ما تبدیل میشود.»
مدل Phi-4-multimodal با ۵٫۶ میلیارد پارامتر میتواند بهطور همزمان متن، تصاویر و گفتار را پردازش کند. این مدل برای بیشترین کارایی طراحی شده است و وظایفی مانند شناسایی گفتار و درک تصاویر را با مصرف انرژی کمتر نسبت به مدلهای بزرگتر انجام میدهد.
مقالههای مرتبط
کامپیوترهای کوپایلتپلاس برای برخی از وظایف بهطور محلی از هوش مصنوعی استفاده میکنند، به این معنی که هوش مصنوعی بهطور مستقیم روی دستگاه اجرا میشود و به فضای ابری وابسته نیست. این موضوع به حریم خصوصی و سرعت عمل کمک میکند. بهعنوان مثال، ویژگیهای هوش مصنوعی در نرمافزارهایی مانند ورد و اوتلوک یا حتی قابلیت بحثبرانگیز Recall میتوانند بدون نیاز به اتصال اینترنت کار کنند.
هر دو مدل جدید سری Phi-4 از طریق پلتفرمهایی مانند Azure AI Foundry و HuggingFace برای توسعهدهندگان در دسترس هستند.
Source link
این مطلب بدون برچسب می باشد.
دانشمندان دانشگاه توکیو فناوری جدیدی به نام «نانومتری عمیق» (Deep Nanometry) توسعه دادهاند که با ترکیب تجهیزات نوری پیشرفته و الگوریتم کاهش نویز مبتنی بر یادگیری عمیق، قابلیت تحلیل نانوذرات با دقت بالا را فراهم میکند. به گزارش ایسنا، این فناوری میتواند نانوذرات موجود در نمونههای پزشکی را با سرعت بسیار بالا بررسی کرده و حتی […]
تاریخ و نحوه برگزاری آزمون (الکترونیکی) زبان انگلیسی پیشرفته تولیمو (Tolimo) دورههای ۲۳۲ تا ۲۴۳ در سال ۱۴۰۴ اعلام شد. به گزارش ایسنا، سازمان سنجش آموزش کشور جزئیات برگزاری آزمون زبان انگلیسی پیشرفته تولیمو دورههای ۲۳۲ تا ۲۴۳ به روش الکترونیکی را اعلام کرد. آن دسته از افرادی که متقاضی شرکت در این آزمون هستند، […]
تینا مزدکی_شرکت هلیون انرژی (Helion Energy) اعلام کرده است که قصد دارد اولین نیروگاه همجوشی هستهای جهان را در مالاگا واشنگتن احداث کند. این نیروگاه ۵۰ مگاواتی در زمینی متعلق به شرکت تأمین خدمات عمومی چلان (Chelan PUD)، در نزدیکی سد راک آیلند و در حاشیه رودخانه کلمبیا ساخته خواهد شد. با اینکه هنوز تصمیم […]
مجمع عمومی فرهنگستان علوم، عضویت وابسته دو عضو هیئت علمی دانشگاه تهران را تصویب کرد. به گزارش ایسنا، در یکصد و چهل و چهارمین جلسه مجمع عمومی فرهنگستان علوم جمهوری اسلامی ایران که با حضور دکتر محمدرضا عارف، معاون اول رئیس جمهور، دکتر محمدرضا مخبر دزفولی، رئیس فرهنگستان علوم و اعضای پیوسته فرهنگستان برگزار شد، […]