هوش مصنوعی کوچک و پیشرفته Phi-4-mini مایکروسافت کامپیوترهای کوپایلت‌پلاس را هوشمندتر می‌کند

مایکروسافت دو مدل هوش مصنوعی Phi-4-mini و Phi-4-multimodal از سری Phi-4 را معرفی کرد. Phi-4-mini برای کارهایی مانند ریاضیات، برنامه‌نویسی و استدلال بهینه‌سازی شده است و مدل Phi-4-multimodal در پردازش متن، تصویر و گفتار، برتری دارد. مدل زبانی کوچک Phi-4-mini، کوچک‌ترین عضو خانواده‌ی Phi-4 محسوب می‌شود و با ۳٫۸ میلیارد پارامتر به‌گونه‌ای طراحی شده است […]


مایکروسافت دو مدل هوش مصنوعی Phi-4-mini و Phi-4-multimodal از سری Phi-4 را معرفی کرد. Phi-4-mini برای کارهایی مانند ریاضیات، برنامه‌نویسی و استدلال بهینه‌سازی شده است و مدل Phi-4-multimodal در پردازش متن، تصویر و گفتار، برتری دارد.

مدل زبانی کوچک Phi-4-mini، کوچک‌ترین عضو خانواده‌ی Phi-4 محسوب می‌شود و با ۳٫۸ میلیارد پارامتر به‌گونه‌ای طراحی شده است تا در انجام وظایف مبتنی‌بر پرامپت متنی، سرعت و عملکرد بالایی داشته باشد. مایکروسافت ادعا می‌کند که این مدل با وجود فشرده‌بودن، در کارهایی مانند استدلال، حل مسائل ریاضی، برنامه‌نویسی و پیروی از دستورالعمل‌ها، از بسیاری از مدل‌های زبانی بزرگ بهتر عمل می‌کند.

Phi-4-mini از یک مبدل متراکم با ویژگی توجه به پرامپت‌های گروهی استفاده می‌کند و می‌تواند توالی‌هایی به‌ طول حداکثر ۱۲۸,۰۰۰ توکن را پردازش کند.

به‌گفته‌ی مایکروسافت، فراخوانی توابع، پیروی از دستورات و استدلال، قابلیت‌های قدرتمندی هستند که به مدل‌های زبانی کوچک مانند Phi-4-mini اجازه می‌دهند به دانش بیرونی دسترسی پیدا کنند. فراخوانی توابع به مدل این امکان را می‌دهد که به‌راحتی با رابط‌های برنامه‌نویسی (API) تعامل داشته باشد.

زمانی که کاربر درخواستی ارائه می‌دهد، Phi-4-Mini می‌تواند استدلال کند، توابع مرتبط را شناسایی و با پارامترهای مناسب فراخوانی کند، خروجی‌های توابع را دریافت و نتایج را در پاسخ‌های خود یکپارچه کند. این سیستم، سامانه‌ای مبتنی‌بر قابلیت‌های توسعه‌پذیر ایجاد می‌کند که در آن، قابلیت‌های مدل با اتصال به ابزارهای خارجی، رابط‌های برنامه‌نویسی و منابع داده قابل ارتقا است. به‌عنوان مثال، می‌توان از این مدل برای کنترل دستگاه‌های خانه‌ی هوشمند استفاده کرد.

براساس مقاله‌ی مایکروسافت، Phi-4-mini در چند معیار مهم از بسیاری از مدل‌های هوش مصنوعی رقیب بهتر عمل می‌کند. نمودار نشان می‌دهد که مدل زبانی کوچک Phi-4-mini در آزمون GSM8K، در حل مسائل ریاضی امتیاز بسیار خوبی به‌دست آورده و با کسب امتیاز حدود ۸۸ درصد، در جایگاه سوم قرار گرفته است.

مدل Phi-4-mini همچنین در آزمون‌های برنامه‌نویسی (HumanEval) و کارهای استدلال‌محور (BigBench Hard CoT) عملکرد خوبی دارد. در حالی که مدل‌هایی مانند Llama-3.1-8B و Llama-3.2-3B در برخی آزمون‌ها بهتر عمل می‌کنند، Phi-4-mini در همه‌ی معیارها عملکرد پایداری را حفظ کرده است.

در مورد Phi-4-multimodal که در پردازش متن، تصویر و گفتار عملکرد بهتری دارد، مایکروسافت می‌گوید که در چند معیار کلیدی نسبت‌ به مدل جدید Gemini 2.0 Flash گوگل کمی ضعیف‌تر است.

خالق ویندوز می‌نویسد: «این مدل [Phi-4-multimodal] یکی از معدود مدل‌هایی است که می‌تواند خلاصه‌سازی گفتار را با موفقیت پیاده‌سازی کند و به‌ سطوح عملکردی قابل مقایسه با مدل GPT-4o دست یابد. این مدل درمقایسه‌با مدل‌هایی مانند Gemini-2.0-Flash و GPT-4o-realtime-preview در پاسخ به سؤالات گفتاری (QA) فاصله دارد، زیرا اندازه‌ی کوچک‌تر مدل به ظرفیت کمتر برای حفظ دانش واقعی QA منجر می‌شود. کارهایی در حال انجام است تا قابلیت مذکور در نسخه‌های بعدی بهبود یابد.»

ویژو چن، معاون هوش مصنوعی مایکروسافت می‌گوید: «Phi-4-multimodal ابزارهای محلی کامپیوترهای کوپایلت‌پلاس را پشتیبانی خواهد کرد و قدرت مدل‌های زبانی کوچک (SLM) پیشرفته‌ی مایکروسافت را بدون اتلاف انرژی ارائه می‌دهد. این یکپارچگی به افزایش بهره‌وری، خلاقیت و تجربیات آموزشی کمک می‌کند و به بخشی استاندارد از پلتفرم توسعه‌دهنده‌ی ما تبدیل می‌شود.»

مدل Phi-4-multimodal با ۵٫۶ میلیارد پارامتر می‌تواند به‌طور همزمان متن، تصاویر و گفتار را پردازش کند. این مدل برای بیشترین کارایی طراحی شده است و وظایفی مانند شناسایی گفتار و درک تصاویر را با مصرف انرژی کمتر نسبت‌ به مدل‌های بزرگ‌تر انجام می‌دهد.

مقاله‌های مرتبط

کامپیوترهای کوپایلت‌پلاس برای برخی از وظایف به‌طور محلی از هوش مصنوعی استفاده می‌کنند، به این معنی که هوش مصنوعی به‌طور مستقیم روی دستگاه اجرا می‌شود و به فضای ابری وابسته نیست. این موضوع به حریم خصوصی و سرعت عمل کمک می‌کند. به‌عنوان مثال، ویژگی‌های هوش مصنوعی در نرم‌افزارهایی مانند ورد و اوت‌لوک یا حتی قابلیت بحث‌برانگیز Recall می‌توانند بدون نیاز به اتصال اینترنت کار کنند.

هر دو مدل جدید سری Phi-4 از طریق پلتفرم‌هایی مانند Azure AI Foundry و HuggingFace برای توسعه‌دهندگان در دسترس هستند.



Source link