نام کاربری یا نشانی ایمیل
رمز عبور
مرا به خاطر بسپار
آزمایشگاه پردازش زبان طبیعی دانشگاه صنعتی امیرکبیر و مرکز تحقیقات هوش مصنوعی پارت، برای ارزیابی مدلهای زبانی (LLM) فارسی، سیستم جدیدی رونمایی کردند. این سیستم شامل جدول رتبهبندی و ابزارهای ارزیابی پیشرفتهای است که عملکرد مدلهای مختلف در حوزههایی مانند درک متن و پاسخدهی را مقایسه میکند. توسعهدهندگان Open Persian LLM Leaderboard با اشاره به […]
آزمایشگاه پردازش زبان طبیعی دانشگاه صنعتی امیرکبیر و مرکز تحقیقات هوش مصنوعی پارت، برای ارزیابی مدلهای زبانی (LLM) فارسی، سیستم جدیدی رونمایی کردند. این سیستم شامل جدول رتبهبندی و ابزارهای ارزیابی پیشرفتهای است که عملکرد مدلهای مختلف در حوزههایی مانند درک متن و پاسخدهی را مقایسه میکند.
توسعهدهندگان Open Persian LLM Leaderboard با اشاره به اینکه سیستمهای ارزیابی پیشین، مدلهای زبانی فارسی را صرفا با سطح دانش دبیرستان محک میزدند، ادعا میکنند که سیستم جدید قابلیت ارزیابی مدلها در سطح کارشناسی ارشد و عرصههای گوناگون از جمله پزشکی، اقتصاد، صنعت، منطق و مهندسی را ارائه میدهد. بهگفتهی توسعهدهندگان، این چهارچوب ارزیابی با بیشاز ۴۰هزار نمونه توسعه داده شده و تعداد نمونهها بهطور مستمر در حال افزایش است.
مقالهی مرتبط
قرار است سیستم جامع ارزیابی مدلهای زبانی فارسی به توسعهدهندگان کمک کند تا مدلهای خود را براساس معیارهای استاندارد ارزیابی کنند و کیفیت آنها را بهبود دهند. ظاهرا بخشی از قابلیتهای سیستم ارزیابی جدید بهصورت متنباز در وبسایت HuggingFace هم قرار گرفته است تا دسترسی پژوهشگران و توسعهدهندگان به این سیستم سادهتر باشد.
Source link
این مطلب بدون برچسب می باشد.
کره جنوبی دومین کشور آسیایی است که نوسازی ناوگان F-۱۵ را اعلام کرده است. در ۱۹ نوامبر، آژانس همکاری امنیتی دفاعی ایالاتمتحده (DSCA) ارتقاء ۶.۲ میلیارد دلاری را برای تمام ۵۹ جنگنده کرهای F-۱۵K تصویب کرده است و این همکاری در ارتقا، شامل ارتقا کامپیوترهای مأموریتی Advanced Display Core Processor II، رادارهای AN/APG-۸۲(v)۱ فعال آرایه […]
طبق گزارش اخیر Counterpoint Research، اپل همچنان بر بازار موبایل ایالات متحده تسلط دارد. غول فناوری کوپرتینو در سهماههی سوم سال جاری میلادی (۱۰ تیر تا ۱۰ مهر) ۵۳ درصد از بازار را در اختیار داشت و سامسونگ با ۲۳ درصد در رتبه دوم قرار گرفت. رتبهی سوم آمار خرید گوشی در بازهی زمانی مذکور […]
«اپل» سعی دارد با ارتقای دستیار صوتی خود، آن را به یک رقیب برای «چتجیپیتی» تبدیل کند. به گزارش ایسنا، شرکت «اپل» در حال برنامهریزی یک بازنگری اساسی مبتنی بر هوش مصنوعی در دستیار صوتی دیجیتال «سیری»(Siri) است که آن را بیشتر شبیه به «چتجیپیتی»(ChatGPT) شرکت «اوپنایآی»(OpenAI) و «جمینای لایو«(Gemini Live) شرکت «گوگل» خواهد کرد. […]
شرکت «اسپیسایکس» دومین قرارداد تجاری را برای فرودگر قمری موشک «استارشیپ» امضا کرده است تا از طریق آن، محمولهها را به ماه بفرستد. به گزارش ایسنا، همان طور که برنامه آزمایشی «استارشیپ»(Starship) شرکت «اسپیسایکس»(SpaceX) با شتاب به کار خود ادامه میدهد، این شرکت دومین قرارداد تجاری خود را برای رساندن محموله به ماه با استفاده […]