نام کاربری یا نشانی ایمیل
رمز عبور
مرا به خاطر بسپار
آزمایشگاه پردازش زبان طبیعی دانشگاه صنعتی امیرکبیر و مرکز تحقیقات هوش مصنوعی پارت، برای ارزیابی مدلهای زبانی (LLM) فارسی، سیستم جدیدی رونمایی کردند. این سیستم شامل جدول رتبهبندی و ابزارهای ارزیابی پیشرفتهای است که عملکرد مدلهای مختلف در حوزههایی مانند درک متن و پاسخدهی را مقایسه میکند. توسعهدهندگان Open Persian LLM Leaderboard با اشاره به […]
آزمایشگاه پردازش زبان طبیعی دانشگاه صنعتی امیرکبیر و مرکز تحقیقات هوش مصنوعی پارت، برای ارزیابی مدلهای زبانی (LLM) فارسی، سیستم جدیدی رونمایی کردند. این سیستم شامل جدول رتبهبندی و ابزارهای ارزیابی پیشرفتهای است که عملکرد مدلهای مختلف در حوزههایی مانند درک متن و پاسخدهی را مقایسه میکند.
توسعهدهندگان Open Persian LLM Leaderboard با اشاره به اینکه سیستمهای ارزیابی پیشین، مدلهای زبانی فارسی را صرفا با سطح دانش دبیرستان محک میزدند، ادعا میکنند که سیستم جدید قابلیت ارزیابی مدلها در سطح کارشناسی ارشد و عرصههای گوناگون از جمله پزشکی، اقتصاد، صنعت، منطق و مهندسی را ارائه میدهد. بهگفتهی توسعهدهندگان، این چهارچوب ارزیابی با بیشاز ۴۰هزار نمونه توسعه داده شده و تعداد نمونهها بهطور مستمر در حال افزایش است.
مقالهی مرتبط
قرار است سیستم جامع ارزیابی مدلهای زبانی فارسی به توسعهدهندگان کمک کند تا مدلهای خود را براساس معیارهای استاندارد ارزیابی کنند و کیفیت آنها را بهبود دهند. ظاهرا بخشی از قابلیتهای سیستم ارزیابی جدید بهصورت متنباز در وبسایت HuggingFace هم قرار گرفته است تا دسترسی پژوهشگران و توسعهدهندگان به این سیستم سادهتر باشد.
Source link
این مطلب بدون برچسب می باشد.
هواوی حدود دو هفته پیش از گوشیهای پرچمدار سری میت ۷۰ با فناوریهای جدید رونمایی کرد. اکنون بهنظر میرسد که تقاضا برای گوشیهای جدید هواوی، تأمینکنندگان را با مشکل مواجه کرده است. گزارش جدیدی از PhoneArena منتشرشده است که نشان میدهد زنجیره تأمین هواوی جهت پاسخگویی به تقاضای بسیار زیاد کاربران برای گوشیهای سری میت […]
به گزارش خبرآنلاین، بمبافکن PAK DA یکی از پروژههای بلندپروازانه ارتش روسیه برای جا نماندن از آمریکا و چین در زمین ساخت هواگردهای نسل پنج و شش است. این بمبافکن که گفته میشود امسال آزمایشهای زمینی را پشتسر گذاشته، هنوز به پرواز در نیامده و قرار است برای نخستین بار در سال ۲۰۲۵ به آسمان […]
ChatGPT قابلیتی جدید معرفی کرده است که به کاربران امکان میدهد مکالمات خود را در قالب «پروژهها» سازماندهی کنند. به گزارش تکناک، در ادامه رقابت میان غولهای فناوری هوش مصنوعی، OpenAI اعلام کرده است که بهزودی ویژگی جدیدی با عنوان «پروژهها» را به ChatGPT اضافه خواهد کرد. این ویژگی که شبیه به قابلیتهایی است که […]
ناسا اعلام کرد مأموریت آرتمیس ۲ که قرار بود فضانوردان را به مدار ماه بفرستد، تا آوریل ۲۰۲۶ به تعویق افتاده است. همچنین، مأموریت آرتمیس ۳ که هدف آن فرود فضانوردان روی سطح ماه است، اکنون برای اواسط سال ۲۰۲۷ برنامهریزی شده است. این تأخیرها به دلیل مسائل فنی و نیاز به بهبود تجهیزات پیش […]