نام کاربری یا نشانی ایمیل
رمز عبور
مرا به خاطر بسپار
آزمایشگاه پردازش زبان طبیعی دانشگاه صنعتی امیرکبیر و مرکز تحقیقات هوش مصنوعی پارت، برای ارزیابی مدلهای زبانی (LLM) فارسی، سیستم جدیدی رونمایی کردند. این سیستم شامل جدول رتبهبندی و ابزارهای ارزیابی پیشرفتهای است که عملکرد مدلهای مختلف در حوزههایی مانند درک متن و پاسخدهی را مقایسه میکند. توسعهدهندگان Open Persian LLM Leaderboard با اشاره به […]
آزمایشگاه پردازش زبان طبیعی دانشگاه صنعتی امیرکبیر و مرکز تحقیقات هوش مصنوعی پارت، برای ارزیابی مدلهای زبانی (LLM) فارسی، سیستم جدیدی رونمایی کردند. این سیستم شامل جدول رتبهبندی و ابزارهای ارزیابی پیشرفتهای است که عملکرد مدلهای مختلف در حوزههایی مانند درک متن و پاسخدهی را مقایسه میکند.
توسعهدهندگان Open Persian LLM Leaderboard با اشاره به اینکه سیستمهای ارزیابی پیشین، مدلهای زبانی فارسی را صرفا با سطح دانش دبیرستان محک میزدند، ادعا میکنند که سیستم جدید قابلیت ارزیابی مدلها در سطح کارشناسی ارشد و عرصههای گوناگون از جمله پزشکی، اقتصاد، صنعت، منطق و مهندسی را ارائه میدهد. بهگفتهی توسعهدهندگان، این چهارچوب ارزیابی با بیشاز ۴۰هزار نمونه توسعه داده شده و تعداد نمونهها بهطور مستمر در حال افزایش است.
مقالهی مرتبط
قرار است سیستم جامع ارزیابی مدلهای زبانی فارسی به توسعهدهندگان کمک کند تا مدلهای خود را براساس معیارهای استاندارد ارزیابی کنند و کیفیت آنها را بهبود دهند. ظاهرا بخشی از قابلیتهای سیستم ارزیابی جدید بهصورت متنباز در وبسایت HuggingFace هم قرار گرفته است تا دسترسی پژوهشگران و توسعهدهندگان به این سیستم سادهتر باشد.
Source link
این مطلب بدون برچسب می باشد.
به گزارش خبرآنلاین، کشتی پرتغالی بوم جیزز (Bom Jesus) مملو از طلا، عاج و اسراری که قرنها در دل ماسهها مدفون بود به طور اتفاقی پیدا شد و یکی از بزرگترین معماهای دریایی تاریخ را پس از نیمهزاره آشکار کرد. به نقل از یورونیوز، بقایای «بوم جیزز» در سال ۲۰۰۸ توسط کارگران یک معدن الماس که […]
در سال ۱۴۰۴، با توجه به تنوع گسترده گوشیهای هوشمند در بازار، انتخاب یک گوشی اقتصادی که هم عملکرد مناسبی داشته باشد و هم ارزش خرید بالایی ارائه دهد، میتواند چالشبرانگیز باشد. اگر به دنبال خرید موبایلی هستید که با بودجه محدود، نیازهای روزمره شما را برآورده کند، این راهنمای جامع برای شماست. در این مقاله، […]
به گزارش خبرآنلاین، آواتار ۱۱ یا به بیان درستتر وان وان در کلاس کراساور اندازه متوسط، سال ۲۰۲۲ معرفی شد. این مدل، اولین خودروی تولید انبوه شرکت سازنده محسوب میشود و البته پرفروشترین محصول نیز باقی مانده است. آواتر ۱۱ از نظر فنی در گروه EREV قرار میگیرد و قابلیت استفاده از موتور بنزینی برای شارژ […]
فعال حوزه دانشجویی گفت:شعار سال از ان جهت بسیار مهم است که تأکید بر نقش مردم در تولید و اقتصاد کشور دارد. رهبر انقلاب بهدرستی اشاره کردند که برای تحقق این شعار، نیاز به سرمایهگذاری و ایجاد انگیزه در دولت و مردم وجود دارد. اگر دولت بهعنوان تسهیلکننده عمل کند و موانع را بردارد، میتوانیم […]