نام کاربری یا نشانی ایمیل
رمز عبور
مرا به خاطر بسپار
مطالعهای جدید نشان داده است که شباهت هوش مصنوعی دیپسیک در تطبیق سبک نوشتاری با ChatGPT نزدیک به ۷۴ درصد است. به گزارش تکناک، مطالعهای تازه نشان میدهد که ۷۴/۲ درصد از متون تولیدشده با دیپسیک ازنظر سبک نوشتاری شباهت چشمگیری با خروجیهای ChatGPT دارد. این یافتهها احتمال میدهد که دیپسیک در فرایند آموزش خود […]
مطالعهای جدید نشان داده است که شباهت هوش مصنوعی دیپسیک در تطبیق سبک نوشتاری با ChatGPT نزدیک به ۷۴ درصد است.
به گزارش تکناک، مطالعهای تازه نشان میدهد که ۷۴/۲ درصد از متون تولیدشده با دیپسیک ازنظر سبک نوشتاری شباهت چشمگیری با خروجیهای ChatGPT دارد. این یافتهها احتمال میدهد که دیپسیک در فرایند آموزش خود از خروجیهای مدلهای OpenAI بهره برده باشد.
فوربز مینویسد این پژوهش که شرکت Copyleaks آن را پیشاز انتشار در مخزن arXiv دانشگاه کرنل بهطور اختصاصی در اختیار این گزارش قرار داده است، میتواند پیامدهای زیادی برای حقوق مالکیت فکری و تنظیمگری و توسعه هوش مصنوعی داشته باشد.
مطالعه Copyleaks با استفاده از فناوریهای بررسی متن و الگوریتمهای طبقهبندی، سبک نوشتاری مدلهای زبانی مختلف، ازجمله OpenAI ،Claude ،Gemini ،Llama و دیپسیک را ارزیابی کرده است. این پژوهش برای کاهش خطای مثبت کاذب و تضمین دقت بیشتر، از شیوه رأیگیری اجماعی بهره گرفته است.
نتایج نشان میدهد درحالیکه متون تولیدشده با اکثر مدلها سبک نگارشی منحصربهفرد خود را دارند، بخش عمدهای از خروجیهای دیپسیک ازنظر سبک نوشتاری، مشابه مدلهای OpenAI تشخیص داده شدهاند.
شای نیسان، مدیر علوم داده در Copyleaks، این پژوهش را به تلاش کارشناس بررسی دستخط برای شناسایی نویسنده دستنوشته تشبیه کرده و یافتهها را شگفتانگیز و مهم دانسته است. او توضیح میدهد که پژوهش حاضر از رویکرد «هیئتمنصفه اجماعی» استفاده کرده و به این نتیجه رسیده است که سبک نوشتاری دیپسیک شباهت معناداری با ChatGPT دارد. او در ادامه تأکید میکند که این یافتهها سؤالات مهمی درباره فرایند آموزش دیپسیک و احتمال استفاده آن از خروجیهای OpenAI بدون مجوز مطرح میکند.
اگر مشخص شود که دیپسیک در فرایند آموزش خود از متون تولیدشده OpenAI بدون مجوز استفاده کرده است، این مسئله میتواند پیامدهای حقوقی گستردهای بهدنبال داشته باشد. چنین اقدامی احتمالاً نقض شرایط استفاده OpenAI و حتی نقض حقوق مالکیت فکری این شرکت محسوب میشود. شفافنبودن اطلاعات درباره دادههای آموزشی مدلهای هوش مصنوعی، این مسئله را پیچیدهتر و ضرورت تدوین قوانین نظارتی برای الزام شرکتها به افشای منابع دادههای آموزشی را برجسته میکند.
این موضوع با درنظرگرفتن تأثیر دیپسیک بر بازار و ابهامات موجود درباره فناوری آن از اهمیت بیشتری برخوردار میشود. بهعنوان نمونه، پساز اعلامیه دیپسیک در ژانویه درباره روشهای آموزشی جدید و بهینهسازی پردازشی که به سختافزار کمتری از پردازندههای گرانقیمت انویدیا نیاز دارد، گزارشهایی از کاهش ارزش بازار این شرکت منتشر شد. اگر مشخص شود که نوآوری دیپسیک برپایه استفاده غیرمجاز از خروجیهای OpenAI شکل گرفته است، این مسئله میتواند پیامدهای مالی و حقوقی قابلتوجهی داشته باشد.
درحالیکه OpenAI نیز بهدلیل استفاده از حجم وسیعی از محتوای وب بدون مجوز صریح با انتقادهایی مواجه شده است، یافتههای جدید درباره دیپسیک مسئلهای متفاوت را مطرح میکند. این پژوهش نشان میدهد که مدلهای هوش مصنوعی ممکن است بتوانند بدون اقدام قانونی، از یکدیگر یاد بگیرند؛ موضوعی که بهعنوان خلأیی در چهارچوبهای حقوق مالکیت فکری میتوان آن را بررسی کرد.
از منظر حقوقی، نبود سوابق مشخص، اعمال قوانین در این حوزه را دشوار میکند. درحالیکه شناسایی سبک نگارشی مدلهای هوش مصنوعی میتواند روشی قدرتمند برای تشخیص استفاده غیرمجاز از مدلها باشد، بهتنهایی مدرک قطعی برای پیگیری حقوقی محسوب نمیشود. بااینحال، چنین یافتههایی میتواند موجب تدوین قوانین روشنتر برای حقوق مالکیت فکری و مقررات آموزش و توسعه هوش مصنوعی شود.
یکی از دیدگاههای مخالف در برابر یافتههای Copyleaks این است که مدلهای هوش مصنوعی ممکن است با گذر زمان ازنظر سبک به یکدیگر نزدیک شوند؛ بهویژه اگر دادههای آموزشی مشترکی داشته باشند. بااینحال، مطالعه حاضر از روشی مبتنیبر رأیگیری اجماعی استفاده کرده است که میتواند تفاوتهای جزئی در سبک نگارشی مدلها را نیز شناسایی کند. این یافتهها نشان میدهند که شباهت بین دیپسیک و OpenAI صرفاً بهدلیل همپوشانی دادههای آموزشی نیست؛ بلکه احتمال دارد که به شباهتهای ساختاری یا روشهای آموزشی مدلها مرتبط باشد.
با گسترش استفاده از هوش مصنوعی در ابعاد مختلف زندگی، نیاز به چهارچوبهای نظارتی و قوانین شفاف مالکیت فکری بیشازپیش احساس میشود. هنوز مشخص نیست که دیپسیک از خروجیهای OpenAI بدون مجوز استفاده کرده است یا خیر؛ اما این پژوهش سؤالات مهمی را مطرح میکند که احتمالاً در آینده نیز ادامه خواهند داشت. این یافتهها میتوانند بر روند توسعه و تنظیمگری هوش مصنوعی تأثیر بگذارند و پیامدهایی برای دیپسیک و ChatGPT و سایر بازیگران این حوزه داشته باشند.
منبع: تکنک
این مطلب بدون برچسب می باشد.
معاون علمی، فناوری و اقتصاد دانشبنیان ریاست جمهوری با اشاره به تنوع محصولات موجود در پارک فناوری پردیس که تنها پارک علم و فناوری زیر مجموعه معاونت علمی است، گفت: بزرگترین تولیدکنندگان دارو و بزرگترین صادرکنندگان محصولات دانشبنیان کشور در پارک علم و فناوری پردیس حضور دارند. به گزارش ایسنا، دکتر حسین افشین در حاشیه […]
طبق گزارشی که مرکز کنترل و پیشگیری از بیماریهای آمریکا (CDC) منتشر کرده، حدود یکهشتم موارد مرگ ناشی از آنفولانزا در کودکان ایالات متحده در سال جاری با آسیب مغزی مرتبط بوده است. به گزارش تکناک، ایالات متحده در حال تجربه شدیدترین فصل آنفولانزا در بیش از یک دهه اخیر است. بر اساس گزارش قبلی […]
رئیس مرکز توسعه فناوریهای راهبردی معاونت علمی، با اشاره به تخصص و درک عمیق رئیس جمهور از اهمیت توسعه فناوری در کشور، این موضوع را پشتوانه محکمی برای اقتدار ملی دانست. به گزارش ایسنا، سعید سرکار، در حاشیه نشست فناورانونخبگان دانشبنیان شرق استانتهران که در سومین مرحله از پنجمین دورۀ سفرهای استانی رئیس جمهور به […]
دولت ترامپ در صدد بررسی شبکه های اجتماعی تمامی مهاجران متقاضی دریافت شهروندی ایالات متحده است. به گزارش تکناک، افرادی که برای دریافت شهروندی یا اقامت در ایالات متحده اقدام میکنند، ممکن است بهزودی ملزم شوند اطلاعات مربوط به حسابهای شبکههای اجتماعی خود را در اختیار دولت قرار دهند. بر اساس سیاستی که دولت ترامپ […]