بررسی شباهت ۷۴ درصدی سبک نوشتاری دیپ‌سیک و ChatGPT در پژوهشی جدید

مطالعه‌ای جدید نشان داده است که شباهت هوش مصنوعی دیپ‌سیک در تطبیق سبک نوشتاری با ChatGPT نزدیک به ۷۴ درصد است. به گزارش تک‌ناک، مطالعه‌ای تازه نشان می‌دهد که ۷۴/۲ درصد از متون تولیدشده با دیپ‌سیک از‌نظر سبک نوشتاری شباهت چشمگیری با خروجی‌های ChatGPT دارد. این یافته‌ها احتمال می‌دهد که دیپ‌سیک در فرایند آموزش خود […]


مطالعه‌ای جدید نشان داده است که شباهت هوش مصنوعی دیپ‌سیک در تطبیق سبک نوشتاری با ChatGPT نزدیک به ۷۴ درصد است.

به گزارش تک‌ناک، مطالعه‌ای تازه نشان می‌دهد که ۷۴/۲ درصد از متون تولیدشده با دیپ‌سیک از‌نظر سبک نوشتاری شباهت چشمگیری با خروجی‌های ChatGPT دارد. این یافته‌ها احتمال می‌دهد که دیپ‌سیک در فرایند آموزش خود از خروجی‌های مدل‌های OpenAI بهره برده باشد.

فوربز می‌نویسد این پژوهش که شرکت Copyleaks آن را پیش‌از انتشار در مخزن arXiv دانشگاه کرنل به‌طور اختصاصی در اختیار این گزارش قرار داده است، می‌تواند پیامدهای زیادی برای حقوق مالکیت فکری و تنظیمگری و توسعه هوش مصنوعی داشته باشد.

بازتاب سبک ChatGPT در متون دیپ‌سیک

مطالعه Copyleaks با استفاده از فناوری‌های بررسی متن و الگوریتم‌های طبقه‌بندی، سبک نوشتاری مدل‌های زبانی مختلف، ازجمله OpenAI ،‌Claude ،‌Gemini ،‌Llama و دیپ‌سیک را ارزیابی کرده است. این پژوهش برای کاهش خطای مثبت کاذب و تضمین دقت بیشتر، از شیوه رأی‌گیری اجماعی بهره گرفته است.

نتایج نشان می‌دهد درحالی‌که متون تولیدشده با اکثر مدل‌ها سبک نگارشی منحصربه‌فرد خود را دارند، بخش عمده‌ای از خروجی‌های دیپ‌سیک ازنظر سبک نوشتاری، مشابه مدل‌های OpenAI تشخیص داده شده‌اند.

شای نیسان، مدیر علوم داده در Copyleaks، این پژوهش را به تلاش کارشناس بررسی دست‌خط برای شناسایی نویسنده دست‌نوشته تشبیه کرده و یافته‌ها را شگفت‌انگیز و مهم دانسته است. او توضیح می‌دهد که پژوهش حاضر از رویکرد «هیئت‌منصفه اجماعی» استفاده کرده و به این نتیجه رسیده است که سبک نوشتاری دیپ‌سیک شباهت معناداری با ChatGPT دارد. او در ادامه تأکید می‌کند که این یافته‌ها سؤالات مهمی درباره فرایند آموزش دیپ‌سیک و احتمال استفاده آن از خروجی‌های OpenAI بدون مجوز مطرح می‌کند.

پیامدهای احتمالی برای حقوق مالکیت فکری

اگر مشخص شود که دیپ‌سیک در فرایند آموزش خود از متون تولیدشده OpenAI بدون مجوز استفاده کرده است، این مسئله می‌تواند پیامدهای حقوقی گسترده‌ای به‌دنبال داشته باشد. چنین اقدامی احتمالاً نقض شرایط استفاده OpenAI و حتی نقض حقوق مالکیت فکری این شرکت محسوب می‌شود. شفاف‌نبودن اطلاعات درباره داده‌های آموزشی مدل‌های هوش مصنوعی، این مسئله را پیچیده‌تر و ضرورت تدوین قوانین نظارتی برای الزام شرکت‌ها به افشای منابع داده‌های آموزشی را برجسته می‌کند.

این موضوع با درنظرگرفتن تأثیر دیپ‌سیک بر بازار و ابهامات موجود درباره فناوری آن از اهمیت بیشتری برخوردار می‌شود. به‌عنوان نمونه، پس‌از اعلامیه دیپ‌سیک در ژانویه درباره روش‌های آموزشی جدید و بهینه‌سازی پردازشی که به سخت‌افزار کمتری از پردازنده‌های گران‌قیمت انویدیا نیاز دارد، گزارش‌هایی از کاهش ارزش بازار این شرکت منتشر شد. اگر مشخص شود که نوآوری دیپ‌سیک برپایه استفاده غیرمجاز از خروجی‌های OpenAI شکل گرفته است، این مسئله می‌تواند پیامدهای مالی و حقوقی قابل‌توجهی داشته باشد.

مشکلات اخلاقی و حقوقی ChatGPT

در‌حالی‌که OpenAI نیز به‌دلیل استفاده از حجم وسیعی از محتوای وب بدون مجوز صریح با انتقادهایی مواجه شده است، یافته‌های جدید درباره دیپ‌سیک مسئله‌ای متفاوت را مطرح می‌کند. این پژوهش نشان می‌دهد که مدل‌های هوش مصنوعی ممکن است بتوانند بدون اقدام قانونی، از یکدیگر یاد بگیرند؛ موضوعی که به‌عنوان خلأیی در چهارچوب‌های حقوق مالکیت فکری می‌توان آن را بررسی کرد.

از منظر حقوقی، نبود سوابق مشخص، اعمال قوانین در این حوزه را دشوار می‌کند. در‌حالی‌که شناسایی سبک نگارشی مدل‌های هوش مصنوعی می‌تواند روشی قدرتمند برای تشخیص استفاده غیرمجاز از مدل‌ها باشد، به‌تنهایی مدرک قطعی برای پیگیری حقوقی محسوب نمی‌شود. با‌این‌حال، چنین یافته‌هایی می‌تواند موجب تدوین قوانین روشن‌تر برای حقوق مالکیت فکری و مقررات آموزش و توسعه هوش مصنوعی شود.

تأثیر داده‌های آموزشی بر شباهت سبک دیپ‌سیک و ChatGPT

تأثیر داده‌های آموزشی بر شباهت سبک دیپ‌سیک و ChatGPT

یکی از دیدگاه‌های مخالف در برابر یافته‌های Copyleaks این است که مدل‌های هوش مصنوعی ممکن است با گذر زمان ازنظر سبک به یکدیگر نزدیک شوند؛ به‌ویژه اگر داده‌های آموزشی مشترکی داشته باشند. بااین‌حال، مطالعه حاضر از روشی مبتنی‌بر رأی‌گیری اجماعی استفاده کرده است که می‌تواند تفاوت‌های جزئی در سبک نگارشی مدل‌ها را نیز شناسایی کند. این یافته‌ها نشان می‌دهند که شباهت بین دیپ‌سیک و OpenAI صرفاً به‌دلیل هم‌پوشانی داده‌های آموزشی نیست؛ بلکه احتمال دارد که به شباهت‌های ساختاری یا روش‌های آموزشی مدل‌ها مرتبط باشد.

آینده هوش مصنوعی و مشکلات تنظیمگری

با گسترش استفاده از هوش مصنوعی در ابعاد مختلف زندگی، نیاز به چهارچوب‌های نظارتی و قوانین شفاف مالکیت فکری بیش‌ازپیش احساس می‌شود. هنوز مشخص نیست که دیپ‌سیک از خروجی‌های OpenAI بدون مجوز استفاده کرده است یا خیر؛ اما این پژوهش سؤالات مهمی را مطرح می‌کند که احتمالاً در آینده نیز ادامه خواهند داشت. این یافته‌ها می‌توانند بر روند توسعه و تنظیمگری هوش مصنوعی تأثیر بگذارند و پیامدهایی برای دیپ‌سیک و ChatGPT و سایر بازیگران این حوزه داشته باشند.



منبع: تکنک