نیویورکتایمز به منظور جلوگیری از استفاده از محتوایش برای آموزش مدلهای هوش مصنوعی، اقدامات پیشگیرانهای را انجام داده است.
آیتیمن- این بنگاه رسانهای روز سوم اوت، با بهروز رسانی شرایط خدمات ، استفاده از متن، عکس و تصاویر و کلیپهای صوتی و تصویری و ابردادههای خود را در توسعه هر برنامه نرمافزاری، از جمله برای آموزش یادگیری ماشین یا هوش مصنوعی ممنوع کرد.
شرایط بهروزرسانیشده همچنین مشخص میکند که ابزارهای خودکار مانند خزندههای وبسایت که برای استفاده، دسترسی یا جمعآوری چنین محتوایی طراحی شدهاند، نمیتوانند بدون اجازه کتبی نشریه استفاده شوند.
بنا به اعلام نیویورک تایمز، رعایت نکردن محدودیتهای مذکور، میتواند منجر به جریمه یا مجازات خاطیان شود.
علیرغم معرفی این خطمشی جدید، به نظر نمیرسد این نشریه هیچ تغییری در robots.txt خود ایجاد کرده باشد. Robots.txt فایلی است که به خزندههای موتور جستوجو اطلاع میدهد که به کدام URLها میتوان دسترسی داشت.
این اقدام میتواند واکنشی به روزآمدسازی اخیر خطمشی رازداری گوگل باشد که نشان میدهد غول جستوجو دادههای عمومی را به منظور آموزش سرویسهای هوش مصنوعی مختلف خود مانند Bard یا Cloud AI جمعآوری میکند. بسیاری از مدلهای زبان بزرگ که سرویسهای هوش مصنوعی محبوبی مانند ChatGPT را تامین میکنند، بر روی مجموعه دادههای وسیعی آموزش دیدهاند که میتوانند حاوی مطالب دارای حق کپی یا محافظتشده باشند.
گفته میشود که نیویورک تایمز در ماه فوریه قراردادی 100 میلیون دلاری با گوگل امضا کرد که به غول جستوجو اجازه میدهد در سه سال آینده از محتوای این نشریه در برخی از پلتفرمهای خود استفاده کند.
نیویورکتایمز اعلام کرد که این دو شرکت روی ابزارهایی برای توزیع محتوا، اشتراک، بازاریابی و تبلیغات همکاری خواهند کرد، بنابراین ممکن است تغییرات در شرایط خدمات این نشریه متوجه شرکتهای دیگری مانند OpenAI یا مایکروسافت باشد.
در همین حال OpenAI خیراً اعلام کرده که اپراتورهای وب سایت میتوانند مانع از خزش GPTBot در وبسایت خود شوند. مایکروسافت نیز محدودیتهای جدیدی به قوانین و مقررات خود اضافه کرده که افراد را از استفاده از محصولات هوش مصنوعی این شرکت برای ایجاد، آموزش یا بهبود (مستقیم یا غیرمستقیم) هر سرویس هوش مصنوعی دیگری منع میکند.
در اوایل ماه جاری میلادی، چندین سازمان خبری از جمله آسوشیتدپرس و شورای ناشران اروپایی نامهای سرگشاده امضا کردند و از قانونگذاران جهانی خواستار وضع قوانینی به منظور ایجاد شفافیت در مجموعه دادههای آموزشی و کسب رضایت دارندگان حق کپی قبل از استفاده از این دادهها شدند.