مایکروسافت در حال راهاندازی یک پروژه تحقیقاتی است تا تأثیر نمونههای آموزشی خاص را بر متن، تصاویر و انواع دیگر رسانههایی که مدلهای هوش مصنوعی مولد ایجاد میکنند، برآورد کند.
این خبر بر اساس یک آگهی شغلی است که به دسامبر گذشته بازمیگردد و اخیراً در لینکدین بازنشر شده است.
بر اساس این آگهی، که به دنبال یک کارآموز تحقیقاتی است، این پروژه تلاش خواهد کرد نشان دهد که مدلها را میتوان به گونهای آموزش داد که تأثیر دادههای خاص — مانند عکسها و کتابها — بر خروجیهای آنها را بتوان «بهطور کارآمد و مفید» برآورد کرد.
در این آگهی آمده است: «معماریهای فعلی شبکههای عصبی از نظر ارائه منابع برای خروجیهایشان شفاف نیستند و دلایل خوبی برای تغییر این وضعیت وجود دارد.» در ادامه آمده است: «[یکی از این دلایل،] ایجاد انگیزه، به رسمیت شناختن و احتمالاً پرداخت به افرادی است که دادههای ارزشمند خاصی را به مدلهای پیشبینینشدهای که در آینده به آنها نیاز خواهیم داشت، ارائه میدهند — با فرض اینکه آینده به شکلی اساسی ما را شگفتزده خواهد کرد.»
مولدهای متن، کد، تصویر، ویدئو و آهنگ مبتنی بر هوش مصنوعی در مرکز تعدادی از پروندههای حقوقی مرتبط با مالکیت معنوی (IP) علیه شرکتهای هوش مصنوعی قرار دارند. این شرکتها اغلب مدلهای خود را با حجم عظیمی از دادههای موجود در وبسایتهای عمومی — که برخی از آنها دارای حق نشر (کپیرایت) هستند — آموزش میدهند. بسیاری از این شرکتها استدلال میکنند که دکترین «استفاده منصفانه» (Fair Use) از شیوههای جمعآوری داده و آموزش مدلهای آنها محافظت میکند. اما هنرمندان، برنامهنویسان و نویسندگان عمدتاً با این استدلال مخالفاند.
خود مایکروسافت با دستکم دو چالش حقوقی از سوی دارندگان حق نشر روبهرو است.
نیویورک تایمز در ماه دسامبر از این شرکت فناوری و همکار گاهبهگاه آن، OpenAI، شکایت کرد و این دو شرکت را به نقض حق نشر تایمز از طریق بهکارگیری مدلهایی که بر اساس میلیونها مقاله این روزنامه آموزش دیدهاند، متهم کرد. همچنین، چندین توسعهدهنده نرمافزار از مایکروسافت شکایت کردهاند و مدعیاند که دستیار کدنویسی مبتنی بر هوش مصنوعی این شرکت، GitHub Copilot، بهطور غیرقانونی با استفاده از آثار محافظتشده آنها آموزش دیده است.