در یک نشست مطبوعاتی اخیر، سم آلتمن، مدیرعامل OpenAI، اظهار داشت که طی سالهای گذشته، "IQ" هوش مصنوعی با سرعت بالایی رشد کرده است.
آلتمن گفت:
"بهطور تقریبی، احساس من این است — که البته این یک نظر علمی دقیق نیست، بلکه بیشتر یک احساس یا برداشت ذهنی است — که هر سال، یک انحراف معیار در IQ جلو میرویم."
آلتمن اولین فردی نیست که از IQ، که معیاری برای تخمین هوش انسان است، بهعنوان معیاری برای پیشرفت AI استفاده میکند. بسیاری از فعالان حوزه هوش مصنوعی در شبکههای اجتماعی، مدلهای AI را با آزمونهای IQ محک زده و رتبهبندی کردهاند.
اما بسیاری از کارشناسان معتقدند که IQ معیار مناسبی برای سنجش تواناییهای AI نیست و حتی ممکن است گمراهکننده باشد.
ساندرا واچر، پژوهشگر دانشگاه آکسفورد در زمینه فناوری و مقررات، به TechCrunch گفت:
"ممکن است وسوسهانگیز باشد که از معیارهای انسانی برای توصیف تواناییها یا پیشرفت AI استفاده کنیم، اما این کار مثل مقایسه سیب و پرتقال است."
آلتمن در صحبتهای خود، IQ را با هوش برابر دانسته است. اما IQ یک معیار نسبی است، نه مطلق. در حالی که آزمونهای IQ میتوانند برخی مهارتهای منطقی و استدلال انتزاعی را بسنجند، اما هوش عملی — یعنی توانایی حل مشکلات دنیای واقعی — را اندازهگیری نمیکنند.
IQ بیشتر نشاندهنده نقص آزمون است تا عملکرد واقعی مدل
واچر توضیح داد:
"IQ ابزاری است برای اندازهگیری تواناییهای انسان — آن هم ابزاری بحثبرانگیز — که بر اساس درکی که دانشمندان از هوش انسانی دارند، طراحی شده است. اما شما نمیتوانید از همان معیار برای توصیف تواناییهای AI استفاده کنید. یک ماشین سریعتر از انسان میرود و یک زیردریایی بهتر از انسان در آب فرو میرود، اما این بدان معنا نیست که ماشین یا زیردریایی از نظر هوشی از انسان برتر هستند. این یک اشتباه در معادلسازی است."
ریشههای آزمونهای IQ نیز مورد انتقاد است؛ برخی مورخان آن را به نظریههای بیاعتبار اصلاح نژادی (eugenics) پیوند میدهند. از سوی دیگر، آزمونهای IQ بهشدت متکی به حافظه کاری قوی و آشنایی با هنجارهای فرهنگی غربی هستند که احتمال سوگیری در نتایج را افزایش میدهد.
اُز کیز، دانشجوی دکتری دانشگاه واشنگتن در حوزه هوش مصنوعی اخلاقی، به TechCrunch گفت:
"این آزمونها خیلی راحت فریب میخورند، مخصوصاً وقتی یک مدل AI حافظه نامحدود و صبر بینهایت دارد."
وی اضافه کرد:
"ما مدتها قبل از اختراع کامپیوترهای دیجیتال هم میدانستیم که آزمونهای IQ ابزار بسیار محدودی برای سنجش شناخت، هوشیاری و هوش هستند."
از آنجا که مدلهای هوش مصنوعی مقدار عظیمی از حافظه و دانش داخلی دارند، احتمالاً در آزمونهای IQ یک برتری ناعادلانه دارند. بسیاری از مدلهای AI بر اساس دادههای عمومی اینترنت آموزش میبینند، و اینترنت پر از نمونه سؤالات آزمونهای IQ است.
مایک کوک، پژوهشگر کینگز کالج لندن در زمینه AI، توضیح میدهد:
"یکی از روشهای ساده برای بالا بردن نمره IQ این است که مرتب آزمونهای IQ تمرین کنید — که دقیقاً همان کاری است که مدلهای AI انجام میدهند."
وی ادامه داد:
"وقتی من چیزی را یاد میگیرم، اینطور نیست که یک میلیون بار آن را با وضوح کامل در مغزم دریافت کنم، بر خلاف AI که میتواند این کار را بدون از دست دادن سیگنال انجام دهد."
هوش مصنوعی به روش کاملاً متفاوتی نسبت به انسان مسائل را حل میکند
کوک میگوید:
"یک کلاغ ممکن است بتواند از یک ابزار برای بیرون آوردن غذا از جعبه استفاده کند، اما این بدان معنا نیست که میتواند در دانشگاه هاروارد ثبتنام کند!"
او ادامه میدهد:
"وقتی من یک مسئله ریاضی را حل میکنم، ذهنم درگیر خواندن صحیح کلمات، فکر نکردن به خریدی که باید انجام دهم، یا سردی هوای اتاق است. به عبارت دیگر، مغز انسان هنگام حل هر مسئلهای، از جمله آزمونهای IQ، با عوامل حواسپرتی بیشتری درگیر است و با کمک بسیار کمتری کار میکند."
ضرورت طراحی آزمونهای بهتر برای AI
در نهایت، هیدی خلعاف، دانشمند ارشد هوش مصنوعی در AI Now Institute، تأکید میکند که باید روشهای بهتری برای سنجش تواناییهای AI طراحی شود.
او میگوید:
"در تاریخ محاسبات، ما هیچوقت تواناییهای کامپیوتر را با تواناییهای انسانی مقایسه نکردهایم، زیرا ذات محاسبات به گونهای است که سیستمها از همان ابتدا قادر به انجام کارهایی فراتر از تواناییهای انسان بودهاند."
او نتیجه میگیرد:
"اینکه بهطور مستقیم عملکرد AI را با تواناییهای انسانی مقایسه کنیم، یک پدیده جدید است و یکی از بحثبرانگیزترین موضوعاتی است که در مورد استانداردهای ارزیابی هوش مصنوعی وجود دارد."