یک مدل جدید هوش مصنوعی (AI) بهتازگی در آزمونی که برای سنجش "هوش عمومی" طراحی شده است، به نتایجی در سطح انسان دست یافته است.
در ۲۰ دسامبر، سیستم o3 شرکت OpenAI موفق شد در آزمون ARC-AGI به امتیاز ۸۵٪ دست یابد که بهطور قابلتوجهی بالاتر از بهترین رکورد قبلی هوش مصنوعی با امتیاز ۵۵٪ است و با میانگین امتیاز انسانها برابری میکند. این سیستم همچنین در یک آزمون بسیار دشوار ریاضیات نتایج خوبی کسب کرد.
ایجاد هوش عمومی مصنوعی یا AGI، هدف اعلامشده همه آزمایشگاههای بزرگ تحقیقاتی در زمینه هوش مصنوعی است. در نگاه اول، به نظر میرسد OpenAI حداقل گامی مهم بهسوی این هدف برداشته است.
با وجود باقیماندن شک و تردید، بسیاری از پژوهشگران و توسعهدهندگان هوش مصنوعی احساس میکنند چیزی تغییر کرده است. برای بسیاری، چشمانداز AGI اکنون واقعیتر، فوریتر و نزدیکتر از آنچه انتظار میرفت به نظر میرسد.
برای درک معنای نتیجه سیستم o3، باید بدانید که آزمون ARC-AGI چیست. به زبان فنی، این آزمون توانایی یک سیستم هوش مصنوعی در "بهرهوری نمونه" را میسنجد، یعنی اینکه سیستم برای سازگاری با یک موقعیت جدید چقدر به تعداد نمونه نیاز دارد تا متوجه شود چگونه کار میکند.
سیستمهای هوش مصنوعی مانند ChatGPT (GPT-4) از نظر بهرهوری نمونه چندان قوی نیستند. این سیستمها بر اساس میلیونها نمونه متن انسانی "آموزش" دیدهاند و قوانین احتمالی را درباره ترکیبهای واژگانی که بیشترین احتمال وقوع را دارند، میسازند.
نتیجه این روش برای وظایف رایج بسیار خوب است. اما برای وظایف غیرمعمول، عملکرد ضعیفی دارند، زیرا درباره این وظایف دادههای کمتری (نمونههای کمتر) دارند.
تا زمانی که سیستمهای هوش مصنوعی نتوانند از تعداد کمی نمونه بیاموزند و با بهرهوری نمونه بالاتری سازگار شوند، کاربرد آنها به مشاغل بسیار تکراری و مواردی که خطاهای گاهبهگاه قابل تحمل باشد، محدود خواهد ماند.
توانایی حل دقیق مسائل جدید یا ناشناخته با استفاده از تعداد محدودی نمونه داده، بهعنوان ظرفیت تعمیمدهی شناخته میشود. این توانایی بهطور گسترده بهعنوان عنصری ضروری و حتی بنیادی در هوش تلقی میشود.
هیچ نظری موجود نیست:
ارسال یک نظر