روز پایانی رویداد «۱۲ روز Shipmas» شرکت OpenAI فرا رسید و این شرکت از مدل جدید زنجیرهای «استدلال» به نام o3 رونمایی کرد. به گفته OpenAI، این مدل پیشرفتهترین مدل آنها تا به امروز است. این مدل هنوز برای استفاده عمومی در دسترس نیست، اما پژوهشگران حوزه ایمنی از امروز میتوانند برای پیشنمایش آن ثبتنام کنند.
OpenAI و دیگر شرکتها امیدوارند که مدلهای استدلال بتوانند تا حد زیادی مشکل همیشگی چتباتها در ارائه پاسخهای نادرست را حل کنند. چتباتها به طور بنیادین «فکر» نمیکنند مانند انسانها، و نیاز به تکنیکهای متفاوتی است تا بهترین شبیهسازی از فرآیند تفکر انسانی ایجاد شود.
مدلهای استدلال هنگام پاسخ به یک سؤال، مکث میکنند و به سؤالات مرتبطی فکر میکنند که ممکن است به ارائه پاسخ دقیقتر کمک کند. برای مثال، اگر از مدل o3 بپرسید: «آیا هابانروها را میتوان در شمال غربی اقیانوس آرام کشت کرد؟» مدل ممکن است مجموعهای از سؤالات مرتبط را بررسی کند، مانند: «هابانروها معمولاً کجا رشد میکنند؟» «شرایط ایدهآل برای رشد هابانروها چیست؟» و «آبوهوای شمال غربی اقیانوس آرام چگونه است؟» هر کسی که از چتباتها استفاده کرده باشد میداند که گاهی باید با سؤالات تکمیلی کمک کنید تا در نهایت پاسخ درست داده شود. مدلهای استدلال قرار است این کار اضافی را برای شما انجام دهند.
o3 جانشین مدل o1، اولین مدل زنجیرهای استدلال OpenAI است. نمایندگان شرکت گفتهاند که از نامگذاری «o2» صرف نظر کردهاند «از روی احترام» به شرکت مخابراتی بریتانیایی با همین نام، اما این تصمیم به جذابتر شدن محصول نیز کمک کرده است. OpenAI اعلام کرده است که مدل جدید قابلیت تنظیم میزان اتکا به استدلال را دارد. کاربران میتوانند بین استدلال کم، متوسط یا زیاد انتخاب کنند؛ هرچه محاسبات بیشتر باشد، عملکرد o3 بهتر خواهد بود. OpenAI اعلام کرده است که زمانی را صرف آزمایش امنیتی این مدل با محققان خواهد کرد تا از ارائه پاسخهای بالقوه مضر جلوگیری کند (چرا که این مدل انسانی نیست و تفاوت درست و نادرست را نمیداند).
استدلال کلمه کلیدی این روزها در حوزه هوش مصنوعی تولیدی است، زیرا متخصصان این صنعت معتقدند که این قابلیت، گام بعدی برای بهبود عملکرد مدلهای زبانی بزرگ است. افزایش توان محاسباتی دیگر به تنهایی بهبود قابل توجهی در عملکرد ایجاد نمیکند، بنابراین نیاز به تکنیکهای جدید احساس میشود. اخیراً Google DeepMind از مدل استدلالی خود به نام Gemini Deep Research رونمایی کرده است که میتواند طی ۵ تا ۱۰ دقیقه گزارشی تهیه کند که منابع زیادی را در وب تحلیل میکند تا به یافتههای خود برسد.
OpenAI به o3 اطمینان دارد که معیارهای قابل توجهی ارائه میکند—این مدل در آزمون کدنویسی Codeforces امتیاز ۲۷۲۷ را کسب کرده است. این مدل در آزمون ریاضی American Invitational Mathematics Exam 2024 امتیاز ۹۶.۷ درصد را کسب کرده و فقط به یک سؤال پاسخ اشتباه داده است. اما باید دید که این مدل در آزمایشهای واقعی چگونه عمل میکند؛ Sora، مدل اخیر OpenAI، همچنان نیاز به کار دارد. با این حال، خوشبینان معتقدند مشکل دقت در حال حل شدن است. با این وجود، در مواردی که دقت بسیار مهم است، باید با احتیاط از مدلهای هوش مصنوعی استفاده کرد.
شرکتهای مدل هوش مصنوعی مانند OpenAI و Perplexity در رقابت برای تبدیل شدن به گوگل بعدی هستند، با هدف جمعآوری دانش جهان و کمک به کاربران برای درک آن. این شرکتها حتی محصولات جستجویی ارائه دادهاند که قرار است دسترسی به نتایج وب بهصورت لحظهای را به طور مستقیم بازتولید کنند.
با این حال، به نظر میرسد که هر یک از این بازیگران هر روز دیگری را پشت سر میگذارند. این شرایط تا حدی یادآور اواخر دهه ۹۰ است که موتورهای جستجوی متعددی مانند Google، Yahoo، AltaVista و Ask Jeeves وجود داشتند که دادههای اینترنت را جمعآوری میکردند و با یک تجربه کاربری متفاوت ارائه میدادند. بیشتر اینها پس از ظهور یک موتور جستجو که به طور قابل ملاحظهای بهتر بود—گوگل—ناپدید شدند.
OpenAI در حال حاضر با صدها میلیون کاربر فعال ماهانه و شراکت با اپل، پیشتازی قوی دارد، اما گوگل اخیراً به دلیل پیشرفتهایش در مدلهای Gemini مورد توجه قرار گرفته است. The Verge گزارش داده که این شرکت بهزودی Gemini را عمیقتر در رابط جستجوی خود ادغام خواهد کرد.
هیچ نظری موجود نیست:
ارسال یک نظر