مدل جدید استدلال گر اوپن AI معرفی شد - o3

روز پایانی رویداد «۱۲ روز Shipmas» شرکت OpenAI فرا رسید و این شرکت از مدل جدید زنجیره‌ای «استدلال» به نام o3 رونمایی کرد. به گفته OpenAI، این مدل پیشرفته‌ترین مدل آنها تا به امروز است. این مدل هنوز برای استفاده عمومی در دسترس نیست، اما پژوهشگران حوزه ایمنی از امروز می‌توانند برای پیش‌نمایش آن ثبت‌نام کنند.

OpenAI و دیگر شرکت‌ها امیدوارند که مدل‌های استدلال بتوانند تا حد زیادی مشکل همیشگی چت‌بات‌ها در ارائه پاسخ‌های نادرست را حل کنند. چت‌بات‌ها به طور بنیادین «فکر» نمی‌کنند مانند انسان‌ها، و نیاز به تکنیک‌های متفاوتی است تا بهترین شبیه‌سازی از فرآیند تفکر انسانی ایجاد شود.

مدل‌های استدلال هنگام پاسخ به یک سؤال، مکث می‌کنند و به سؤالات مرتبطی فکر می‌کنند که ممکن است به ارائه پاسخ دقیق‌تر کمک کند. برای مثال، اگر از مدل o3 بپرسید: «آیا هابانروها را می‌توان در شمال غربی اقیانوس آرام کشت کرد؟» مدل ممکن است مجموعه‌ای از سؤالات مرتبط را بررسی کند، مانند: «هابانروها معمولاً کجا رشد می‌کنند؟» «شرایط ایده‌آل برای رشد هابانروها چیست؟» و «آب‌وهوای شمال غربی اقیانوس آرام چگونه است؟» هر کسی که از چت‌بات‌ها استفاده کرده باشد می‌داند که گاهی باید با سؤالات تکمیلی کمک کنید تا در نهایت پاسخ درست داده شود. مدل‌های استدلال قرار است این کار اضافی را برای شما انجام دهند.

o3 جانشین مدل o1، اولین مدل زنجیره‌ای استدلال OpenAI است. نمایندگان شرکت گفته‌اند که از نامگذاری «o2» صرف نظر کرده‌اند «از روی احترام» به شرکت مخابراتی بریتانیایی با همین نام، اما این تصمیم به جذاب‌تر شدن محصول نیز کمک کرده است. OpenAI اعلام کرده است که مدل جدید قابلیت تنظیم میزان اتکا به استدلال را دارد. کاربران می‌توانند بین استدلال کم، متوسط یا زیاد انتخاب کنند؛ هرچه محاسبات بیشتر باشد، عملکرد o3 بهتر خواهد بود. OpenAI اعلام کرده است که زمانی را صرف آزمایش امنیتی این مدل با محققان خواهد کرد تا از ارائه پاسخ‌های بالقوه مضر جلوگیری کند (چرا که این مدل انسانی نیست و تفاوت درست و نادرست را نمی‌داند).

استدلال کلمه کلیدی این روزها در حوزه هوش مصنوعی تولیدی است، زیرا متخصصان این صنعت معتقدند که این قابلیت، گام بعدی برای بهبود عملکرد مدل‌های زبانی بزرگ است. افزایش توان محاسباتی دیگر به تنهایی بهبود قابل توجهی در عملکرد ایجاد نمی‌کند، بنابراین نیاز به تکنیک‌های جدید احساس می‌شود. اخیراً Google DeepMind از مدل استدلالی خود به نام Gemini Deep Research رونمایی کرده است که می‌تواند طی ۵ تا ۱۰ دقیقه گزارشی تهیه کند که منابع زیادی را در وب تحلیل می‌کند تا به یافته‌های خود برسد.

OpenAI به o3 اطمینان دارد که معیارهای قابل توجهی ارائه می‌کند—این مدل در آزمون کدنویسی Codeforces امتیاز ۲۷۲۷ را کسب کرده است. این مدل در آزمون ریاضی American Invitational Mathematics Exam 2024 امتیاز ۹۶.۷ درصد را کسب کرده و فقط به یک سؤال پاسخ اشتباه داده است. اما باید دید که این مدل در آزمایش‌های واقعی چگونه عمل می‌کند؛ Sora، مدل اخیر OpenAI، همچنان نیاز به کار دارد. با این حال، خوش‌بینان معتقدند مشکل دقت در حال حل شدن است. با این وجود، در مواردی که دقت بسیار مهم است، باید با احتیاط از مدل‌های هوش مصنوعی استفاده کرد.

شرکت‌های مدل هوش مصنوعی مانند OpenAI و Perplexity در رقابت برای تبدیل شدن به گوگل بعدی هستند، با هدف جمع‌آوری دانش جهان و کمک به کاربران برای درک آن. این شرکت‌ها حتی محصولات جستجویی ارائه داده‌اند که قرار است دسترسی به نتایج وب به‌صورت لحظه‌ای را به طور مستقیم بازتولید کنند.

با این حال، به نظر می‌رسد که هر یک از این بازیگران هر روز دیگری را پشت سر می‌گذارند. این شرایط تا حدی یادآور اواخر دهه ۹۰ است که موتورهای جستجوی متعددی مانند Google، Yahoo، AltaVista و Ask Jeeves وجود داشتند که داده‌های اینترنت را جمع‌آوری می‌کردند و با یک تجربه کاربری متفاوت ارائه می‌دادند. بیشتر این‌ها پس از ظهور یک موتور جستجو که به طور قابل ملاحظه‌ای بهتر بود—گوگل—ناپدید شدند.

OpenAI در حال حاضر با صدها میلیون کاربر فعال ماهانه و شراکت با اپل، پیشتازی قوی دارد، اما گوگل اخیراً به دلیل پیشرفت‌هایش در مدل‌های Gemini مورد توجه قرار گرفته است. The Verge گزارش داده که این شرکت به‌زودی Gemini را عمیق‌تر در رابط جستجوی خود ادغام خواهد کرد.

۱۴۰۳ آذر ۳۰, جمعه

مدل جدید استدلال گر اوپن AI معرفی شد - o3

هیچ نظری موجود نیست:

ارسال یک نظر

Post Top Ad

پادکست Deep Dive آی تی نویس

بايگانی وبلاگ

پست‌های پرطرفدار - یک سال اخیر

پست‌های پرطرفدار - 7 روز اخیر

بازدیدها

پست های برتر

برچسب ها

Send Quick Message

۱۴۰۳ آذر ۳۰, جمعه

مدل جدید استدلال گر اوپن AI معرفی شد - o3

هیچ نظری موجود نیست:

ارسال یک نظر

Post Top Ad

پادکست Deep Dive آی تی نویس

بايگانی وبلاگ

مشترک فید شوید

پست‌های پرطرفدار - یک سال اخیر

پست‌های پرطرفدار - 7 روز اخیر

بازدیدها

پست های برتر

برچسب ها

Send Quick Message