Anthropic، یکی از بزرگترین شرکتهای ارائهدهندهی هوش مصنوعی در جهان، خانوادهای قدرتمند از مدلهای هوش مصنوعی مولد به نام Claude دارد. این مدلها قادر به انجام طیف گستردهای از وظایف هستند، از کپشنگذاری تصاویر و نوشتن ایمیلها گرفته تا حل مسائل ریاضی و چالشهای کدنویسی.
با رشد سریع اکوسیستم مدلهای Anthropic، پیگیری اینکه هر مدل Claude چه کاری انجام میدهد دشوار است. برای کمک به این موضوع، راهنمایی برای Claude تهیه کردهایم که با انتشار مدلها و بهروزرسانیهای جدید، آن را بهروزرسانی خواهیم کرد.
مدلهای Claude
مدلهای Claude به نام آثار ادبی نامگذاری شدهاند: Haiku، Sonnet، و Opus. جدیدترین نسخهها عبارتند از:
- Claude 3.5 Haiku، یک مدل سبک.
- Claude 3.7 Sonnet، یک مدل ترکیبی میانرده با توانایی استدلال. این مدل در حال حاضر پرچمدار Anthropic است.
- Claude 3 Opus، یک مدل بزرگ.
بهطور غیرمنتظره، Claude 3 Opus — که بزرگترین و گرانترین مدل Anthropic محسوب میشود — در حال حاضر کمتوانترین مدل Claude است. بااینحال، این وضعیت احتمالاً با انتشار نسخهی بهروزرسانیشدهی Opus تغییر خواهد کرد.
اخیراً، Anthropic Claude 3.7 Sonnet را منتشر کرده است که پیشرفتهترین مدل این شرکت تاکنون محسوب میشود. این مدل با Claude 3.5 Haiku و Claude 3 Opus تفاوت دارد زیرا یک مدل استدلال ترکیبی است، به این معنا که میتواند هم پاسخهای لحظهای و هم پاسخهای عمیقتر و "اندیشیدهشده" به سوالات ارائه دهد.
هنگام استفاده از Claude 3.7 Sonnet، کاربران میتوانند قابلیت استدلال مدل را فعال یا غیرفعال کنند. در صورت فعال بودن استدلال، این مدل قبل از پاسخ دادن، از چند ثانیه تا چند دقیقه را در مرحلهی "تفکر" سپری میکند. در این مرحله، مدل هوش مصنوعی ورودی کاربر را به بخشهای کوچکتر تقسیم کرده و پاسخهای خود را بررسی میکند.
Claude 3.7 Sonnet نخستین مدل هوش مصنوعی Anthropic است که توانایی "استدلال" دارد، روشی که بسیاری از آزمایشگاههای هوش مصنوعی به آن روی آوردهاند، زیرا روشهای سنتی بهبود عملکرد هوش مصنوعی در حال کاهش بازدهی هستند.
حتی در صورت غیرفعال بودن استدلال، Claude 3.7 Sonnet همچنان یکی از برترین مدلهای هوش مصنوعی در صنعت فناوری محسوب میشود.
در ماه نوامبر، Anthropic نسخهی بهبودیافته و گرانتری از مدل سبک خود، Claude 3.5 Haiku را منتشر کرد. این مدل در برخی از معیارها عملکرد بهتری نسبت به Claude 3 Opus دارد، اما نمیتواند مانند Claude 3 Opus یا Claude 3.7 Sonnet تصاویر را تحلیل کند.
ویژگیهای مدلهای Claude
تمام مدلهای Claude دارای یک پنجرهی متنی استاندارد ۲۰۰,۰۰۰ توکنی هستند و میتوانند دستورالعملهای چندمرحلهای را دنبال کنند، از ابزارها (مانند ردیابهای بازار سهام) استفاده کنند، و خروجیهای ساختاریافته را در قالبهایی مانند JSON تولید کنند.
پنجرهی متنی مقدار دادهای است که مدلی مانند Claude میتواند قبل از تولید دادهی جدید تحلیل کند، در حالی که توکنها بخشهای کوچکی از دادههای خام هستند (مانند هجاهای "فن"، "تس"، و "تیک" در کلمهی "fantastic"). ۲۰۰,۰۰۰ توکن تقریباً معادل ۱۵۰,۰۰۰ کلمه یا یک رمان ۶۰۰ صفحهای است.
برخلاف بسیاری از مدلهای هوش مصنوعی مولد، مدلهای Anthropic به اینترنت دسترسی ندارند، به همین دلیل در پاسخ به سوالات مربوط به رویدادهای جاری چندان قوی نیستند. همچنین، آنها نمیتوانند تصاویر تولید کنند — فقط قادر به ایجاد نمودارهای سادهی خطی هستند.
تفاوتهای کلیدی بین مدلهای Claude
- Claude 3.7 Sonnet سریعتر از Claude 3 Opus است و دستورالعملهای پیچیده و دارای ظرافتهای معنایی را بهتر درک میکند.
- Haiku در مواجهه با درخواستهای پیچیده ضعف دارد، اما سریعترین مدل در بین این سه مدل است.
مدلهای Claude از طریق API شرکت Anthropic و پلتفرمهای مدیریتشده مانند Amazon Bedrock و Vertex AI گوگل کلود در دسترس هستند.
قیمتگذاری API Anthropic
- Claude 3.5 Haiku: ۸۰ سنت به ازای هر ۱ میلیون توکن ورودی (~۷۵۰,۰۰۰ کلمه)، یا ۴ دلار به ازای هر ۱ میلیون توکن خروجی
- Claude 3.7 Sonnet: ۳ دلار به ازای هر ۱ میلیون توکن ورودی، یا ۱۵ دلار به ازای هر ۱ میلیون توکن خروجی
- Claude 3 Opus: ۱۵ دلار به ازای هر ۱ میلیون توکن ورودی، یا ۷۵ دلار به ازای هر ۱ میلیون توکن خروجی
Anthropic قابلیتهای ذخیرهسازی درخواستها (Prompt Caching) و پردازش گروهی (Batching) را برای کاهش هزینهها و افزایش کارایی ارائه میدهد.
- Prompt Caching به توسعهدهندگان این امکان را میدهد که زمینههای خاصی از درخواستها را ذخیره کرده و در فراخوانیهای بعدی API مجدداً استفاده کنند.
- Batching درخواستهای کماولویت و غیرهمزمان را بهصورت گروهی پردازش میکند، که منجر به کاهش هزینههای استنتاج مدل میشود.