انویدیا از مدل‌های Nemotron 3 برای ساخت ایجنت رونمایی کرد

انویدیا از نسخه جدید مدل‌های هوش مصنوعی خود به نام Nemotron 3 رونمایی کرد. این خانواده جدید با هدف افزایش دقت در ساخت ایجنت‌های هوش مصنوعی طراحی شده است. در ادامه مشخصات این مدل‌ها را می‌خوانید.

انویدیا برای پوشش‌دادن نیازهای مختلف این مدل‌ها را در سه سایز متفاوت منتشر کرده است:

  1. Nemotron 3 Nano (۳۰ میلیارد پارامتر): مدلی کارآمد برای انجام کارهای خاص و هدفمند با سرعت بالا.
  2. Nemotron 3 Super (۱۰۰ میلیارد پارامتر): مدل میانی که برای برنامه‌های چند-ایجنتی طراحی شده و قدرت استدلال بالایی دارد.
  3. Nemotron 3 Ultra (۵۰۰ میلیارد پارامتر): این مدل با موتور استدلال قدرتمند خود برای حل پیچیده‌ترین مسائل سازمانی ساخته شده است.

مدل‌های هوش مصنوعی Nemotron 3 انویدیا

کارایی بالای این مدل‌ها به‌خاطر معماری ترکیبی آنهاست. انویدیا به‌جای استفاده صرف از معماری ترنسفورمر (که در مدل‌هایی مثل GPT استفاده می‌شود) آن را با معماری Mamba ترکیب کرده است. این ترکیب باعث می‌شود برخلاف مدل‌های قدیمی که برای هر کلمه نیاز به حافظه زیادی داشتند، این مدل‌ها بسیار سبک‌تر اجرا شوند. همچنین طبق ادعای انویدیا، مدل نانو جدید تا ۴ برابر خروجی توکن سریع‌تری نسبت به نسل قبل دارد و هزینه‌های استنتاج را تا ۶۰ درصد کاهش می‌دهد.

برای مدل‌های بزرگ‌تر سوپر و اولترا، انویدیا از یک ترفند به نام «MoE هیبریدی» استفاده کرده است. «کاری بریسکی» (Kari Briski)، معاون نرم‌افزار انویدیا، این مفهوم را اینگونه تشبیه می‌کند: «تصور کنید چندین آشپز ماهر در یک آشپزخانه بزرگ کار می‌کنند. آنها همگی از یک هسته مشترک (مواد اولیه و اجاق‌ها) استفاده می‌کنند، اما هرکدام قفسه ادویه مخصوص خود را دارند.» این روش باعث می‌شود مدل‌ها مقیاس‌پذیرتر باشند و بدون افت دقت روی زیرساخت‌های فعلی اجرا شوند.

انویدیا می‌داند که مدل خام به‌تنهایی کافی نیست. به همین دلیل محیطی شبیه‌سازی‌شده به نام NeMo Gym را راه‌اندازی کرده است. این فضا شبیه یک باشگاه بدنسازی برای هوش مصنوعی است. توسعه‌دهندگان می‌توانند ایجنت‌های خود را در این محیط‌های شبیه‌سازی‌شده رها کنند تا با آزمون و خطا ورزیده شوند و عملکردشان را قبل از ورود به دنیای واقعی محک بزنند.

مدل Nemotron 3 Nano از امروز روی Hugging Face و همچنین از طریق پلتفرم‌های مختلف مانند FriendliAI و OpenRouter در دسترس است.

طراحان خلاقی و فرهنگ پیشرو در زبان فارسی ایجاد کرد. در این صورت می توان امید داشت که تمام و دشواری موجود در ارائه راهکارها و شرایط سخت تایپ به پایان رسد.

دیدگاهتان را بنویسید