صفحه اصلی > هوش مصنوعی : مایکروسافت بزرگ‌ترین مدل هوش مصنوعی «1 بیتی» جهان را معرفی کرد

مایکروسافت بزرگ‌ترین مدل هوش مصنوعی «1 بیتی» جهان را معرفی کرد

مایکروسافت بزرگ‌ترین مدل هوش مصنوعی «1 بیتی» جهان را معرفی کرد

مایکروسافت از توسعه بزرگ‌ترین مدل هوش مصنوعی «1 بیتی» با نام BitNet b1.58 2B4T خبر داده است. به گفته ردموندی‌ها، این مدل به‌صورت متن‌باز و تحت مجوز MIT منتشر شده و به اندازه‌ای بهینه است که روی پردازنده‌های معمولی مانند اپل M2 نیز اجرا می‌شود.

مدل‌های 1 بیتی یا به‌اصطلاح BitNet، نسخه‌های فشرده‌ای از مدل‌های هوش مصنوعی هستند که به‌گونه‌ای طراحی شده‌اند تا با استفاده از منابع سخت‌افزاری محدود نیز عملکرد مناسبی داشته باشند. در این مدل‌ها، وزن‌ها تنها با سه مقدار -1، 0 و 1 نمایش داده می‌شوند که این امر باعث کاهش چشمگیر مصرف حافظه و افزایش سرعت اجرا می‌شود.

براساس گزارش تک‌کرانچ، مدل جدید مایکروسافت دارای 2 میلیارد پارامتر است و روی مجموعه‌ داده‌ای شامل 4 تریلیون توکن آموزش دیده است (معادل حدود 33 میلیون کتاب).

عملکرد مدل 1 بیتی مایکروسافت

طبق نتایج منتشرشده، BitNet b1.58 2B4T توانسته در تست‌هایی ازجمله GSM8K (ریاضی ابتدایی) و PIQA (منطق فیزیکی) از مدل‌های هم‌رده خود مانند Llama 3.2 1B (متعلق به متا)، Gemma 3 1B (متعل به گوگل) و Qwen 2.5 1.5B (متعلق به گروه علی‌بابا) امتیاز بهتری دریافت کند.

مایکروسافت همچنین اعلام کرده که این مدل در برخی موارد تا 2 برابر سریع‌تر از مدل‌های مشابه عمل می‌کند و درعین‌حال تنها بخشی از حافظه موردنیاز مدل‌های رایج را مصرف می‌کند.

بااین‌حال، برای دستیابی به این مدل، باید از فریمورک اختصاصی مایکروسافت با نام bitnet.cpp استفاده کرد که درحال‌حاضر تنها با سخت‌افزارهای محدودی سازگار است و پشتیبانی از GPUها (که نقش مهمی در اجرای مدل‌های هوش مصنوعی دارند) را شامل نمی‌شود.

این موضوع نشان می‌دهد که اگرچه BitNetها پتانسیل بالایی برای استفاده در دستگاه‌های کم‌مصرف و محدود دارند، اما چالش سازگاری سخت‌افزاری همچنان یکی از موانع اصلی توسعه آن‌ها محسوب می‌شود.

طراحان خلاقی و فرهنگ پیشرو در زبان فارسی ایجاد کرد. در این صورت می توان امید داشت که تمام و دشواری موجود در ارائه راهکارها و شرایط سخت تایپ به پایان رسد.
پست های مرتبط

گوگل از نسخه جدید جمینای 2.5 پرو با عملکرد برتر در کدنویسی رونمایی کرد

گوگل نسخه جدیدی از مدل زبانی پیشرفته جمینای 2.5 پرو را به‌صورت…

۱۴۰۴-۰۳-۱۶

جنگ تجاری ترامپ باعث تأخیر در انتشار اپل اینتلیجنس در چین شده است

طبق گزارش‌های جدید، تنش‌های ژئوپلیتیکی فزاینده میان آمریکا و چین انتشار هوش…

۱۴۰۴-۰۳-۱۶

میسترال از Mistral Code رونمایی کرد؛ رقیب GitHub Copilot و Cursor

استارتاپ فرانسوی میسترال از ابزار جدید خود با نام Mistral Code رونمایی…

۱۴۰۴-۰۳-۱۶

دیدگاهتان را بنویسید