مایکروسافت از توسعه بزرگترین مدل هوش مصنوعی «1 بیتی» با نام BitNet b1.58 2B4T خبر داده است. به گفته ردموندیها، این مدل بهصورت متنباز و تحت مجوز MIT منتشر شده و به اندازهای بهینه است که روی پردازندههای معمولی مانند اپل M2 نیز اجرا میشود.
مدلهای 1 بیتی یا بهاصطلاح BitNet، نسخههای فشردهای از مدلهای هوش مصنوعی هستند که بهگونهای طراحی شدهاند تا با استفاده از منابع سختافزاری محدود نیز عملکرد مناسبی داشته باشند. در این مدلها، وزنها تنها با سه مقدار -1، 0 و 1 نمایش داده میشوند که این امر باعث کاهش چشمگیر مصرف حافظه و افزایش سرعت اجرا میشود.
براساس گزارش تککرانچ، مدل جدید مایکروسافت دارای 2 میلیارد پارامتر است و روی مجموعه دادهای شامل 4 تریلیون توکن آموزش دیده است (معادل حدود 33 میلیون کتاب).
عملکرد مدل 1 بیتی مایکروسافت
طبق نتایج منتشرشده، BitNet b1.58 2B4T توانسته در تستهایی ازجمله GSM8K (ریاضی ابتدایی) و PIQA (منطق فیزیکی) از مدلهای همرده خود مانند Llama 3.2 1B (متعلق به متا)، Gemma 3 1B (متعل به گوگل) و Qwen 2.5 1.5B (متعلق به گروه علیبابا) امتیاز بهتری دریافت کند.
مایکروسافت همچنین اعلام کرده که این مدل در برخی موارد تا 2 برابر سریعتر از مدلهای مشابه عمل میکند و درعینحال تنها بخشی از حافظه موردنیاز مدلهای رایج را مصرف میکند.
بااینحال، برای دستیابی به این مدل، باید از فریمورک اختصاصی مایکروسافت با نام bitnet.cpp استفاده کرد که درحالحاضر تنها با سختافزارهای محدودی سازگار است و پشتیبانی از GPUها (که نقش مهمی در اجرای مدلهای هوش مصنوعی دارند) را شامل نمیشود.
این موضوع نشان میدهد که اگرچه BitNetها پتانسیل بالایی برای استفاده در دستگاههای کممصرف و محدود دارند، اما چالش سازگاری سختافزاری همچنان یکی از موانع اصلی توسعه آنها محسوب میشود.