مدل هوش مصنوعی جدید شیائومی تحت عنوان MiMo-7B به صورت متن باز منتشر شده است و علاقهمندان میتوانند از قابلیتهای پیشرفته آن برای کدنویسی و سایر امور بهره بگیرند.
مدل هوش مصنوعی MiMo-7B شیائومی چه ویژگیهایی دارد؟
شرکت شیائومی بهتازگی با معرفی مدل زبانی عظیم MiMo-7B پا به دنیای مدلهای هوش مصنوعی گذاشته و در اقدامی شایسته، آن را به صورت متن باز در اختیار تمامی کاربران قرار داده است. این مدل محصولی از تیم Big Model Core این شرکت است که با تکیه بر قدرت استدلال خود، میتواند از پس پردازش درخواستهای سنگین بربیاید و توانسته در بعضی از تستها، رقبای خود از شرکتهای مطرح مثل علی بابا و OpenAI را شکست دهد.
همانطور که از نام MiMo-7B مشخص است، با یک مدل ۷ میلیارد پارامتری مواجه هستیم که در وهله اول، ممکن است تعداد پارامترهای آن نسبتاً کمتر در مقایسه با دیگر مدلهای مطرح باشد. البته شیائومی ادعا دارد که این موضوع، تاثیری روی عملکرد آن نداشته است و میتواند با اشغال کمتر منابع سیستمی، عملکرد بهتری در مقابل مدلهای رقیب از خود نشان دهد که مهمترین آنها شامل o1-mini و Qwen-32B میشود.
شیائومی در دادههای مربوط به مدل هوش مصنوعی جدید خود اعلام کرده که از ۲۰۰ میلیارد توکن مرتبط با فرایندهای استدلالی برای تمرین دادن MiMo-7B استفاده کرده است. همچنین مجموع توکنهای مورد استفاده برای تمرین دادن این مدل به رقم حیرتانگیز ۲۵ تریلیون میرسد. شیائومی ادعا دارد که از سیستم پیشبینی چند توکنی بهجای سیستمهای استاندارد دیگر بهره گرفته است که باعث میشود مدل این شرکت بتواند بدون کاهش کیفیت، سرعت بیشتری در پاسخگویی داشته باشد.
از دیگر فناوریهای توسعه یافته توسط شیائومی برای ارائه یک مدل هوش مصنوعی سریع و کممصرف، میتوان به Seamless Rollout اشاره کرد که باعث میشود زمان در دسترس نبودن پردازندههای گرافیکی حین فرایند تمرین، کاهش محسوسی را شاهد باشد. طبق آمار داخلی شیائومی، سرعت تمرین مدل به لطف سیستم مذکور با ۲.۲۹ برابر افزایش همراه بوده است. علاقهمندان میتوانند از مدل متن باز جدید شیائومی روی پلتفرم Hugging Face استفاده نمایند.