هلدینگ چینی علیبابا از خانواده جدید مدلهای هوش مصنوعی استدلالگر خود با نام Qwen3 رونمایی کرد. علیبابا ادعا میکند مدلهای جدید این شرکت عملکردی مشابه مدلهای گوگل و OpenAI دارند و حتی در مواردی میتوانند از مدلهای این شرکتها پیشی بگیرند.
به گزارش تک کرانچ، این مدلها تحت مجوز «آزاد» از طریق پلتفرمهای Hugging Face و گیتهاب در دسترس کاربران قرار گرفتهاند یا بهزودی عرضه میشوند. اندازه این مدلها از ۰.۶ میلیارد پارامتر تا ۲۳۵ میلیارد پارامتر متغیر است. یک مدل هوش مصنوعی هر چقدر پارامترهای بیشتری داشته باشد، در مهارتهای حل مسئله عملکرد بهتری نشان میدهد.
مدلهای استدلالگر Qwen3 علیبابا بهزودی در دسترس کاربران قرار میگیرند
ظهور و عرضه مدلهای استدلالگر چینی مانند Qwen3 به آزمایشگاههای هوش مصنوعی غربی، مانند OpenAI، فشار بیشتری میآورند تا فناوریهای هوش مصنوعی توانمندتری ارائه دهند. رشد شرکتهای چینی در زمینه هوش مصنوعی همچنین باعث شده سیاستگذاران کشورهای غربی بهسمت محدودکردن دسترسی شرکتهای چینی به تراشهها و فناوریهای روز حرکت کنند.
به گفته علیبابا، مدلهای Qwen3 هیبریدی هستند؛ یعنی هم میتوانند برای حل مسائل پیچیده وقت بگذارند و استدلال کنند هم در سریعترین زمان پاسخ را در دسترس کاربر قرار دهند. با استفاده از مهارت استدلال، مدلهای هوش مصنوعی میتوانند دائم پاسخهای خودشان را بررسی کنند.
برخی مدلها همچنین از معماری ترکیب متخصصان (MoE) استفاده میکنند که میتواند برای پاسخ به پرسشها از نظر محاسباتی کارآمدتر باشد. MoE وظایف بزرگ را به وظایف کوچکتر تقسیم و پردازش آنها را به مدلهای «متخصص» کوچکتر و تخصصیتر واگذار میکند.
به گفته علیبابا، مدلهای Qwen3 از ۱۱۹ زبان پشتیبانی میکنند و روی مجموعهای از دادهها متشکل از نزدیک به ۳۶ تریلیون توکن آموزشدیدهاند. این هلدینگ چینی هفتههای گذشته نیز از مدل هوش مصنوعی استدلالگر تصویری خود رونمایی کرده بود.
علیبابا ادعا میکند قدرت محاسباتی مدلهای Qwen3 نسبت به نسل قبلی این مدلها پیشرفت کرده است. هرچند خانواده مدلهای Qwen3 هنوز نمیتوانند در حد مدلهای o۳ و o4-mini شرکت OpenAI ظاهر شوند، میتوانند همچنان عملکرد قابلتوجهی از خود نشان دهند و برای رفع نیازهای کاربران مناسب باشند.