صفحه اصلی > هوش مصنوعی : میسترال اولین هوش مصنوعی صوتی متن‌باز خود را با نام Voxtral معرفی کرد

میسترال اولین هوش مصنوعی صوتی متن‌باز خود را با نام Voxtral معرفی کرد

میسترال اولین هوش مصنوعی صوتی متن‌باز خود را با نام Voxtral معرفی کرد

استارتاپ فرانسوی میسترال (Mistral) از اولین خانواده مدل‌های صوتی متن‌باز خود با نام «Voxtral» رونمایی کرد. این مدل‌های جدید با عملکردی رقابتی و قیمتی بسیار پایین‌تر، به‌دنبال ارائه یک جایگزین قدرتمند و مقرون‌به‌صرفه در برابر غول‌هایی مثل OpenAI و گوگل هستند.

قابلیت‌های گفتاری هوش مصنوعی یکی از جنبه‌های مهم این فناوری است؛ اما تا به امروز، کسب‌وکارها با یک انتخاب دشوار روبه‌رو بودند: یا از سیستم‌های متن‌باز رایگان با دقت پایین و درک معنایی محدود استفاده کنند، یا به سراغ APIهای بسته و اختصاصی شرکت‌های بزرگ بروند که با وجود عملکرد بهتر، هزینه بسیار بالاتری دارند و کنترل کمتری را در اختیار توسعه‌دهنده قرار می‌دهند. Voxtral دقیقاً برای پر کردن این شکاف طراحی شده است. این پلتفرم، دقت و درک معنایی پیشرفته را در یک مدل متن‌باز و با قیمتی که به گفته میسترال «کمتر از نصف» رقبای اصلی است، ارائه می‌دهد.

هوش مصنوعی صوتی Voxtral میسترال

Voxtral با تکیه بر مدل زبانی بزرگ Mistral Small 3.1 توسعه یافته و قابلیت‌هایی فراتر از تبدیل گفتار به متن ارائه می‌دهد؛ این مدل صوتی قادر به رونویسی فایل‌های صوتی تا ۳۰ دقیقه و درک محتوای آنها تا ۴۰ دقیقه است. همچنین کاربران می‌توانند مستقیماً از محتوای فایل صوتی سؤال بپرسند یا خلاصه‌های ساختاریافته از آن دریافت کنند، بدون نیاز به استفاده از چند مدل مجزا. البته این مدل در زبان‌های پرکاربردی مانند انگلیسی، اسپانیایی، فرانسوی، آلمانی، هندی و ایتالیایی عملکردی پیشرفته دارد.

میسترال این فناوری را در دو اندازه مختلف ارائه کرده است:

  1. Voxtral Small: یک مدل قدرتمند ۲۴ میلیارد پارامتری که برای کارهای بزرگ طراحی شده و عملکردی رقابتی با مدل‌هایی مثل جمینای ۲.۵ فلش، GPT-4o-mini و ElevenLabs Scribe دارد.
  2. Voxtral Mini: یک مدل سبک ۳ میلیارد پارامتری که برای کاربردهای کوچک‌تر مناسب است.

علاوه‌براین، یک نسخه فوق‌العاده ارزان و بهینه‌سازی‌شده فقط برای رونویسی با نام Voxtral Mini Transcribe نیز ارائه شده که به گفته میسترال، عملکردی بهتر از OpenAI Whisper با کمتر از نصف قیمت دارد.

میسترال، به عنوان یکی از بزرگ‌ترین حامیان اکوسیستم متن‌باز، مدل‌های Voxtral را برای دانلود رایگان در Hugging Face قرار داده است. همچنین، استفاده از API آن با قیمت ۰.۰۰۱ دلار در دقیقه آغاز می‌شود و کاربران می‌توانند تا چند هفته دیگر آن را در چت‌بات میسترال، Le Chat، نیز آزمایش کنند.

طراحان خلاقی و فرهنگ پیشرو در زبان فارسی ایجاد کرد. در این صورت می توان امید داشت که تمام و دشواری موجود در ارائه راهکارها و شرایط سخت تایپ به پایان رسد.
پست های مرتبط

توجهی به مسائل ایمنی نمی‌شود

برخی پژوهشگران برجسته حوزه هوش مصنوعی از شرکت‌هایی مانند OpenAI و آنتروپیک،…

۱۴۰۴-۰۴-۲۶

هوش مصنوعی زمان کدنویسی را کاهش داده است

مدیرعامل استارتاپ Perplexity می‌گوید استفاده از ابزارهای کدنویسی مبتنی بر هوش مصنوعی…

۱۴۰۴-۰۴-۲۶

پاسخی به جنجال‌های اخیر؛ xAI دستورالعمل‌های Grok 4 را اصلاح کرد

در پی موجی از انتقادات، شرکت xAI با انتشار به‌روزرسانی‌هایی برای چت‌بات…

۱۴۰۴-۰۴-۲۵

دیدگاهتان را بنویسید