گوگل با مدل Veo 3.1 مرز تازهای در تولید ویدیو گشود گوگل نسخه جدید مدل ویدیوساز خود با نام Veo ۳.۱ را معرفی کرد؛ مدلی که در تولید ویدیو از تصویر و متن ترکیبی دقت بالاتری نشان میدهد و هماکنون از طریق رابط Gemini API در دسترس توسعهدهندگان و کاربران حرفهای قرار گرفته است. ویژگیهای کلیدی نسخه ۳.۱ بهبود […]
گوگل با مدل Veo 3.1 مرز تازهای در تولید ویدیو گشود
گوگل نسخه جدید مدل ویدیوساز خود با نام Veo ۳.۱ را معرفی کرد؛ مدلی که در تولید ویدیو از تصویر و متن ترکیبی دقت بالاتری نشان میدهد و هماکنون از طریق رابط Gemini API در دسترس توسعهدهندگان و کاربران حرفهای قرار گرفته است.
ویژگیهای کلیدی نسخه ۳.۱
بهبود چشمگیر دردرک دستورهای کاربر و اجرای جزئیات بصری.
پشتیبانی از تولید صدا و ویدیو بهصورت همزمان — قابلیتی که برای نخستینبار افزوده شده است.
یکپارچهسازی کامل با ویرایشگر ویدیو Flow بهعنوان موتور اصلی تولید محتوای چندرسانهای گوگل.
دقت بالاتر در بازآفرینی تصویر اولیه. (image‑to‑video) با تمرکز بر حرکت طبیعی و نور واقعی.
مسیر تکامل هوش ویدیومحور
گوگل نخستینبار در رویداد Google I/O ۲۰۲۵ از Veo ۳ پرده برداشت. نسخه ۳.۱ اکنون گام بعدی. همان مسیر است؛ با تأکید بر درک معنایی عمیقتر از متون و هماهنگی صوت و تصویر. بهگفته مهندسان واحد DeepMind، هدف آن است. که کاربر تنها با یک تصویر و چند خط توصیف، بتواند ویدیویی با جلوههای سینمایی و راوی خودکار بسازد.
Veo ۳.۱ را میتوان پاسخ مستقیم گوگل به موج جدید مدلهای مولد ویدیو مانند Sora (OpenAI) دانست. با اضافهشدن. قابلیت صداگذاری همزمان، این فناوری به ابزاری استراتژیک در صنعت تبلیغات دیجیتال، مستندسازی و آموزش تبدیل میشود.
درحالیکه مایکروسافت و OpenAI بر مدلهای. «متن به ویدیو» تمرکز دارند، گوگل اکنون تصویر به ویدیو + صدا را به واقعیت رسانده است؛ گامی مؤثر در مسیر. رقابت میان غولهای هوش مصنوعی.
پایان خبر/ایرانیان تحلیل
- نویسنده : ایرانیان تحلیل





















































