|

از رقیب اصلی فتوشاپ رونمایی شد

تیم هوش مصنوعی شرکت علی‌بابا اخیراً از یک مدل هوش مصنوعی متن‌باز جدید با نام Qwen-Image Edit رونمایی کرد. این ابزار پیشرفته قادر است تنها با دریافت دستورات متنی ساده، مجموعه‌ای گسترده از ویرایش‌های تصویری پیچیده را انجام دهد؛ عملیاتی که پیش‌تر تنها با نرم‌افزارهای حرفه‌ای مانند فتوشاپ امکان‌پذیر بود.

اقتصاد

ویژگی برجسته Qwen-Image Edit، سرعت و دقت بالای آن در پردازش تصاویر است. کاربران می‌توانند در عرض چند ثانیه تغییرات متنوعی روی عکس‌ها اعمال کنند، از اصلاح رنگ و حذف عناصر ناخواسته گرفته تا ایجاد جلوه‌های هنری و تغییرات ساختاری تصویر. این توانمندی، مدل را به ابزاری کاربردی برای طراحان، عکاسان و علاقه‌مندان به تولید محتوا تبدیل کرده است.

قدرت Qwen-Image Edit ریشه در مدل مادر خود، Qwen-Image، دارد که به دلیل توانایی بی‌نظیرش در رندرکردن متون پیچیده به زبان‌های چینی و انگلیسی شهرت یافته بود. این مدل جدید از یک معماری هوشمندانه «رمزگذاری دوگانه» (Dual Encoding) بهره می‌برد. این یعنی تصویر ورودی به‌طور همزمان به دو بخش مختلف از هوش مصنوعی فرستاده می‌شود: یکی برای درک معنای کلی صحنه و دیگری برای حفظ جزئیات بصری و سبک تصویر اصلی. این رویکرد به مدل اجازه می‌دهد تا دو نوع ویرایش کاملاً متفاوت را با دقتی خیره‌کننده انجام دهد.

هوش مصنوعی جدید علی‌بابا برای ویرایش تصاویر

نکته مهم دیگر این است که Qwen-Image Edit به‌صورت متن‌باز منتشر شده، به این معنی که توسعه‌دهندگان و محققان سراسر جهان می‌توانند به راحتی به کد و مدل آن دسترسی داشته باشند و بر اساس نیاز خود، آن را توسعه یا شخصی‌سازی کنند. این اقدام علی‌بابا، دسترسی گسترده‌تر به فناوری‌های پیشرفته هوش مصنوعی را تسهیل کرده و زمینه نوآوری‌های بیشتر در حوزه ویرایش تصویر با تلفن همراه را نیز فراهم می‌آورد.

نوع اول، ویرایش‌های معنایی است که در آن، مفهوم کلی صحنه تغییر می‌کند اما هویت اصلی اشیا حفظ می‌شود. برای مثال، کاربران توانسته‌اند یک عکس از شهر منهتن را به سبک اسباب‌بازی‌های لگو بازسازی کنند یا یک تصویر را به سبک انیمه‌های استودیو جیبلی درآورند.

نوع دوم، ویرایش‌های ظاهری است که بر روی تغییرات دقیق و موضعی تمرکز دارد. در این حالت، بخش عمده تصویر دست‌نخورده باقی می‌ماند و تنها جزئیات خاصی تغییر می‌کند. نمونه‌های به نمایش درآمده شامل حذف یک تار مو از روی یک پرتره، افزودن یک تابلوی تبلیغاتی با بازتاب دقیق آن در آب، یا تغییر رنگ یک حرف در یک تصویر متنی است.

ویژگی‌ برجسته این مدل جذاب

یکی از برجسته‌ترین ویژگی‌های این مدل، توانایی ویرایش متن چینی و انگلیسی در داخل تصاویر است. کاربران می‌توانند به راحتی متن‌های جدیدی را به پوسترها یا تابلوها اضافه کنند، متن‌های موجود را حذف کنند یا آن‌ها را تغییر دهند، درحالی‌که فونت و سبک اصلی حفظ می‌شود. این قابلیت به ویژه در ویرایش آثار خوشنویسی که نیازمند دقت بالایی هستند، کارایی خود را به اثبات رسانده است.

این مدل به صورت متن‌باز و تحت مجوز آپاچی ۲.۰ منتشر شده است. این بدان معناست که شرکت‌ها و توسعه‌دهندگان می‌توانند به صورت رایگان آن را دانلود و بر روی سخت‌افزارهای خود نصب کنند که این امر می‌تواند منجر به صرفه‌جویی زیادی در هزینه نرم‌افزارهای اختصاصی شود. علاوه‌براین، Qwen-Image Edit از طریق پلتفرم‌های مختلفی مانند Qwen Chat و Hugging Face یا API ابری علی‌بابا (با هزینه ۰.۰۴۵ دلار برای هر تصویر) در دسترس عموم قرار گرفته است.

منبع: دیجیاتو
کدخبر: 359140 سهیل مافی

ارسال نظر