از رقیب اصلی فتوشاپ رونمایی شد
تیم هوش مصنوعی شرکت علیبابا اخیراً از یک مدل هوش مصنوعی متنباز جدید با نام Qwen-Image Edit رونمایی کرد. این ابزار پیشرفته قادر است تنها با دریافت دستورات متنی ساده، مجموعهای گسترده از ویرایشهای تصویری پیچیده را انجام دهد؛ عملیاتی که پیشتر تنها با نرمافزارهای حرفهای مانند فتوشاپ امکانپذیر بود.

ویژگی برجسته Qwen-Image Edit، سرعت و دقت بالای آن در پردازش تصاویر است. کاربران میتوانند در عرض چند ثانیه تغییرات متنوعی روی عکسها اعمال کنند، از اصلاح رنگ و حذف عناصر ناخواسته گرفته تا ایجاد جلوههای هنری و تغییرات ساختاری تصویر. این توانمندی، مدل را به ابزاری کاربردی برای طراحان، عکاسان و علاقهمندان به تولید محتوا تبدیل کرده است.
قدرت Qwen-Image Edit ریشه در مدل مادر خود، Qwen-Image، دارد که به دلیل توانایی بینظیرش در رندرکردن متون پیچیده به زبانهای چینی و انگلیسی شهرت یافته بود. این مدل جدید از یک معماری هوشمندانه «رمزگذاری دوگانه» (Dual Encoding) بهره میبرد. این یعنی تصویر ورودی بهطور همزمان به دو بخش مختلف از هوش مصنوعی فرستاده میشود: یکی برای درک معنای کلی صحنه و دیگری برای حفظ جزئیات بصری و سبک تصویر اصلی. این رویکرد به مدل اجازه میدهد تا دو نوع ویرایش کاملاً متفاوت را با دقتی خیرهکننده انجام دهد.
هوش مصنوعی جدید علیبابا برای ویرایش تصاویر
نکته مهم دیگر این است که Qwen-Image Edit بهصورت متنباز منتشر شده، به این معنی که توسعهدهندگان و محققان سراسر جهان میتوانند به راحتی به کد و مدل آن دسترسی داشته باشند و بر اساس نیاز خود، آن را توسعه یا شخصیسازی کنند. این اقدام علیبابا، دسترسی گستردهتر به فناوریهای پیشرفته هوش مصنوعی را تسهیل کرده و زمینه نوآوریهای بیشتر در حوزه ویرایش تصویر با تلفن همراه را نیز فراهم میآورد.
نوع اول، ویرایشهای معنایی است که در آن، مفهوم کلی صحنه تغییر میکند اما هویت اصلی اشیا حفظ میشود. برای مثال، کاربران توانستهاند یک عکس از شهر منهتن را به سبک اسباببازیهای لگو بازسازی کنند یا یک تصویر را به سبک انیمههای استودیو جیبلی درآورند.
نوع دوم، ویرایشهای ظاهری است که بر روی تغییرات دقیق و موضعی تمرکز دارد. در این حالت، بخش عمده تصویر دستنخورده باقی میماند و تنها جزئیات خاصی تغییر میکند. نمونههای به نمایش درآمده شامل حذف یک تار مو از روی یک پرتره، افزودن یک تابلوی تبلیغاتی با بازتاب دقیق آن در آب، یا تغییر رنگ یک حرف در یک تصویر متنی است.
ویژگی برجسته این مدل جذاب
یکی از برجستهترین ویژگیهای این مدل، توانایی ویرایش متن چینی و انگلیسی در داخل تصاویر است. کاربران میتوانند به راحتی متنهای جدیدی را به پوسترها یا تابلوها اضافه کنند، متنهای موجود را حذف کنند یا آنها را تغییر دهند، درحالیکه فونت و سبک اصلی حفظ میشود. این قابلیت به ویژه در ویرایش آثار خوشنویسی که نیازمند دقت بالایی هستند، کارایی خود را به اثبات رسانده است.
این مدل به صورت متنباز و تحت مجوز آپاچی ۲.۰ منتشر شده است. این بدان معناست که شرکتها و توسعهدهندگان میتوانند به صورت رایگان آن را دانلود و بر روی سختافزارهای خود نصب کنند که این امر میتواند منجر به صرفهجویی زیادی در هزینه نرمافزارهای اختصاصی شود. علاوهبراین، Qwen-Image Edit از طریق پلتفرمهای مختلفی مانند Qwen Chat و Hugging Face یا API ابری علیبابا (با هزینه ۰.۰۴۵ دلار برای هر تصویر) در دسترس عموم قرار گرفته است.
ارسال نظر