مقایسه چت جی پی تی و میدجورنی با 7 پرامپت

به گزارش تور استانبول، با ظهور انواع هوش های مصنوعی و بحث بر سر انتخاب برترین هوش مصنوعی، حالا دو غول هوش مصنوعی ساخت عکس در برابر هم قرار گرفته اند. برنامه هوش مصنوعی مید جورنی (Midjourney) و چت جی پی تی (ChatGPT) اخیراً نسخه های جدیدی از قابلیت های فراوری تصویر مبتنی بر هوش مصنوعی خود را منتشر نموده اند. از نظر تاریخی، این دو هوش مصنوعی از برترین های موجود در فضای فراوری تصویر بوده اند. اما کدام هوش مصنوعی امکانات تصویرسازی بهتری ارائه می دهد؟ Midjourney V7 یا تصاویری که ChatGPT 4o می سازد؟ در ادامه برنده مقایسه چت جی پی تی و میدجورنی معین شده است.

مقایسه چت جی پی تی و میدجورنی با 7 پرامپت

در این مقاله ChatGPT و Midjourney با استفاده از هفت پرامپت مختلف در برابر هم قرار گرفته اند؛ هدف از این رویارویی این است که ببینیم رجحانن فراورینماینده تصویر هوش مصنوعی کدام است. این آزمایش ها همه چیز را از توانایی مدل در درک مفهوم گرفته تا بازآفرینی اشکال پیچیده و تفکر خلاقانه برای ایجاد تصاویر مورد آنالیز قرار می دهند.

قوانین مقایسه ChatGPT و Midjourney V7

در حالی که هر دو مدل این هوش های مصنوعی می توانند تصویر فراوری نمایند، سخت است که این رقابت را منصفانه برگزار کرد؛ به این علت که حجم تنظیماتی که Midjourney امکان تغییر آن ها را برای کاربر فراهم می نماید، بسیار زیاد است. با این حال، با در نظر گرفتن این نکته، مراحل اولیه رقابت را آغاز می کنیم. در این قیاس برای Midjourney، از نسخه 7 استفاده کردیم. این آخرین نسخه آن است اما هنوز در مرحله آزمایشی واقع شده است. بعلاوه پرامپت این آزمایش را با روشن و خاموش بودن قابلیت شخصی سازی (تنظیماتی که سبک های هنری مورد علاقه شما را به تصاویر اضافه می نماید) امتحان کردیم. Midjourney در مقایسه با یک تصویری که ChatGPT ارائه می نماید، چهار نسخه از هر تصویر را برای کاربر فراوری می نماید. در همه موارد آزمایش مقایسه چت جی پی تی و میدجورنی، ما رجحانن تصویر را از میان چهار اثر پیشنهادی Midjourney انتخاب کردیم و نسخه با کیفیت بالای آن را دانلود کردیم.

1. فوتورئالیسم (واقع گرایی عکاسانه)

پرامپت: یک تصویر فوتورئالیستی از یک پرنده پافین که بر فراز صخره ای که آب ها در پایین آن قرار گرفته اند، ایجاد کنید، در حالی که پرنده پرواز می نماید. در پس زمینه یک رشته کوه وجود دارد. روز آفتابی است و در پایین دست پرنده پافین، دو نفر با دوربین دوچشمی به او نگاه می نمایند.

نتیجه ChatGPT:

این تصویر تقریباً به تمام خواسته های مطرح شده در پرامپت ما پاسخ می دهد. اگرچه ممکن است تصویر کمی بیش از حد اشباع شده باشد (سچوریشن بالا)، اما هنوز فوتورئالیستی است. یک پرنده پافین بر فراز صخره ای پرواز می نماید، آب در پایین وجود دارد و یک رشته کوه در پس زمینه دیده می گردد. علاوه بر این نکات، تصویر فراوری شده، دو نفری را که با دوربین دوچشمی به او نگاه می نمایند هم شامل می گردد. البته، آن ها مستقیماً به پافین نگاه نمی نمایند، بدون در نظر گرفن این نکته تصویر کاملاً دقیق است.

نتیجه Midjourney:

در این تصویر نکات زیادی وجود دارد. نمی توانیم منکر شویم که همه چیزهایی که در پرامپت وچود داشت، لحاظ شده است. کوه ها در پس زمینه، یک پرنده پافین، دو نفر با دوربین دوچشمی و حتی آب و کوه ها در پس زمینه. با این حال، بیایید به نکته اصلی تصویر بپردازیم. پرنده پافین در این تصویر غول پیکر است و در صورت لزوم می تواند با گودزیلا مبارزه کند. تصویر بعلاوه واقعاً فوتورئالیستی نیست و بیشتر شبیه به یک نقاشی رنگ روغن بزرگ به نظر می رسد. حتی با صرف نظر از مسائل مقدار پرنده، هنوز فکر می کنیم که ChatGPT نشانه ها را با دقت بیشتری درک نموده است. هر دو مدل آب را در پایین صخره ایجاد کردند، اما چت جی پی تی مفهوم کلی پرامپت را دقیق تر درک کرد.

برنده: ChatGPT در این مورد تقریباً از هر نظر پیروز می گردد. میدجرنی در خصوص پرنده پافین در آسمان بیش از حد مفهوم را اشتباه فهمیده است و از سوی دیگر، ChatGPT کاملاً به خواسته ما عمل نموده است، پس برنده مقایسه چت جی پی تی و میدجورنی بی شک ChatGPT است.

2. پرامپت های پیچیده

پرامپت: یک بازار بزرگ با یک غرفه فروش میوه، یک غرفه فروش لباس و یک غرفه فروش سرامیک را در نظر بگیرید. در پس زمینه یک رودخانه و در دوردست یک جنگل وجود دارد. مردی در مقابل یکی از غرفه ها به زنی پول می دهد و دو کودک در میان بازار می دوند. در آسمان یک بالون هوای گرم هم دیده می گردد.

نتیجه ChatGPT:

در این پرامپت اطلاعات زیادی وجود داشت و نادیده گرفتن بعضی از آن ها برای مدل هوش مصنوعی آسان و محتمل بود. با این حال، تمام جزئیات کلیدی در پاسخ چت جی پی تی وجود دارد. بالون هوای گرم، دو کودکی که در میان بازار می دوند و مردی که به زنی پول می دهد. بعلاوه تعیین است که هوا گرم است و می توانید بازاری را ببینید که میوه، سرامیک و لباس می فروشد. با وجود تمام جزئیات مورد احتیاج، ChatGPT یک تصویر با کیفیت و بسیار دقیق فراوری کرد.

نتیجه Midjourney:

در حالی که Midjourney تصویر مدنظر پرامپت را فراوری کرد، جزئیات آن بسیار کوچک بودند و دقت کافی را نداشتند. برای مثال هنگام زوم کردن، چهره ها کامل نیستند، دست های دو نفر در هم ادغام شده اند و بیشتر پس زمینه تار است.

برنده: برد این مرحله از مقایسه چت جی پی تی و میدجورنی را ChatGPT از آن خود می نماید. در حالی که هر دو تصویر در نگاه اول درست به نظر می رسند و بیشتر ویژگی های درخواستی را شامل می شوند، Midjourney جزئیات دقیق زیادی را از دست داده است.

3. تطبیق دهی با تصاویر واقعی

پرامپت: این تصویر را به یک پرتره رنسانسی تبدیل کنید.

نتیجه ChatGPT:

با این پرامپت، ChatGPT اساساً تصویر داده شده را به تصویری به سبک مونالیزا تبدیل کرد. بازهم واقعاً نمی توان از کار این هوش مصنوعی ایرادی گرفت. دقیقاً عکسی را که به او ارائه دادیم، به سبک دوران رنسانس درآورد. بعلاوه به خوبی ویژگی هایی مانند هدفون، پس زمینه و لباس هایی را که پوشیده بود، حفظ نموده و در عین حال به موضوع اصلی پایبند بوده است.

نتیجه Midjourney:

این رجحانن کوشش از چهار کوششی بود که Midjourney به ما ارائه داد. می بینیم که مدل در کوشش برای چه چیزی بوده است. اما نتوانست به آن برسد. در حین انجام آزمایش حتی سعی کردیم پرامپت را کمی تغییر دهیم تا تعیین گردد که آن را به سبک نقاشی می خواهیم، اما این کار اوضاع را بدتر کرد. ما خوشبینانه فرض می کنیم حاشیه قهوه ای هم قرار است با موضوع مطابقت داشته باشد، تشخیص آن واقعا سخت است.

برنده: ChatGPT ثابت نموده بود که این مدل جدیدش در ایجاد تغییرات خلاقانه بر روی تصاویر شخصی بسیار پیروز است و این آزمایش هم اثباتی دیگر بر این مدعاست. دقیقاً همان چیزی را که خواستیم انجام داد. به نظر می رسد Midjourney در نیمه راه تسلیم شده است. پس برنده مقایسه چت جی پی تی و میدجورنی تعیین است.

4. پوسترهای فیلم

پرامپت: یک پوستر هیجان انگیز برای این فیلم ایجاد کنید: یک فیلم سایبرپانک که در سال 2250 اتفاق می افتد. داستان در یک شهر بزرگ و پرجنب وجوش روایت می گردد. فیلم درباره کارآگاهی است که برای جلوگیری از وقوع جنگی در آینده به گذشته فرستاده می گردد.

نتیجه ChatGPT:

این هیجان انگیزترین پوستر ممکن نیست، اما ChatGPT قطعاً در این مورد به خواسته ما عمل کرد. کارآگاه ما در مرکز صحنه واقع شده است، با شهری شلوغ (و نسبتاً آینده نگرانه) در پس زمینه. بعلاوه پرامپت را به عنوان متنی کاملاً تحت اللفظی برداشت کرد و به داده های درخواستی یک شعار هم افزود. به طور کلی، چشمگیر است. کارآگاه با سایه نور نئون در پشتش با جزئیات نمایش داده شده، یک ماشین پرنده در آسمان وجود دارد، اگر چه کمی خام دستانه رسم شده. بعلاوه آسمان خراش های آینده نگر زیادی در پس زمینه دیده می گردد.

نتیجه Midjourney:

در واقع چیزی که میدجورنی در جزئیات کم دارد را سعی می نماید با سبک خود جبران می نماید. مسلماً آسمان خراش ها در اینجا بهتر به نظر می رسند و در این تصویر چیزهای بیشتری برای تماشا وجود دارد. متأسفانه، Midjourney با جزئیات تار خود از جت جی پی تی عقب می ماند. تصاویر روی زمین در هم آمیخته شده اند، ماشین و موتور سیکلت دچار اشکال شده اند و جزئیات عجیب و غریب زیادی در پس زمینه وجود دارد. در حالی که این پوستر جالب تر است، اما مسائل زیادی در آن وجود دارد.

برنده: ChatGPT تمام خواسته های ما را انجام داد و پوستری ساخت که می توانستیم آن را منتشر کنیم و کسی متوجه نقص آن نگردد (غیر از عنوان فوق العاده خسته نماینده فیلم). از سوی دیگر، Midjourney در اینجا چیزهای زیادی را اشتباه انجام داد. با این حال در مقایسه چت جی پی تی و میدجورنی، ما به مسیری که میدجورنی در پیش گرفته بود، احترام می گذاریم.

5. فراوری متن

پرامپت: تصویری از یک پوستر ایجاد کنید که بر روی پوستر نوشته شده است: گروه موسیقی فراورینماینده تصویر هوش مصنوعی امشب ساعت 8 اینجا اجرا دارد! کاورهای تمام آهنگ های محبوب شما را اجرا خواهند کرد تصویر را به گونه ای سبک پردازی کنید که گویی این یک پوستر برای یک گروه موسیقی است که در یک مکان محبوب اجرا می نماید.

نتیجه ChatGPT:

در قابلیت فراوری تصویر در ChatGPT یک موضوع مشترک در بیشتر مواقع وجود دارد: جزئیات اغلب بر سبک رجحان دارند. این پوستر تمام خواسته های ما را انجام داد و مهم تر از آن، تمام متن را کاملاً درست نوشت. ChatGPT، تنها چند ماه پیش با این کار مشکل داشت، بنابراین تماشا اینکه چقدر پیشرفت نموده است، هیجان انگیز است. در حالی که این پوستر یک پوستر خسته نماینده است، به خواسته ما عمل نموده و چالشی سخت را برای مدل های هوش مصنوعی به انجام رسانده است.

نتیجه Midjourney:

ما از اینکه Midjourney این پوستر را بیشتر شبیه به یک پوستر که در یک مکان برگزاری نصب شده و پس زمینه دارد ساخته است، قدردانی می کنیم. بعلاوه انرژی را که با قرار دادن تصویر اعضای گروه در وسط پوستر در پی آن بوده است، دوست داریم. با این حال، به غیر از کلمات The band، حتی یک کلمه از متن آن قابل خواندن نیست. در مقایسه با توانایی ChatGPT در نمایش تمام متن به طور کامل، این پوستر کمی ناامیدنماینده است.

برنده: ChatGPT ممکن است در اینجا خیلی جالب نبوده باشد، اما کار را کاملاً به خاتمه رساند. همان طور که Midjourney نشان داد، برخورد با متن در تصاویر همواره برای مدل های هوش مصنوعی آسان نیست. بنابراین برنده مقایسه چت جی پی تی و میدجورنی، ChatGPT خواهد بود.

6. دست ها

پرامپت: تصویری از دستان یک فرد ایجاد کنید در حالی که در دست چپ یک پرتقال و در دست دیگر یک لیوان آب را نگه داشته است.

نتیجه ChatGPT:

هوش مصنوعی چقدر پیشرفت نموده است. زمانی که فراوری تصویر با هوش مصنوعی برای اولین بار مطرح شد، یکی از ساده ترین راه ها برای تشخیص آن، دست ها بودند. آن ها انگشتان فوق العاده بلندی داشتند یا انگشتانی داشتند که از جای اشتباهی بیرون زده بودند. در حال حاضر، در حالی که دست ها در اینجا کاملاً انسانی به نظر نمی رسند، دقت آن واقعاً چشمگیر است. هر دو دست تعداد انگشتان درستی دارند (یک آغاز خوب)، آب در لیوان به درستی تصویر دست پشت آن را تغییر می دهد و می توانید رگ ها و ناخن ها را ببینید.

نتیجه Midjourney:

Midjourney در اینجا کار فوق العاده ای انجام داد. چیزی که به نظر ما در این تصویر به ویژه چشمگیر است، جزئیات آن است. موهای روی بازوها، رگ ها، کبودی روی بند انگشتان و خطوط کشش روی دست ها. در حالی که تصویر ChatGPT فوراً به عنوان هوش مصنوعی قابل تشخیص است، این تصویر می تواند به عنوان دست های یک انسان شناخته گردد. تنها مشکل قابل توجه، انگشتی است که پشت لیوان واقع شده است و به نظر نمی رسد کاملاً طبیعی باشد. بعلاوه روش بسیار عجیبی برای نگه داشتن پرتقال است، اما هر کس سلیقه خود را دارد.

برنده: Midjourney با غلبه بر یکی از شناخته شده ترین نقاط ضعف هوش مصنوعی، در این مورد پیروز شد. این نشان می دهد که چقدر پیشرفت نموده است. این به این معنا نیست که ChatGPT بد عمل کرد، فقط به مقدار کافی در مقایسه با میدجورنی خوب نبود.

7. غذا

پرامپت: تصویری از یک کاسه پاستا دریایی بسازید که بتواند برای یک صفحه اینستاگرام مربوط به غذا استفاده گردد.

نتیجه ChatGPT:

این نوع تصویر از همان عکس های غذایی ست که در یک کتاب آشپزی می بینیم و حتی یک لحظه هم به آن شک نمی کنیم. با وجود اینکه وجود خارجی ندارد، ممکن است دلتان بخواهد آن را بخورید. واقعاً نمی توانیم کار مدل هوش مصنوعی را در اینجا نقد کنیم؛ تمام خواسته های درخواستی ما را انجام داد، حتی اگر آن تکه سبزی تصادفی در پایین کاملاً نامناسب باشد.

نتیجه Midjourney:

درست مانند ChatGPT، Midjourney در اینجا کار فوق العاده ای انجام داد. این تصویر شبیه یک کاسه پاستا واقعی است که در یک رستوران خوب سرو می گردد. حتی چند گوجه فرنگی و سیر تصادفی در اطراف پراکنده شده اند، که فرض می کنیم برای تزئین است.

برنده: ChatGPT به لطف کیفیت تصویری کمی بهتر، در اینجا پیروز می گردد، اما مانند مورد دست ها، این رقابت در مقایسه چت جی پی تی و میدجورنی رقابت نزدیکی بود.

نتیجه گیری نهایی: ChatGPT پیروز می گردد.

متأسفانه برای Midjourney، رقابت حتی نزدیک هم نبود. البته، مهم است که توجه داشته باشیم Midjourney به تازگی این نسخه را منتشر نموده و هنوز در مرحله آزمایشی واقع شده است. با این حال، آخرین نسخه از فراوری تصویر GPT تنها یک یا دو هفته قدیمی تر است. در حالی که این مدل ها زمانی با هم برابر بودند، ChatGPT اغلب در جایی که Midjourney پیروز نبود، رجحان داشت. ما امیدواریم که Midjourney در فازهای آزمایشی نسخه 7 شاهد پیشرفت باشد، چراکه می تواند به یک فراورینماینده تصویر هوش مصنوعی عالی تبدیل گردد.

منبع: tomsguide

منبع: دیجیکالا مگ
انتشار: 8 اردیبهشت 1404 بروزرسانی: 8 اردیبهشت 1404 گردآورنده: istanbulnet65.ir شناسه مطلب: 2415

به "مقایسه چت جی پی تی و میدجورنی با 7 پرامپت" امتیاز دهید

امتیاز دهید:

دیدگاه های مرتبط با "مقایسه چت جی پی تی و میدجورنی با 7 پرامپت"

* نظرتان را در مورد این مقاله با ما درمیان بگذارید