MidJourney เทียบกับ Stable Diffusion เทียบกับ Bing Image Creator

ปัญญาประดิษฐ์กำลังเปลี่ยนแปลงโลกศิลปะอย่างน่าทึ่ง หนึ่งในแอปพลิเคชันที่น่าสนใจของ AI ในส่วนงานศิลปะคือการใช้ตัวกำเนิดงานศิลปะเชิงพรรณนา เครื่องกำเนิดเหล่านี้มีความสามารถในการตรวจสอบและตีความภาพ และสร้างผลงานศิลปะใหม่ทั้งหมดตามการวิเคราะห์

ในบทความนี้ เราจะพูดถึงตัวสร้างงานศิลปะ AI 3 ตัว ได้แก่ MidJourney, Stable Diffusion และ Microsoft Bing Image Creator และตัวใดในสามตัวที่สร้างผลลัพธ์ที่ดีที่สุดตามข้อความแจ้ง

สารบัญ

กลางการเดินทาง

MidJourney ก่อตั้งโดย David Holz เป็นเครื่องกำเนิดงานศิลปะ AI ที่ใช้การเรียนรู้ของเครื่องเพื่อระบุรูปแบบและคุณสมบัติในงานศิลปะที่มีอยู่ ซึ่งสามารถนำไปใช้เพื่อสร้างผลงานชิ้นใหม่ได้

MidJourney เข้าสู่โอเพ่นเบต้าในวันที่ 12 กรกฎาคม 2022 ก่อนเปิดตัว MidJourney โฮลซ์เป็นผู้ร่วมก่อตั้ง Leap Motion ซึ่งเป็นการเริ่มต้นที่เปลี่ยนอินเทอร์เฟซผู้ใช้โดยใช้การจับภาพวิดีโอและท่าทางมือ ในปี 2019 เขาขาย Leap Motion ให้กับ Ultrahaptics

  วิธีล้างแคชบน iPhone

เมื่อ MidJourney ได้รับความนิยม โฮลซ์ได้แบ่งปันข้อมูลเชิงลึกเกี่ยวกับเทคโนโลยีและอิทธิพลที่มีต่อศิลปะและสังคม โฮลซ์ถือว่าศิลปินเป็นลูกค้าของ MidJourney ไม่ใช่คู่แข่ง และเชื่อว่าแพลตฟอร์มดังกล่าวสามารถอำนวยความสะดวกในการสร้างสรรค์และการทดลองที่มากขึ้นในระยะการคิด

อย่างไรก็ตาม มีความกังวลเกี่ยวกับการละเมิดลิขสิทธิ์ที่อาจเกิดขึ้นจากชุดฝึกอบรมของ MidJourney ซึ่งอาจรวมถึงผลงานที่มีลิขสิทธิ์จากศิลปินคนอื่นๆ

Holz เน้นย้ำว่า MidJourney ได้รับการออกแบบมาเพื่อเพิ่มขีดความสามารถของมนุษย์แทนที่จะแทนที่ความสามารถเหล่านั้น เขาเปรียบมันกับรถยนต์ โดยอธิบายว่าเพียงเพราะรถยนต์เร็วกว่ามนุษย์ ไม่ได้หมายความว่าเราควรตัดขาทิ้ง

ด้วยการใช้การสร้างภาพ AI ของ MidJourney ศิลปินสามารถสำรวจความเป็นไปได้ใหม่ๆ และสร้างแนวคิดมากมายก่อนที่จะสร้างผลงานของตนเอง

การแพร่กระจายที่เสถียร

Stable Diffusion เป็นโมเดลแมชชีนเลิร์นนิงแบบโอเพ่นซอร์สที่สามารถสร้างรูปภาพจากข้อความ ปรับเปลี่ยนรูปภาพตามข้อความ หรือกรอกรายละเอียดบนรูปภาพที่มีความละเอียดต่ำหรือมีรายละเอียดต่ำ ได้รับการฝึกอบรมเกี่ยวกับภาพหลายพันล้านภาพและสามารถให้ผลลัพธ์ที่เทียบได้กับภาพที่คุณจะได้รับจาก DALL-E 2 และ MidJourney

Emad Mostaque ผู้ก่อตั้งและซีอีโอของ Stability AI เป็นบริษัทที่รับผิดชอบ Stable Diffusion Stable Diffusion เป็นแบบจำลองการแพร่กระจายแฝงที่พัฒนาโดยกลุ่ม CompVis ที่ LMU Munich และได้รับการออกแบบโดย Patrick Esser และ Robin Rombach ซึ่งก่อนหน้านี้ได้สร้างสถาปัตยกรรมแบบจำลองการแพร่กระจายแฝงที่ใช้โดย Stable Diffusion

การทำงานร่วมกันระหว่าง Stability AI, CompVis LMU, Runway, EleutherAI และ LAION ทำให้ Stable Diffusion พร้อมใช้งานสำหรับสาธารณะ

การแพร่กระจายที่เสถียรสามารถปรับใช้บนแพลตฟอร์มต่างๆ รวมถึงอุปกรณ์ Windows และ Apple การใช้การปรับใช้บนอุปกรณ์ในแอปสามารถปกป้องความเป็นส่วนตัวของผู้ใช้ ซึ่งเป็นวิธีที่ดีกว่าการใช้เซิร์ฟเวอร์

โปรแกรมสร้างอิมเมจ Bing ของ Microsoft

Microsoft เปิดตัวเครื่องมือใหม่ที่เรียกว่า Bing Image Creator ซึ่งช่วยให้ผู้ใช้สร้างภาพของตนเองได้โดยตรงภายใน Microsoft Edge บริษัทได้เปิดตัวชุดเครื่องมือสำหรับผู้สร้างที่ออกแบบมาเพื่อจุดประกายความคิดสร้างสรรค์และการแสดงออก เครื่องมือนี้ช่วยให้ผู้ใช้สร้างภาพส่วนตัวเพื่อแบ่งปันการอัปเดตชีวิตหรือเพื่อวัตถุประสงค์อื่นที่พวกเขาอาจต้องการ

  10 สุดยอดลำโพงไร้สายเพื่อฟังเพลงขณะเดินทาง

ผู้ใช้สามารถเข้าถึง Image Creator จากแถบด้านข้างของ Microsoft Edge ได้อย่างง่ายดาย Microsoft ได้ใช้มาตรการเชิงรุกเพื่อให้แน่ใจว่าเครื่องมือนี้ถูกใช้อย่างมีความรับผิดชอบ และไม่อำนวยความสะดวกในการแพร่กระจายของเนื้อหาที่ไม่เหมาะสม

บริษัทได้กำหนดนโยบายเนื้อหาที่ห้ามใช้ Image Creator ในบางกรณี และผู้ใช้สามารถรายงานการละเมิดนโยบายนี้ได้ ยิ่งไปกว่านั้น Microsoft ได้นำเทคโนโลยีมาใช้เพื่อจัดการกับอคติที่อาจเกิดขึ้นในเทคโนโลยีการสร้างภาพ

ในบทความนี้ เราจะเริ่มต้นการเดินทางเพื่อประเมินผลลัพธ์ของเครื่องสร้างภาพ AI ที่สื่อความหมายแต่ละรายการเมื่อได้รับแจ้งด้วยข้อความแจ้งที่เหมือนกัน

คำแนะนำที่ 1: ซานตาคลอสยุคใหม่บนรถเลื่อนลากโดยกวางเรนเดียร์ในวันที่แดดจ้าและอบอุ่นบนทางหลวง

Prompt 2: ภาพระยะใกล้ของสัตว์ที่มีดวงตากลมโต จับภาพความไร้เดียงสาและความน่ารักของมัน

Prompt 3: มนุษย์อวกาศที่กำลังลงจอดบนดาวดวงใหม่ได้รับการต้อนรับจากสิ่งมีชีวิตต่างดาวที่เป็นศัตรูซึ่งวาดอาวุธของพวกเขา

Prompt 4: ศิลปะนามธรรมสมัยใหม่ของปกหนังสือนวนิยายเรื่องหนึ่งในนิวยอร์กซิตี้ด้วยสีสันที่สดใส

คำแนะนำที่ 5: ชายคนหนึ่งตัดสินใจเลือกจานสองจาน จานหนึ่งมีพิซซ่าและอีกจานมีชีสเบอร์เกอร์

Prompt 6: นักรบที่บาดเจ็บขี่ม้าของเขาบนภูเขาหิมะพร้อมกับดาบในมือ

คำแนะนำที่ 7: ภาพนามธรรมที่ใช้เฉดสีต่างๆ ที่แสดงการเคลื่อนไหวและการไหลของน้ำ

Prompt 8: ปลาแซลมอนในแม่น้ำที่มีต้นไม้เขียวขจีเป็นฉากหลัง

Prompt 9: แก้วน้ำบนโต๊ะที่บีบมะนาวด้วยมือ

คำแนะนำที่ 10: มุมมองขอบฟ้าในทะเลทรายจากมุมมองของคนขี่ช้างในนั้น

Prompt 11: ป่าที่เงินกระดาษเติบโตบนต้นไม้และนกทำจากเหรียญ

Prompt 12: ชามราเมน, เซลแรเงา, แสงยามเย็น, ภาพเหมือนจริง

Prompt 13: Elon Musk ยากจนและตกงาน

คำตัดสิน

จากการประเมินผลลัพธ์ของ MidJourney, Stable Diffusion และ Bing Image Creator จะเห็นว่าไม่มีผู้ชนะแน่นอน

ตัวสร้างแต่ละตัวตีความพรอมต์ในลักษณะที่แตกต่างกัน โดยมีความคล้ายคลึงกันที่พบในผลลัพธ์ของ Bing Image Creator และ MidJourney การแพร่กระจายที่เสถียรจะมีประสิทธิภาพเมื่อข้อความแจ้งมีคำอธิบายที่ชัดเจน แต่มักจะใช้คำตามตัวอักษรมากเกินไป แม้ว่าโดยทั่วไปแล้ว MidJourney และ Bing Image Creator จะประสบความสำเร็จ แต่บางครั้งก็ให้ผลลัพธ์ที่ไม่สอดคล้องกับข้อความแจ้ง

  ปรับปรุงกระบวนการสรรหาของคุณด้วย Talent Mapping [5 Templates]

โดยเฉพาะอย่างยิ่ง Bing Image Creator ใช้ความระมัดระวังในการสร้างผลลัพธ์ที่ไม่เหมาะสมหรือยั่วยุ โดยส่งข้อความเตือนเมื่อได้รับแจ้งให้สร้างภาพของ Elon Musk ที่ยากจนและว่างงาน การยอมรับมาตรการป้องกันดังกล่าวของ Microsoft เป็นสิ่งที่น่ายกย่อง

ในขณะเดียวกัน ความเชี่ยวชาญด้านโครงข่ายประสาทเทียมของ MidJourney ได้สร้างภาพลักษณ์ของ Elon Musk ผู้สิ้นเนื้อประดาตัวและถูกทอดทิ้ง ดังนั้นจึงสามารถสรุปได้ว่าเครื่องกำเนิดไฟฟ้าแต่ละเครื่องจะรองรับฐานผู้ใช้ตามลำดับ

เรื่องล่าสุด

x