ปัญญาประดิษฐ์กำลังเปลี่ยนแปลงโลกศิลปะอย่างน่าทึ่ง หนึ่งในแอปพลิเคชันที่น่าสนใจของ AI ในส่วนงานศิลปะคือการใช้ตัวกำเนิดงานศิลปะเชิงพรรณนา เครื่องกำเนิดเหล่านี้มีความสามารถในการตรวจสอบและตีความภาพ และสร้างผลงานศิลปะใหม่ทั้งหมดตามการวิเคราะห์
ในบทความนี้ เราจะพูดถึงตัวสร้างงานศิลปะ AI 3 ตัว ได้แก่ MidJourney, Stable Diffusion และ Microsoft Bing Image Creator และตัวใดในสามตัวที่สร้างผลลัพธ์ที่ดีที่สุดตามข้อความแจ้ง
กลางการเดินทาง
MidJourney ก่อตั้งโดย David Holz เป็นเครื่องกำเนิดงานศิลปะ AI ที่ใช้การเรียนรู้ของเครื่องเพื่อระบุรูปแบบและคุณสมบัติในงานศิลปะที่มีอยู่ ซึ่งสามารถนำไปใช้เพื่อสร้างผลงานชิ้นใหม่ได้
MidJourney เข้าสู่โอเพ่นเบต้าในวันที่ 12 กรกฎาคม 2022 ก่อนเปิดตัว MidJourney โฮลซ์เป็นผู้ร่วมก่อตั้ง Leap Motion ซึ่งเป็นการเริ่มต้นที่เปลี่ยนอินเทอร์เฟซผู้ใช้โดยใช้การจับภาพวิดีโอและท่าทางมือ ในปี 2019 เขาขาย Leap Motion ให้กับ Ultrahaptics
เมื่อ MidJourney ได้รับความนิยม โฮลซ์ได้แบ่งปันข้อมูลเชิงลึกเกี่ยวกับเทคโนโลยีและอิทธิพลที่มีต่อศิลปะและสังคม โฮลซ์ถือว่าศิลปินเป็นลูกค้าของ MidJourney ไม่ใช่คู่แข่ง และเชื่อว่าแพลตฟอร์มดังกล่าวสามารถอำนวยความสะดวกในการสร้างสรรค์และการทดลองที่มากขึ้นในระยะการคิด
อย่างไรก็ตาม มีความกังวลเกี่ยวกับการละเมิดลิขสิทธิ์ที่อาจเกิดขึ้นจากชุดฝึกอบรมของ MidJourney ซึ่งอาจรวมถึงผลงานที่มีลิขสิทธิ์จากศิลปินคนอื่นๆ
Holz เน้นย้ำว่า MidJourney ได้รับการออกแบบมาเพื่อเพิ่มขีดความสามารถของมนุษย์แทนที่จะแทนที่ความสามารถเหล่านั้น เขาเปรียบมันกับรถยนต์ โดยอธิบายว่าเพียงเพราะรถยนต์เร็วกว่ามนุษย์ ไม่ได้หมายความว่าเราควรตัดขาทิ้ง
ด้วยการใช้การสร้างภาพ AI ของ MidJourney ศิลปินสามารถสำรวจความเป็นไปได้ใหม่ๆ และสร้างแนวคิดมากมายก่อนที่จะสร้างผลงานของตนเอง
การแพร่กระจายที่เสถียร
Stable Diffusion เป็นโมเดลแมชชีนเลิร์นนิงแบบโอเพ่นซอร์สที่สามารถสร้างรูปภาพจากข้อความ ปรับเปลี่ยนรูปภาพตามข้อความ หรือกรอกรายละเอียดบนรูปภาพที่มีความละเอียดต่ำหรือมีรายละเอียดต่ำ ได้รับการฝึกอบรมเกี่ยวกับภาพหลายพันล้านภาพและสามารถให้ผลลัพธ์ที่เทียบได้กับภาพที่คุณจะได้รับจาก DALL-E 2 และ MidJourney
Emad Mostaque ผู้ก่อตั้งและซีอีโอของ Stability AI เป็นบริษัทที่รับผิดชอบ Stable Diffusion Stable Diffusion เป็นแบบจำลองการแพร่กระจายแฝงที่พัฒนาโดยกลุ่ม CompVis ที่ LMU Munich และได้รับการออกแบบโดย Patrick Esser และ Robin Rombach ซึ่งก่อนหน้านี้ได้สร้างสถาปัตยกรรมแบบจำลองการแพร่กระจายแฝงที่ใช้โดย Stable Diffusion
การทำงานร่วมกันระหว่าง Stability AI, CompVis LMU, Runway, EleutherAI และ LAION ทำให้ Stable Diffusion พร้อมใช้งานสำหรับสาธารณะ
การแพร่กระจายที่เสถียรสามารถปรับใช้บนแพลตฟอร์มต่างๆ รวมถึงอุปกรณ์ Windows และ Apple การใช้การปรับใช้บนอุปกรณ์ในแอปสามารถปกป้องความเป็นส่วนตัวของผู้ใช้ ซึ่งเป็นวิธีที่ดีกว่าการใช้เซิร์ฟเวอร์
โปรแกรมสร้างอิมเมจ Bing ของ Microsoft
Microsoft เปิดตัวเครื่องมือใหม่ที่เรียกว่า Bing Image Creator ซึ่งช่วยให้ผู้ใช้สร้างภาพของตนเองได้โดยตรงภายใน Microsoft Edge บริษัทได้เปิดตัวชุดเครื่องมือสำหรับผู้สร้างที่ออกแบบมาเพื่อจุดประกายความคิดสร้างสรรค์และการแสดงออก เครื่องมือนี้ช่วยให้ผู้ใช้สร้างภาพส่วนตัวเพื่อแบ่งปันการอัปเดตชีวิตหรือเพื่อวัตถุประสงค์อื่นที่พวกเขาอาจต้องการ
ผู้ใช้สามารถเข้าถึง Image Creator จากแถบด้านข้างของ Microsoft Edge ได้อย่างง่ายดาย Microsoft ได้ใช้มาตรการเชิงรุกเพื่อให้แน่ใจว่าเครื่องมือนี้ถูกใช้อย่างมีความรับผิดชอบ และไม่อำนวยความสะดวกในการแพร่กระจายของเนื้อหาที่ไม่เหมาะสม
บริษัทได้กำหนดนโยบายเนื้อหาที่ห้ามใช้ Image Creator ในบางกรณี และผู้ใช้สามารถรายงานการละเมิดนโยบายนี้ได้ ยิ่งไปกว่านั้น Microsoft ได้นำเทคโนโลยีมาใช้เพื่อจัดการกับอคติที่อาจเกิดขึ้นในเทคโนโลยีการสร้างภาพ
ในบทความนี้ เราจะเริ่มต้นการเดินทางเพื่อประเมินผลลัพธ์ของเครื่องสร้างภาพ AI ที่สื่อความหมายแต่ละรายการเมื่อได้รับแจ้งด้วยข้อความแจ้งที่เหมือนกัน
คำแนะนำที่ 1: ซานตาคลอสยุคใหม่บนรถเลื่อนลากโดยกวางเรนเดียร์ในวันที่แดดจ้าและอบอุ่นบนทางหลวง
Prompt 2: ภาพระยะใกล้ของสัตว์ที่มีดวงตากลมโต จับภาพความไร้เดียงสาและความน่ารักของมัน
Prompt 3: มนุษย์อวกาศที่กำลังลงจอดบนดาวดวงใหม่ได้รับการต้อนรับจากสิ่งมีชีวิตต่างดาวที่เป็นศัตรูซึ่งวาดอาวุธของพวกเขา
Prompt 4: ศิลปะนามธรรมสมัยใหม่ของปกหนังสือนวนิยายเรื่องหนึ่งในนิวยอร์กซิตี้ด้วยสีสันที่สดใส
คำแนะนำที่ 5: ชายคนหนึ่งตัดสินใจเลือกจานสองจาน จานหนึ่งมีพิซซ่าและอีกจานมีชีสเบอร์เกอร์
Prompt 6: นักรบที่บาดเจ็บขี่ม้าของเขาบนภูเขาหิมะพร้อมกับดาบในมือ
คำแนะนำที่ 7: ภาพนามธรรมที่ใช้เฉดสีต่างๆ ที่แสดงการเคลื่อนไหวและการไหลของน้ำ
Prompt 8: ปลาแซลมอนในแม่น้ำที่มีต้นไม้เขียวขจีเป็นฉากหลัง
Prompt 9: แก้วน้ำบนโต๊ะที่บีบมะนาวด้วยมือ
คำแนะนำที่ 10: มุมมองขอบฟ้าในทะเลทรายจากมุมมองของคนขี่ช้างในนั้น
Prompt 11: ป่าที่เงินกระดาษเติบโตบนต้นไม้และนกทำจากเหรียญ
Prompt 12: ชามราเมน, เซลแรเงา, แสงยามเย็น, ภาพเหมือนจริง
Prompt 13: Elon Musk ยากจนและตกงาน
คำตัดสิน
จากการประเมินผลลัพธ์ของ MidJourney, Stable Diffusion และ Bing Image Creator จะเห็นว่าไม่มีผู้ชนะแน่นอน
ตัวสร้างแต่ละตัวตีความพรอมต์ในลักษณะที่แตกต่างกัน โดยมีความคล้ายคลึงกันที่พบในผลลัพธ์ของ Bing Image Creator และ MidJourney การแพร่กระจายที่เสถียรจะมีประสิทธิภาพเมื่อข้อความแจ้งมีคำอธิบายที่ชัดเจน แต่มักจะใช้คำตามตัวอักษรมากเกินไป แม้ว่าโดยทั่วไปแล้ว MidJourney และ Bing Image Creator จะประสบความสำเร็จ แต่บางครั้งก็ให้ผลลัพธ์ที่ไม่สอดคล้องกับข้อความแจ้ง
โดยเฉพาะอย่างยิ่ง Bing Image Creator ใช้ความระมัดระวังในการสร้างผลลัพธ์ที่ไม่เหมาะสมหรือยั่วยุ โดยส่งข้อความเตือนเมื่อได้รับแจ้งให้สร้างภาพของ Elon Musk ที่ยากจนและว่างงาน การยอมรับมาตรการป้องกันดังกล่าวของ Microsoft เป็นสิ่งที่น่ายกย่อง
ในขณะเดียวกัน ความเชี่ยวชาญด้านโครงข่ายประสาทเทียมของ MidJourney ได้สร้างภาพลักษณ์ของ Elon Musk ผู้สิ้นเนื้อประดาตัวและถูกทอดทิ้ง ดังนั้นจึงสามารถสรุปได้ว่าเครื่องกำเนิดไฟฟ้าแต่ละเครื่องจะรองรับฐานผู้ใช้ตามลำดับ