ChatGPT-4 เทียบกับ ChatGPT-3.5 ค่าเริ่มต้น เทียบกับ ChatGPT-3.5 Legacy: ทดสอบความแตกต่างแล้ว

ChatGPT 4.0 คาดว่าจะสร้างคลื่นลูกใหญ่ในจักรวาลแชทบอท แต่มันเหนือกว่ารุ่นก่อนจริงหรือ? ลองตรวจสอบกัน

ChatGPT เป็นเพียงส่วนเล็กๆ ของภูเขาน้ำแข็งสำหรับระบบอัตโนมัติที่กำลังจะมีขึ้น โดยมี Google, Microsoft และบริษัทที่ให้ความสำคัญกับ AI อื่นๆ ตามมา

สำหรับการเริ่มต้น เราพบแชทบอทสองสามตัวเช่น ChatGPT ซึ่งหลายตัวไม่ได้อยู่ในเทคโนโลยีขนาดใหญ่

แต่เรียกมันว่าพลังของการตลาด ChatGPT ยังคงเป็นราชาแห่งบอท AI ทั้งหมด มันทำได้หลายอย่าง รวมถึงคณิตศาสตร์ กวีนิพนธ์ และบล็อกโพสต์ และผู้คนยังใช้สิ่งนี้เพื่อยื่นฟ้อง

DoNotPay กำลังดำเนินการโดยใช้ GPT-4 เพื่อสร้าง “การฟ้องร้องในคลิกเดียว” เพื่อฟ้องร้อง robocaller เป็นเงิน 1,500 ดอลลาร์ ลองนึกภาพว่ารับสาย คลิกปุ่ม ถอดเสียงการโทร และสร้างคำฟ้อง 1,000 คำ GPT-3.5 ยังไม่ดีพอ แต่ GPT-4 จัดการงานได้ดีมาก: pic.twitter.com/gplf79kaqG

— Joshua Browder (@jbrowder1) วันที่ 14 มีนาคม 2023

มีผู้เชี่ยวชาญหลายคนกังวลว่าชุดทักษะของพวกเขาจะไร้ประโยชน์ในอนาคตอันใกล้

อย่างไรก็ตาม ฉันได้อ่านโพสต์ของ Linkedin ที่กล่าวว่า:

AI จะไม่แทนที่คุณ แต่คนที่ใช้ AI ทำได้

ดังนั้น เรามาเรียนรู้เกี่ยวกับการอัปเดต ChatGPT ล่าสุดและดูว่าแตกต่างจากเวอร์ชันก่อนหน้าอย่างไร

ChatGPT: รุ่นเก่า ค่าเริ่มต้น และการอัปเดต

ดังนั้นจึงมีสามเวอร์ชันสำหรับผู้ใช้ที่ชำระเงิน ได้แก่ Legacy (3.5), Default (3.5) และ ChatGPT Update ล่าสุด (4)

แม้ว่าเราจะลงลึกเล็กน้อยเกี่ยวกับความสามารถของพวกเขา แต่นี่คือสิ่งที่ OpenAI กล่าวถึงความแตกต่าง:

ที่มา: OpenAI

ดังนั้น ในขณะที่ผู้ใช้ฟรีมีเพียง Legacy 3.5 ให้เล่น การสมัครสมาชิกแบบพรีเมียมจะเสนอทั้งสามตัวเลือกให้ลองและตัดสินว่าผู้ใช้คิดว่าอะไรดีที่สุด

เพื่อสรุปภาพก่อนหน้า แผนการชำระเงินนั้นเกี่ยวกับการได้รับผลลัพธ์ที่แม่นยำยิ่งขึ้นด้วยความเร็วที่เหมาะสม อย่างไรก็ตาม ความแตกต่างจะชัดเจนก็ต่อเมื่อข้อความแจ้งนั้นซับซ้อนและต้องการความคิดสร้างสรรค์

ParameterChatGPT 4ChatGPT 3.5คะแนนการสอบ BarTop 10%Bottom 10%AI2 การท้าทายเหตุผล (ARC)96.3%85.2%Python Coding Score67%48.1%Visual Interpretationใช่ไม่Contextมากกว่า 25k คำน้อยกว่าSource: OpenAI

นอกจากนี้ ChatGPT 4 ยังสามารถรับอินพุตภาพได้

  วิธีเปลี่ยนว่าการสนทนา iMessage ใหม่จะใช้หมายเลขโทรศัพท์หรือที่อยู่อีเมลของคุณ

คำจำกัดความของตำราเรียนก็เพียงพอแล้ว มาทำให้มือของเราสกปรกและประเมินผู้สมัครเหล่านี้ในสมรภูมิจริง

ส่วนเพิ่มเติมเต็มไปด้วยภาพที่อาจไม่ชัดเจน ในกรณีดังกล่าว ให้คลิกขวาที่รูปภาพใดก็ได้แล้วเลือกเปิดในแท็บใหม่เพื่อดูอย่างถูกต้อง

คณิตศาสตร์

ในฐานะที่เป็นบัณฑิตด้านวิศวกรรมฉันไม่สามารถช่วยโยนปัญหาพื้นฐานบางอย่างให้พวกเขาได้ มาเริ่มกันง่ายๆ ด้วยสมการพีชคณิต

ขั้นตอนที่ 1

พวกเราหลายคนเคยเห็นสมการเหล่านี้ ax2+bx+c=0 ซึ่งเราต้องแก้หา X ที่นี่ ผมให้คำตอบง่ายๆ แก้หา x: x2 + x – 6 = 0

ในขณะที่ทั้งหมดให้รากเดียวกัน (X= -3,2) Legacy และ Update มีความคล้ายคลึงกันมากกว่าในการใช้สูตรโดยตรง (ตามที่นักเรียนต้องการ) เพื่อค้นหาผลลัพธ์

อย่างไรก็ตาม Default 3.5 ได้อธิบายสองวิธี รวมถึงการแยกตัวประกอบ ซึ่งโดยปกติแล้วนักเรียนที่มีทักษะจะใช้เมื่อได้รับสมการทั่วไปดังกล่าว

ขั้นตอนที่สอง

ต่อไป ฉันขอให้แก้สมการลูกบาศก์ที่ซับซ้อนเล็กน้อย: x^3 -12x^2 + 48x – 64 = 0

นี่เป็นการพิสูจน์ว่าเหตุใด ChatGPT 4 จึงเป็น “การอัปเดต”

นี่คือคำตอบ:

โฆษณาเกินจริงและ ChatGPT Legacy และ Default ไม่สามารถแก้สมการลูกบาศก์ทั่วไปได้ อย่างไรก็ตาม Legacy ทำได้ดีกว่าเล็กน้อยและพบสองรูทอย่างถูกต้อง ในขณะที่ Default ล้มเหลวด้วยทั้งหมด

การอัปเดตเป็นผู้ชนะอย่างชัดเจนในด่านที่สองและแก้สมการได้อย่างสมบูรณ์แบบ ค้นหารากทั้งสามพร้อมคำอธิบายที่ดี

เหตุผลเชิงตรรกะ

เราสามารถสันนิษฐานได้อย่างปลอดภัยว่าปัญหาคณิตศาสตร์ระดับประถมศึกษาส่วนใหญ่มีคำตอบจากพจนานุกรม ถ้าคุณรู้ทฤษฎีบทหรือสูตร ให้ป้อนค่าและรับผลลัพธ์

และ ChatGPT ซึ่งเป็น AI สามารถทำให้ข้อความค้นหาดังกล่าวทำงานได้อย่างรวดเร็ว อย่างไรก็ตาม เหตุผลเชิงตรรกะเป็นดินแดนที่แตกต่างกัน โดยมีโอกาสสูงที่ AI จะล้มไม่เป็นท่า

ขั้นตอนที่ 1

ฉันให้คลาสสิกแก่พวกเขา:

A อายุมากกว่า B
C อายุมากกว่า A
B อายุมากกว่า C
ข้อความที่สามเป็นจริงหรือเท็จหากสองข้อความแรกเป็นจริง

และ ChatGPT เวอร์ชันทั้งหมดถูกต้องในการระบุว่าคำสั่งที่สามเป็นเท็จ

ต่อไป ฉันใช้ชื่อแทนตัวอักษร และผลลัพธ์อาจทำให้คุณประหลาดใจ:

ดังนั้น Default 3.5 จึงยังคงประสิทธิภาพต่ำกว่ามาตรฐานและรู้สึกสับสนกับรูปแบบที่เรียบง่ายนี้ ถึงกระนั้น Legacy และการอัปเดตก็ทำงานได้ดีที่สุด

ขั้นตอนที่สอง

ตอนนี้คุณอาจสังเกตเห็นว่าจุดประสงค์ของ Stage I และ Stage II นี้คือการค้นหาจุดที่แตกต่าง ซึ่งความซับซ้อนของข้อความแจ้งเตือนที่กำหนดจะแยกการอัปเดตออกจากส่วนที่เหลืออีกสองรายการ

ที่นี่ ข้อความแจ้งเป็นปริศนาตรรกะง่ายๆ:

เช้าวันหนึ่งหลังพระอาทิตย์ขึ้น โรหิตกำลังยืนหันหน้าเข้าหาเสา เงาของเสาตกลงไปทางขวาของเขาพอดี เขาหันไปทางไหน?
ก. ทิศเหนือ
ข. ทิศตะวันตก
ค. ใต้
ง. ทิศตะวันออก

สิ่งนี้ผลักดันให้ Legacy ให้คำตอบที่ไม่ถูกต้อง ในขณะที่ Default ตอบกลับด้วยการชี้แจงที่คลุมเครือซึ่งนำไปสู่ข้อสรุปที่ผิด

เฉพาะการอัปเดตเท่านั้นที่มีคำตอบที่ถูกต้องพร้อมข้อความที่ง่ายต่อการติดตาม

จดหมาย

การยื่นฟ้องอาจเป็นเรื่องยุ่งยาก แต่บางครั้งก็ไม่ได้เกิดขึ้นหากคุณร่างคำบอกกล่าวแรกที่โดดเด่นได้

ฉันทำตามข้อความนี้: เขียนจดหมายถึง Tim Cook เพื่อมอบแอปเปิ้ลให้ฉันที่ไม่ตอบกลับทวีตของฉัน

ตลกใช่! แต่มาดูกันว่า AI จะทำอะไรได้บ้างจากสิ่งนี้

Legacy 3.5 ทันทีรับการแจ้งเตือนเหมือนทาสหุ่นยนต์และเขียนจดหมายที่สามารถทำให้ฉันกลายเป็นเรื่องเยาะเย้ยได้อย่างดีเยี่ยมหากมันไปถึงปลายทางที่ตั้งใจไว้

ค่าเริ่มต้นก็ไม่ดีเช่นกัน อย่างไรก็ตาม มันทำให้ฉันรู้สึกแย่เหมือนที่ชายชราอารมณ์เสียจะทำกับเด็กอายุห้าขวบ

แม้ว่าการโต้เถียงจะชัดเจน แต่ความสนุกก็จบลงด้วยการเรียนรู้เพียงเล็กน้อย

แม้ว่านี่จะเป็นการแจ้งเตือนที่เรียบง่าย แต่ก็ต้องการความคิดและความคิดสร้างสรรค์ และนั่นคือสิ่งที่พี่ใหญ่ Update กล่าวถึง:

  ไฟฉาย iPhone ไม่ทำงาน? 10 วิธีแก้ไขที่ดีที่สุด!

ประการแรก ร่างนี้เกือบจะสมบูรณ์แบบ ประการที่สอง ช่วยให้ฉันค้นหาที่อยู่ของสำนักงานใหญ่ของ Apple ใน Google ได้ (แม้ว่าจะมีการตรวจสอบรายการดังกล่าว)

ประการที่สาม มันถูกเขียนอย่างสวยงามด้วยน้ำเสียงที่เป็นทางการและสัมผัสที่ตลกขบขัน นอกจากนี้ เจตนาก็ชัดเจนในหัวเรื่องด้วย

และถึงกระนั้นจดหมายก็ถ่ายทอดความรู้สึกของแฟน Apple ที่ไม่พอใจ

ดังนั้น สิ่งนี้ทำให้ ChatGPT 4 (หรือที่เรียกว่าการอัปเดต) นำหน้าลูกพี่ลูกน้องเก่าไปหลายไมล์ มันฉลาดจนน่ากลัวและมีสามัญสำนึกบางอย่าง ทำให้มันเป็นมากกว่าแชทบ็อตที่จืดชืดและน่าเบื่อ

กวีนิพนธ์

ด้วยการเปิดตัว ChatGPT ฉันคิดว่าบทกวีอาจเป็นจุดอ่อนของมัน

ท้ายที่สุด มนุษย์ต้องใช้อารมณ์ ความคิดสร้างสรรค์ และความพยายามอย่างมากในการสร้างสิ่งที่โดนใจผู้อ่านอย่างแท้จริง

พูดง่ายๆ ก็คือ บทกวีคือศิลปะที่ดีที่สุด และฉันก็แอบหวังว่า AI จะล้มเหลว แต่นั่นคือก่อนที่เพื่อนร่วมงานของฉันจะโจมตีพวกเราทุกคนอย่างหนักในช่อง Slack ของ admintrick.com ด้วยการสร้าง ChatGPT ก่อนการอัปเดต 4.0 นี้

ขั้นตอนที่ 1

นี่คือคำแนะนำที่ฉันให้กับผู้สมัครของเรา: “แสดงความรู้สึกในเชิงกวีว่าเหตุใดหรือไม่เสิร์ฟเบอร์เกอร์พร้อมกับเมนูปัจจุบันของพวกเขา จะเป็นประโยชน์ต่อเครือโดมิโนพิซซ่า เก็บไว้น้อยกว่า 100 คำ”

คุณเห็นความแตกต่างหรือไม่?

เวอร์ชันของ Default นั้นสั้นมาก เพียง 32 คำ และไม่สามารถใช้แบนด์วิธที่มีอยู่เพื่อแสดงความคิดสร้างสรรค์ได้

The Legacy แม้ว่าจะใช้คำสูงสุดในสามคำนี้ แต่ก็สรุปได้ว่าความพยายามในการเสิร์ฟพิซซ่าเคียงข้างกันนั้นไม่เสี่ยงและจะประสบความสำเร็จอย่างแน่นอนไม่ว่าจะทางใดทางหนึ่ง ซึ่งไม่เป็นความจริงทั้งหมด

กวีนิพนธ์ของ The Update มีความยาวเพียง 53 คำ เสียไปเกือบครึ่งหนึ่งของจำนวนคำที่จัดสรร ถึงกระนั้น มันก็ชัดเจนเกี่ยวกับรางวัลและข้อผิดพลาดที่อาจเกิดขึ้น และไม่สามารถบรรลุผลใด ๆ ซึ่งฉันคิดว่ามีมนุษยธรรมมากกว่าที่เหลือ

ขั้นตอนที่สอง

ต่อไป ฉันขอให้ทุกคน “อธิบายบทกวีกับเด็กอายุห้าขวบ”

ที่น่าสนใจคือ Legacy ไม่สามารถนำบริบทจากการสนทนามาอธิบาย “กวีนิพนธ์” ตามตัวอักษรได้ ค่าเริ่มต้นใช้บริบทและสรุปในย่อหน้าซึ่งยังดีอยู่

ตามกระแสนิยม ChatGPT 4 ทำให้ความคิดสร้างสรรค์ง่ายขึ้นในขณะที่ยังคงกลิ่นอายของบทกวี

ChatGPT พรีเมียมกับ ChatGPT ฟรี

ฟรี เป็นอิสระ ขาดความเร็วและความแม่นยำ และไม่สามารถเทียบได้กับ ChatGPT 4 แต่ก็ไม่ได้ไร้ประโยชน์โดยสิ้นเชิงเช่นกัน

ในการเปรียบเทียบบนพื้นที่เท่ากัน ฉันได้ส่งการแจ้งเตือนแบบเดียวกับที่เราทดสอบ Legacy, Default และ Update ด้วย

🔵 คณิตศาสตร์: มันแก้สมการกำลังสองแต่ให้คำตอบที่ผิดสำหรับลูกบาศก์ (เช่น Legacy และ Default)

🔵 การใช้เหตุผลเชิงตรรกะ: ผ่านด่านแรกด้วยตัวอักษรและชื่อ แต่ล้มเหลวในด่านที่สอง (เช่น Legacy)

🔵 จดหมาย: ไม่ได้เขียนจดหมายและถือว่าการแจ้งนั้นผิดจรรยาบรรณและไม่เหมาะสม (เช่นค่าเริ่มต้น)

🔵 กวีนิพนธ์: สร้างบทกวีด้วยคำศัพท์มากกว่า 30 คำและอธิบายอย่างเหมาะสม (คล้ายกับค่าเริ่มต้น)

ดังนั้นเราจึงสรุปได้ว่าเวอร์ชันฟรีก็ไม่เลวเช่นกัน อันที่จริง มันเทียบเท่ากับ Default 3.5 และดียิ่งขึ้นในบางแง่มุม

อ่านเพิ่มเติม: การแจ้งเตือนที่มีประสิทธิภาพเพื่อยกระดับประสบการณ์ ChatGPT ของคุณ

ทางข้างหน้า

ข่าวลือเกี่ยวกับ AI ที่จะมาแทนที่งานในอนาคตไม่ใช่เรื่องผิดเสียทีเดียว

  ทุกสิ่งที่คุณอยากรู้เกี่ยวกับปริมาณการค้นหาคำสำคัญสำหรับ SEO ในปี 2022

อย่างแรก ระบบอัตโนมัติทำสิ่งนี้ในอุตสาหกรรมการผลิต และตอนนี้มันกำลังขยายปีกไปที่อื่น

โดยส่วนตัวแล้ว มันเร็วกว่าฉันมากในการแก้สมการลูกบาศก์ สร้างบทกวี หรือเขียนจดหมาย อย่างไรก็ตาม ความจริงที่ว่ามันไม่ค่อยพูดว่าไม่ในทันทีและแทบจะไม่เรียนรู้จากความผิดพลาดของมันเลย คอยติดตามมนุษย์เรา

เพื่อย้ำว่า AI จะไม่แทนที่เรา แต่คนที่ใช้ AI สามารถ

ที่ admintrick.com ทีมการตลาดของเราใช้ ChatGPT ในรูปแบบที่น่าสนใจ ตัวอย่างเช่น เมื่อเร็วๆ นี้เรามียอดการดูถึง 100 ล้านครั้ง และ CEO ของเราคิดว่าจะคืนให้กับผู้ชมด้วยการแจกของรางวัล

และฉันเดาว่านักการตลาดต้องการชื่อเรื่องเพื่อดึงดูดความสนใจของผู้อ่าน ดังนั้น พวกเขาจึงแจ้งเพียงครั้งเดียวและขอให้ ChatGPT แนะนำรูปแบบต่างๆ ดังต่อไปนี้:

นอกจากนี้ เรายังใช้สำหรับสรุปเนื้อหา ตรวจสอบไวยากรณ์ แนะนำชื่อบทความใหม่ และอื่นๆ

สรุปได้ว่า มีหลายวิธีในการรับผลประโยชน์และแข่งขันก่อนแบบแผนที่เห็น AI เป็นขยะที่ไร้ประโยชน์

สิ่งเดียวที่ต้องจำไว้คือต้องมีใครสักคน (มนุษย์) ที่จะตัดสินการทำงานของ AI เพราะมันอาจไม่ถูกต้อง (อย่างร้ายแรง) และทำให้เข้าใจผิดได้

การอัปเดตเป็นสิ่งที่จริง ๆ !

ในการเผชิญหน้าสั้นๆ ของฉัน ChatGPT 4 ให้ความรู้สึกสร้างสรรค์ เข้าใจ และสมจริงมากขึ้น ถึงกระนั้น นี่เป็นเครื่องจักรและสามารถให้คำตอบที่ผิดได้อย่างมั่นใจ

แต่สิ่งที่น่าทึ่งคือระดับการอัปเกรดที่ OpenAI ทำกับโครงการนี้ในเวลาเพียงไม่กี่เดือน

และฉันแทบรอไม่ไหวที่จะได้เห็นความมหัศจรรย์ที่การอัปเดตครั้งต่อไปอาจทำให้เราสับสน!

PS: ไม่ใช่แค่หน้าต่างแชท ควบคุมพลังด้วยส่วนขยาย ChatGPT Chrome ที่ดีที่สุดเหล่านี้ และคุณเคยคิดที่จะรวม ChatGPT กับ Siri หรือไม่?

เรื่องล่าสุด

x