ผู้เขียนรวบรวมการอัปเดตสำคัญ ๆ ของ OpenAI ในช่วงระหว่างเดือนมกราคมถึงมีนาคม 2568 เพื่อเป็นแหล่งข้อมูลสำหรับการศึกษาเทคโนโลยีตามความสนใจส่วนตัว นึก ๆ ไปว่า ถ้าวางไว้ใน Blog มีคุณผู้อ่านท่านอื่นที่สนใจเรื่องเดียวกันอยู่ได้ใช้ประโยชน์ด้วยก็คงจะดี คิดได้อย่างนี้แล้วก็จัดไป ... เรียบเรียง สรุป เป็นบทความตามนี้ครับ
ไตรมาสแรกของปี 2568 OpenAI ได้ประกาศอัปเดตเทคโนโลยีที่สำคัญหลายรายการให้กับแพลตฟอร์ม ChatGPT ซึ่งครอบคลุมทั้งการเปิดตัวฟีเจอร์ใหม่ เช่น Advanced Voice Mode และ GPT-4o Image Generation การพัฒนาโมเดลภาษาใหม่อย่าง GPT-4.5 และ o3-mini รวมถึงการเปลี่ยนแปลง API และเครื่องมือใหม่สำหรับนักพัฒนาอย่าง Responses API และ Agents SDK บทความนี้นำเสนอการวิเคราะห์เกี่ยวกับการเปลี่ยนแปลงทั้งหมด ซึ่งบ่งชี้แนวโน้มการพัฒนา AI ที่มุ่งเน้นความสามารถเฉพาะทาง ความเข้าใจโดยสัญชาตญาณ การตอบสนองเชิงภาพและเสียง ตลอดจนการสนับสนุนนักพัฒนาในการสร้าง AI agents ที่ใช้งานได้จริง ทั้งหมดนี้แสดงให้เห็นถึงบทบาทของ ChatGPT ในการขับเคลื่อนนวัตกรรมด้าน AI เชิงสนทนาในยุคปัจจุบัน
การเปิดตัวฟีเจอร์ใหม่และการปรับปรุงฟังก์ชันการทำงาน
Advanced Voice Mode (มีนาคม 2568)
OpenAI ได้อัปเดต Advanced Voice Mode เมื่อวันที่ 24 มีนาคม 2568 เพื่อปรับปรุงการตอบสนอง ลดการขัดจังหวะ และเสริมบุคลิกของ AI โดยใช้โมเดล GPT-4o ผู้ใช้งานแบบชำระเงินจะได้สัมผัสประสบการณ์การสนทนาที่เป็นธรรมชาติ กระชับ และสร้างสรรค์มากขึ้น ทั้งนี้ ยังสะท้อนถึงการแข่งขันในตลาด AI voice assistant ที่เพิ่มสูงขึ้น โดย OpenAI มุ่งพัฒนาให้ AI มีบุคลิกที่น่าสนใจ ใช้งานสนุก และสามารถเชื่อมโยงกับผู้ใช้งานได้ลึกซึ้งยิ่งขึ้น
การสร้างภาพด้วย GPT-4o (มีนาคม 2568)
วันที่ 25 มีนาคม 2568 OpenAI เปิดตัวความสามารถสร้างภาพผ่าน ChatGPT โดยใช้ GPT-4o ผู้ใช้งานสามารถพิมพ์คำอธิบายเพื่อสร้างภาพ พร้อมรองรับคำสั่งซับซ้อน อัตราส่วนภาพ รหัสสี และการสร้างภาพแบบหลายรอบ มีการเรียนรู้ตามบริบทจากภาพที่อัปโหลด และฝัง meta data แบบ C2PA เพื่อความโปร่งใส ฟีเจอร์นี้เปิดให้ผู้ใช้งานฟรีใช้งานได้ พร้อมการเข้าถึงขั้นสูงสำหรับผู้ใช้ Plus และ Pro เป็นการผลักดันการใช้งาน AI เชิงสร้างสรรค์ในชีวิตจริง เช่น การทำโลโก้และไดอะแกรม
เครื่องมือใหม่สำหรับการสร้าง Agents (มีนาคม 2568)
เมื่อวันที่ 11 มีนาคม OpenAI ได้เปิดตัวชุดเครื่องมือใหม่สำหรับนักพัฒนา ซึ่งรวมถึง Responses API และ Agents SDK ฟีเจอร์เหล่านี้ช่วยให้นักพัฒนาสามารถสร้าง AI agents ที่ทำงานอัตโนมัติได้ง่ายขึ้น Responses API ผสานความสามารถของ Chat Completions และ Assistants API เข้าด้วยกัน ขณะที่ Agents SDK ช่วยจัดการเวิร์กโฟลว์ของ agent ได้ทั้งแบบเดี่ยวและหลายตัว พร้อมเครื่องมือในตัวอย่างการค้นหาเว็บ การค้นหาไฟล์ และการใช้งานคอมพิวเตอร์
Operator (มกราคม 2568)
OpenAI ได้เปิดตัว Operator เมื่อวันที่ 23 มกราคม 2568 สำหรับผู้ใช้ Pro ในสหรัฐอเมริกา เป็น AI agent ที่สามารถทำงานบนเว็บได้จริง เช่น การจอง จัดตาราง หรือซื้อสินค้า โดยขับเคลื่อนด้วยโมเดล CUA (Computer-Using Agent) ที่สามารถโต้ตอบกับ GUI ได้ Operator ถือเป็นการก้าวข้ามจาก AI ที่ตอบโต้ข้อความ ไปสู่ระบบอัตโนมัติที่ใช้งานเว็บแทนมนุษย์ และมีแผนจะเปิด API ให้นักพัฒนาใช้งานในไตรมาสที่ 3 ปี 2568
การอัปเดตโมเดลภาษา
GPT-4.5 (กุมภาพันธ์ 2568)
GPT-4.5 หรือชื่อรหัส "Orion" เปิดให้ผู้ใช้ Pro ทดสอบเมื่อวันที่ 27 กุมภาพันธ์ 2568 โดยเน้นความสามารถด้านการสนทนา ความคิดสร้างสรรค์ และ EQ ที่ดีขึ้น แม้ไม่เด่นเรื่องการให้เหตุผลเชิงลึกเท่า o-series แต่ก็เป็นก้าวสำคัญของโมเดลที่เรียนรู้แบบไม่มีผู้สอน
ประสิทธิภาพเมื่อเทียบกับโมเดลอื่น:
เกณฑ์ | GPT-4.5 | GPT-4o | o3-mini |
---|---|---|---|
วิทยาศาสตร์ (GPQA) | 71.4% | 53.6% | 79.7% |
คณิตศาสตร์ (AIME '24) | 36.7% | 9.3% | 87.3% |
หลายภาษา (MMMLU) | 85.1% | 81.5% | 81.1% |
หลายรูปแบบ (MMMU) | 74.4% | 69.1% | - |
การเขียนโค้ด (SWE-Bench Verified) | 38.0% | 30.7% | 61.0% |
o3-mini (มกราคม 2568)
โมเดล o3-mini เปิดตัวเมื่อวันที่ 31 มกราคม 2568 พัฒนาต่อยอดจาก o1-mini โดยเน้น reasoning เชิง STEM และประสิทธิภาพด้านต้นทุน รองรับ structured output, function calling และการสตรีม API พร้อมรองรับภาพ (multimodal) และสามารถปรับระดับ reasoning ได้ (ต่ำ กลาง สูง)
เมื่อเทียบกับ o1-mini:
-
ตอบสนองเร็วขึ้น 24%
-
ลด latency แรกลงได้ 2.5 วินาที
การอัปเดตและการเปลี่ยนแปลง API
โมเดลเสียงใหม่ใน API (มีนาคม 2568)
OpenAI ได้เปิดตัวโมเดลเสียงใหม่ เช่น gpt-4o-mini-tts, gpt-4o-transcribe และ whisper-1 ซึ่งรองรับทั้งการแปลงข้อความเป็นเสียง (TTS) และการถอดเสียง (STT) การเพิ่มรุ่น mini ทำให้เหมาะกับผู้พัฒนาแอปที่ต้องการประสิทธิภาพต้นทุนต่ำ
การอัปเดต Responses API และเครื่องมือในตัว
โมเดลใหม่เช่น gpt-4o-search-preview และ computer-use-preview ถูกเพิ่มใน Responses API พร้อมเครื่องมือในตัวที่ช่วยให้ agents โต้ตอบกับระบบได้หลากหลายมากขึ้น เช่น การค้นหาเว็บหรือใช้งานคอมพิวเตอร์
โมเดลเวอร์ชันเฉพาะ
OpenAI ได้ปล่อยเวอร์ชันใหม่ของ o3-mini (o3-mini-2025-01-31) และ o1-pro รวมถึงเปิดให้ใช้ gpt-4o audio completions บน Azure แสดงถึงความตั้งใจในการกระจายความสามารถสู่แพลตฟอร์มต่าง ๆ
ประสบการณ์ผู้ใช้งานและความคิดเห็นจากผู้เชี่ยวชาญ
เสียงสะท้อนจากผู้ใช้งาน
มีผู้ใช้งานบางรายรายงานว่า:
-
ChatGPT ฉลาดน้อยลงในบางมิติ
-
โมเดลบางรุ่นตอบสั้นลงหรือไม่ลึกซึ้ง
-
ความคิดสร้างสรรค์ลดลง
-
ความสามารถในการสร้างภาพบางช่วงหายไป
อย่างไรก็ตาม ความสามารถใหม่ เช่น GPT-4.5 และการสร้างภาพจาก GPT-4o ก็ได้รับคำชมว่า “ว้าว” และมีประโยชน์จริง
มุมมองจากผู้เชี่ยวชาญ
-
Advanced Voice Mode ถูกมองว่าเป็นก้าวกระโดดของ AI voice assistant
-
Operator ถูกยกให้เป็น Game-Changer ด้านระบบอัตโนมัติ
-
เครื่องมือใหม่ลดอุปสรรคการสร้าง AI agents อย่างมาก
-
GPT-4.5 ถือเป็นการพัฒนาโมเดลแบบไม่มีผู้สอนที่ก้าวหน้า
-
o3-mini เป็นโมเดล reasoning ที่ประสิทธิภาพสูงและคุ้มต้นทุน
บทสรุป
ช่วงต้นปี 2568 ถือเป็นการก้าวกระโดดของ ChatGPT ทั้งในด้านประสบการณ์ผู้ใช้งาน (เสียงและภาพ), การพัฒนาโมเดลเฉพาะทางที่ตอบโจทย์เฉพาะด้าน, และการเสริมพลังให้นักพัฒนาด้วยเครื่องมือที่สร้าง AI agents ได้ง่ายขึ้น แม้จะมีเสียงสะท้อนทั้งเชิงบวกและข้อกังวล แต่ ChatGPT ก็ยังคงรักษาตำแหน่งผู้นำในโลกของ AI เชิงสนทนาได้อย่างมั่นคง