OpenAI รีบเร่งเพื่อชนะ Google ในการเปิดตัว 'Multimodal' LLM

โมเดล AI ที่สามารถเข้าใจภาพและข้อความพร้อมกัน! Google และ OpenAI แข่งขันกัน: ธุรกิจจะได้รับประโยชน์อย่างไรจากเทคโนโลยีนี้?

OpenAI รีบเร่งเพื่อชนะ Google ในการเปิดตัว 'Multimodal' LLM

OpenAI และ Google แข่งขันกันในการเปิดตัวโมเดลภาษาขนาดใหญ่แบบ Multimodal

ในยุคที่เทคโนโลยี AI กำลังเติบโตอย่างรวดเร็ว, OpenAI และ Google กำลังแข่งขันกันเพื่อเป็นผู้นำในการเปิดตัว "large-language models" หรือ LLM แบบใหม่ที่เรียกว่า "multimodal". โมเดลแบบนี้ไม่เพียงแต่สามารถทำงานกับข้อความเท่านั้น แต่ยังสามารถทำงานร่วมกับภาพได้ด้วย ทำให้มันมีความสามารถในการสร้างรหัสสำหรับเว็บไซต์จากเพียงการดูภาพวาดของสิ่งที่ผู้ใช้ต้องการ หรือแม้กระทั่งวิเคราะห์ข้อความจากแผนภูมิภาพ.

Google ได้แสดงความคืบหน้าในการพัฒนาโมเดล Gemini multimodal LLM ของตนเอง โดยได้แชร์กับกลุ่มเล็ก ๆ ของบริษัทภายนอก แต่ OpenAI ไม่ยอมแพ้ โดยมีแผนที่จะรวม GPT-4, ซึ่งเป็น LLM ที่ทันสมัยที่สุดของตน, กับคุณสมบัติ multimodal เพื่อที่จะแข่งขันกับ Google.

การแข่งขันนี้ไม่เพียงแต่แสดงถึงความคืบหน้าในเทคโนโลยี AI แต่ยังแสดงถึงความต้องการของตลาดที่ต้องการเทคโนโลยีที่สามารถทำงานร่วมกับข้อมูลหลายรูปแบบ ไม่ว่าจะเป็นข้อความ, ภาพ, หรือแม้กระทั่งวิดีโอ.

เมื่อดูในมุมของผู้ใช้งาน, โมเดลแบบ multimodal น่าจะเป็นประโยชน์มากสำหรับธุรกิจหลายประเภท เช่น ธุรกิจออนไลน์, การออกแบบ, หรือแม้กระทั่งธุรกิจที่ต้องการวิเคราะห์ข้อมูลจากแหล่งข้อมูลหลายแหล่ง. นอกจากนี้ยังสามารถช่วยในการประหยัดเวลาและทรัพยากรในการวิเคราะห์ข้อมูลและสร้างเนื้อหา.

ในส่วนของ OpenAI, การเปิดตัวคุณสมบัติใหม่เหล่านี้อาจช่วยเสริมสร้างภาพลักษณ์และความน่าเชื่อถือของบริษัท และเป็นการยืนยันถึงความเป็นผู้นำในวงการ AI ที่มีการพัฒนาและนวัตกรรมอย่างต่อเนื่อง.

เรื่องราวนี้ยืนยันถึงความเป็นไปได้ของเทคโนโลยี AI ในอนาคต และเราควรรอดูว่าในอนาคต OpenAI และ Google จะพัฒนาและนำเสนอนวัตกรรมใหม่ ๆ อย่างไรต่อไป.

คำถามหรือข้อสังเกต:

  1. การแข่งขันของเทคโนโลยี: ทำไม OpenAI และ Google ถึงต้องการแข่งขันกันในการเปิดตัว large-language models แบบ multimodal?
  2. ประโยชน์ของ Multimodal LLM: โมเดลแบบนี้มีประโยชน์อย่างไรต่อผู้ใช้และธุรกิจ?
  3. การพัฒนาของ OpenAI: ความคืบหน้าล่าสุดของ OpenAI ในการพัฒนา GPT-4 และคุณสมบัติ multimodal คืออะไร?


แปลข่าวจาก # https://www.theinformation.com/articles/openai-hustles-to-beat-google-to-launch-multimodal-llm

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow

benzbenzio รัตนชัย ฐาปนะพงศ์ (อาจารย์เบนซ์) - เจ้าของ BENZIO ผู้สอนขายสินค้าไทยบน Amazon.com คนแรกของไทย และ เป็นผู้เชี่ยวชาญด้านการสอนใช้คำสั่ง ChatGPT คำสั่งภาษาไทย และภาษาอังกฤษ ผู้บุกเบิก BenzioGPT.com สร้างคอร์สเรียนสอนการใช้คำสั่ง ChatGPT มากที่สุดในประเทศไทย ไม่ว่าจะเป็นด้าน Content, Facebook Ads, บทความ, อสังหาริมทรัพย์, ตัวแทนประกันชีวิต และอื่นๆ