ทิศทางของ AI ในปีนี้และปีต่อๆไปค่อนข้างชัดแล้วว่ามาทาง Multimodal AI ที่สามารถเข้าใจ Text, Vision, Audio ครบจบในตัวเดียว แข่งกันดุมาก
1. โปรเจ็ค “Astra” คืออนาคตของ AI Assistant ที่ Google เอาจริงแล้ว สักที เย้ 555+ ย่อมาจาก Advanced Seeing and Talking Responsive Agent
2. Gemini 1.5 Pro เปิดตัวอย่างเป็นทางการ รับข้อมูลได้ 1 ล้าน Tokens (หนังสือประมาณ 1,500 หน้า) รองรับ 35 ภาษา ใช้งานได้แล้ววันนี้
// ศัพท์ Technical เราเรียกอันนี้ว่า “Context Window” ในงานประกาศว่าจะเพิ่มไปเป็น 2 ล้าน Tokens แล้ว ใช้แบบเหลือๆ
// AI ของ Google ณ เวลานี้คือตัวที่รับข้อมูลได้เยอะที่สุดในโลกเลย แต่เข้าใจไหมอีกเรื่องหนึ่ง
3. อัปโหลดไฟล์เอกสาร Doc, PDF ขึ้นบน Gemini ได้แล้ว แต่ใช้ได้เฉพาะ Gemini Advanced Users เท่านั้น 700 บาทต่อเดือน
4. จุดแข็งของ Google ที่คนอื่นสู้ยากหน่อย คือการ Integrate AI เข้าไปที่ Software Stack ทั้งหมดของบริษัทเพื่อตอบสนองการใช้งานของผู้ใช้งาน 2,000 ล้านคนทั่วโลก
– Search
– Gmail, Docs, Photo
– Workspace แบบครบลูป
5. เปิดตัวฟีเจอร์ “AI Overviews” ใน Google Search ออกมาชนกับ Perplexity ตรงๆ ส่วนตัวคิดว่าดีกว่าเยอะ นี่โปร Google? เปล่าๆ ต้องลองเลย
// Users สามารถเขียน Query แบบ “Super Long Tail” ถามคำถามยาวๆใน Google Search ให้ AI ช่วยหาคำตอบได้เลย เริ่ม Roll Out ที่ประเทศอเมริกาสัปดาห์นี้
// ไม่รู้ว่า Google จะปรับ Business Model ใหม่ยังไง น่าจะกระทบกับเรื่องรายได้โฆษณาพอสมควร อันนี้เดาล้วนๆ คิดว่าภายใน บ. น่าจะมีทางออกแล้ว
6. เปิดตัว “Veo” AI สำหรับสร้างวีดีโอ มีฟีเจอร์ Video Effect และเขียน Prompt เพื่อตัดต่อวีดีโอได้ คาดว่าจะได้เห็นของจริงภายในปีนี้
7. เปิดตัว “Gemini Live” เป็น Speech Model ไว้พูดคุยกับเรา ส่วนหนึ่งของโปรเจ็ค Astra ต่อไปคือเปิดกล้อง เปิดไมค์คุยกับ Gemini ได้ เหมือน GPT-4o ที่เปิดตัวเมื่อวาน ยัํ๊งงงง
8. เปิดตัว “Gems” เป็น Interface ให้เราสร้าง Gemini เวอร์ชันของตัวเอง (ที่มาของชื่อ Gems) อนาคตของ AI จะเน้นที่การทำ “Personalization” มากขึ้น
9. AI แบบ On-Device ทำงานได้เร็วขึ้น และปกป้องความเป็นส่วนตัวของผู้ใช้งาน Pixel คือโทรศัพท์ Android เครื่องแรกๆของโลกที่จะได้ใช้ฟีเจอร์ใหม่ของ Gemini Nano
// Google ดาวน์โหลด Foundation Model มาฝังในชิปสมาร์ทโฟน ใช้พลัง AI ได้แบบไม่ต้องต่ออินเทอร์เน็ต หมดปัญหาเรื่องเน็ตหมด ทำงานไม่ได้ เย้ 555+
10. Google เปิดตัว “Gemini 1.5 Flash” ของแทร่ ที่เน้นความเร็วแบบขั้นสุด High-Volume, High-Frequency Tasks
แถม! ในงาน Google I/O ปีนี้ Speakers พูดคำว่า “AI” ทั้งหมด 120 ครั้ง ยั๊งงง 555+ คุณ Sundar Pichai โยนไฟล์ Transcript ให้ Gemini ช่วยสรุป
แวะมาดู Google I/O Keynote 2024 ได้ที่
ดูวีดีโอ Google I/O ปีนี้จบ คิดว่า Gemini และ Astra ในมุม Multimodal ยังตามหลัง “GPT-4o” พอสมควร (ยกเว้นเรื่อง Context Window)
Sam Altman เคยให้สัมภาษณ์ว่า “ไม่ควรมองข้ามบริษัทอย่าง Google” เพราะพวกเค้ามีพลังและทรัพยากรมากพอที่จะสร้างนวัตกรรมอะไรก็ได้
นวัตกรรมอย่างตัว “T” ใน ChatGPT ก็คิดค้นโดย Google “Transformer” ของแทร่
สรุป Google I/O ปีนี้เน้น AI ล้วนๆ ไม่มีอย่างอื่นแทรก หลายอย่างเหมือนเดาได้ก่อนเข้างาน วันนี้เดี๋ยวลองใช้ Gemini 1.5 เลย ยังเชื่อใน Google เสมอ สุดยอดค้าบบบบ