ใหม่วันนี้: GPT Image 2, Gemini Omni และ happyhorse1.0 ถ่ายทอดสดแล้ว
ขับเคลื่อนโดย Google DeepMind

Gemini Omni — สร้างและแก้ไขวิดีโอด้วย AI

Gemini Omni ผสมผสานความเข้าใจทางฟิสิกส์ตามสัญชาตญาณ การใช้เหตุผลหลายรูปแบบ และการแก้ไขการสนทนาไว้ในโมเดลเดียว อัปโหลดรูปภาพ บรรยายฉาก หรือปล่อยคลิปอ้างอิง และรับชมเป็นวิดีโอที่มีการเคลื่อนไหว มีเสียง และดูสมจริง

ขับเคลื่อนโดย Google DeepMind
ข้อความ + รูปภาพ + เสียง + อินพุตวิดีโอ
เครดิตฟรี — ไม่มีบัตรเครดิต

อินพุตวิดีโอ

4เครดิต
ขับเคลื่อนโดย Google DeepMind

What Is Gemini Omni?

Gemini Omni is Google DeepMind's new multimodal AI model that creates and edits videos from any combination of inputs — text prompts, images, audio clips, and reference videos. It's where Gemini's reasoning ability meets generative media, producing videos grounded in real-world physics, history, and cultural context.

Unlike traditional AI video generators that just turn a text prompt into a clip and call it done, Gemini Omni works through natural conversation. You don't rewrite prompts — you talk to it. Change the camera angle, swap an object, add music, remix a scene. Every edit builds on the last, keeping characters and scenes consistent.

Released in May 2026, Gemini Omni Flash is the first model in the Omni family — and it's available right now in the Gemini app, Google Flow, and YouTube Shorts. Future Omni models will expand to support image and audio output alongside video.

ความสามารถ

ความสามารถหลัก 6 ประการของ Gemini Omni

Gemini Omni เป็นโมเดลวิดีโอ AI แรกที่ผสมผสานการสร้างหลายรูปแบบ การแก้ไขการสนทนา ฟิสิกส์ในโลกแห่งความเป็นจริง และการแสดงข้อความชั้นนำในระบบเดียว

สร้างวิดีโอจากอินพุตใดก็ได้

ป้อนข้อความ รูปภาพ คลิปเสียง หรือวิดีโออ้างอิง — Gemini Omni เปลี่ยนการรวมกันใดๆ ให้เป็นวิดีโอที่มีเสียงเนทีฟ ความละเอียดสูงสุด 4K ไม่จำเป็นต้องใช้เครื่องมือแยกต่างหากสำหรับอินพุตประเภทต่างๆ

สร้างวิดีโอจากอินพุตใดก็ได้

แก้ไขผ่านการสนทนาที่เป็นธรรมชาติ

อย่าเรียนรู้ไทม์ไลน์หรือโปรแกรมแก้ไขโหนด เพียงอธิบายสิ่งที่คุณต้องการเปลี่ยนแปลง เช่น "ทำให้รถเป็นสีแดง" "เปลี่ยนเป็นไฟชั่วโมงทอง" "เพิ่มฝนในพื้นหลัง" ทุกคำสั่งสร้างขึ้นจากคำสั่งสุดท้าย โดยรักษาความสม่ำเสมอของฉาก

แก้ไขผ่านการสนทนาที่เป็นธรรมชาติ

การแสดงข้อความระดับชั้นนำ

ต้องการชื่อบนหน้าจอ คำบรรยาย หรือการจำลอง UI ในวิดีโอของคุณหรือไม่? Gemini Omni เรนเดอร์ข้อความด้วยความแม่นยำที่ดีที่สุดในอุตสาหกรรม — คมชัด อ่านได้ และซิงค์กับการกระทำบนหน้าจอ ไม่มีข้อความ AI ที่อ่านไม่ออกอีกต่อไป

การแสดงข้อความระดับชั้นนำ

ฟิสิกส์โลกแห่งความจริงและความรู้ระดับโลก

วัตถุตก เด้ง และชนกันตามธรรมชาติ ฉากต่างๆ เคารพความถูกต้องทางประวัติศาสตร์ หลักการทางวิทยาศาสตร์ และบริบททางวัฒนธรรม Gemini Omni ใช้ความรู้อันกว้างขวางของ Gemini เพื่อสร้างวิดีโอของคุณให้เป็นจริง ไม่ใช่แค่รูปแบบภาพเท่านั้น

ฟิสิกส์โลกแห่งความจริงและความรู้ระดับโลก

ตัวละคร ฉาก และการแก้ไขหลายเทิร์นที่สอดคล้องกัน

ใบหน้า เสื้อผ้า และพื้นหลังของตัวละครของคุณจะมีความสม่ำเสมอในการตัดต่อหลายรอบ ไม่มีอีกต่อไป "AI จะลืมว่าตัวละครของฉันเป็นอย่างไรระหว่างช็อต"

ตัวละคร ฉาก และการแก้ไขหลายเทิร์นที่สอดคล้องกัน

เสียงพูดและเสียงเนทิฟที่ดีที่สุดในระดับเดียวกัน

วิดีโอมาพร้อมกับเสียงที่ซิงค์ เพลงประกอบ เสียงพากย์ และเอฟเฟกต์เสียงถูกสร้างขึ้นโดยธรรมชาติ ไม่จำเป็นต้องส่งออกไปยังเครื่องมือเสียงและซิงค์ใหม่

เสียงพูดและเสียงเนทิฟที่ดีที่สุดในระดับเดียวกัน
วิธีการใช้งาน

สร้างวิดีโอแรกของคุณใน 3 ขั้นตอน

เรียนรู้วิธีใช้ Gemini Omni ในสามขั้นตอนง่ายๆ เริ่มต้นจากการป้อนข้อมูลใดๆ ไม่ว่าจะเป็นข้อความ รูปภาพ เสียง หรือวิดีโอ และปรับแต่งผ่านการสนทนาที่เป็นธรรมชาติ

01
1

เริ่มจากอะไรก็ได้

อธิบายความคิดของคุณในประโยค หรืออัปโหลดรูปภาพ ภาพร่างคร่าวๆ คลิปเสียง หรือวิดีโออ้างอิง Gemini Omni ยอมรับข้อความ รูปภาพ เสียง และวิดีโอ — ผสมและจับคู่ตามที่คุณต้องการ คุณจะเห็นการแสดงตัวอย่างภายในไม่ถึงนาที

02
2

โดยตรงในการแชท

อย่าเขียนข้อความใหม่ — แค่พูดในสิ่งที่คุณต้องการ "จงทำให้เป็นกลางคืนแทนที่จะเป็นกลางวัน" "เปลี่ยนเพลงให้มีพลังมากขึ้น" "เพิ่มการ์ดชื่อเรื่องที่จุดเริ่มต้น" การแก้ไขทุกครั้งจะซ้อนกันจากการแก้ไขก่อนหน้า ทำให้วิดีโอของคุณมีความสอดคล้องกัน

03
3

สร้าง รีมิกซ์ และส่งออก

พอใจกับวิดีโอของคุณไหม? ส่งออกได้สูงสุด 4K ด้วยเสียงที่ซิงค์ ต้องการลองทิศทางอื่นหรือไม่? รีมิกซ์จากทุกขั้นตอน สลับสไตล์ เปลี่ยนการกระทำ เพิ่มตัวละครใหม่ ส่งออกเวอร์ชันได้มากเท่าที่คุณต้องการ

กรณีการใช้งาน

Gemini Omni เหมาะกับใคร?

ตั้งแต่ผู้สร้างเนื้อหาไปจนถึงนักออกแบบผลิตภัณฑ์ Gemini Omni เข้ากับขั้นตอนการทำงานเชิงสร้างสรรค์อย่างแท้จริง ไม่ใช่แค่คลิปที่ทำเพียงครั้งเดียว

ผู้สร้าง YouTube และ TikTok

เปลี่ยนไอเดียหนึ่งให้เป็นวิดีโอขนาดสั้นหลายรูปแบบ ทั้งแนวตั้ง แนวนอน และแบบต่างๆ เพิ่มข้อความบนหน้าจอที่แสดงผลได้อย่างถูกต้องจริง รีมิกซ์คลิปที่มีประสิทธิภาพดีที่สุดของคุณให้เป็นรูปแบบใหม่ๆ โดยไม่ต้องถ่ายทำใหม่

นักการตลาดและทีมโฆษณา

สร้างการสาธิตผลิตภัณฑ์ โฆษณาโซเชียล และวิดีโออธิบายจากรูปภาพผลิตภัณฑ์และข้อมูลสรุป สลับพื้นหลัง เพิ่มการสร้างแบรนด์ และเรนเดอร์ข้อความซ้อนทับ — ทั้งหมดในเซสชันแชทเดียว ส่งเร็วกว่ารอเอเจนซี่

นักการศึกษาและผู้สร้างหลักสูตรออนไลน์

สร้างวิดีโออธิบายที่ถูกต้องตามภาพซึ่งมีพื้นฐานทางวิทยาศาสตร์ ประวัติศาสตร์ และคณิตศาสตร์อย่างแท้จริง ความรู้ระดับโลกของ Gemini Omni หมายความว่าแอนิเมชั่นของคุณเคารพข้อเท็จจริง ไม่ใช่แค่รูปแบบภาพเท่านั้น เพิ่มสมการ ป้ายกำกับ และไดอะแกรมบนหน้าจอที่แสดงอย่างชัดเจน

ผู้สร้างภาพยนตร์และศิลปินสตอรี่บอร์ด

ทดสอบแนวคิดของฉากในไม่กี่นาทีแทนที่จะเป็นวัน อัปโหลดภาพร่างสตอรีบอร์ด อธิบายแอ็กชัน และรับตัวอย่างภาพเคลื่อนไหวที่คุณสามารถปรับแต่งผ่านการสนทนาได้ อ้างอิงสถานที่จริง แสงเฉพาะ และการเคลื่อนไหวของกล้อง

นักออกแบบผลิตภัณฑ์และทีมงาน UI/UX

สร้างบทสรุปของแอปและการสาธิต UI ด้วยข้อความที่อ่านง่าย การแสดงข้อความของ Gemini Omni อยู่ในระดับชั้นนำ — การจำลองของคุณดูเหมือนหน้าจอจริง ไม่ใช่การประมาณค่าแบบ AI

ทำไมต้องเลือก

เหตุใดจึงเลือก Gemini Omni เหนือเครื่องมือวิดีโอ AI อื่น ๆ

ไม่มีโมเดลวิดีโอ AI อื่นใดที่รวมการใช้เหตุผล การป้อนข้อมูลหลายรูปแบบ การแก้ไขการสนทนา และการแสดงข้อความไว้ในระบบเดียว

การแก้ไขการสนทนา — พูดคุยกับมันเหมือนบรรณาธิการ

อย่าเรียนรู้ไทม์ไลน์หรือเขียนข้อความเตือนซ้ำ เพียงพูดสิ่งที่คุณต้องการเปลี่ยนแปลง เหมือนคุณกำลังพูดคุยกับบรรณาธิการ การแก้ไขทุกครั้งจะเรียงซ้อนกันในตอนสุดท้าย ทำให้ตัวละครและฉากมีความสอดคล้องกันในแต่ละเทิร์น

ต่อเนื่องหลายรูปแบบจาก Ground Up

ป้อนข้อความ รูปภาพ สเก็ตช์ เสียง หรือคลิปอ้างอิง ในรูปแบบใดก็ได้ เครื่องมืออื่นๆ จะล็อคคุณให้แสดงข้อความแจ้งเท่านั้น Gemini Omni ยอมรับและเข้าใจอินพุตทุกประเภทโดยกำเนิด

ฟิสิกส์และความรู้ในโลกแห่งความเป็นจริง

วิดีโออธิบายของคุณเคารพวิทยาศาสตร์และประวัติศาสตร์ที่แท้จริง การสาธิตผลิตภัณฑ์ของคุณเคลื่อนไหวได้เหมือนวัตถุจริง ไม่มี "ความแปลกประหลาดของ AI" ในการที่สิ่งต่าง ๆ ตกลง เด้ง หรือโต้ตอบ — กลไกการให้เหตุผลของ Gemini Omni รองรับทุกเฟรมในความเป็นจริง

การแสดงข้อความชั้นนำ

ชื่อบนหน้าจอ ป้ายกำกับ และข้อความ UI ยังคงคมชัดและอ่านง่าย สำหรับโฆษณา บทช่วยสอน และการสาธิตแอป เหตุผลเพียงอย่างเดียวคือเหตุผลที่ควรเปลี่ยน ไม่มีข้อความ AI ที่อ่านไม่ออกที่จะทำลายภาพที่สมบูรณ์แบบอีกต่อไป

Google DeepMind ระบบนิเวศ

สร้างโดยทีมงานที่อยู่เบื้องหลัง Gemini, Veo และ Imagen บูรณาการกับ YouTube Shorts, Google Flow และแอปราศีเมถุน คุณกำลังสร้างบนโครงสร้างพื้นฐานที่จัดส่งให้กับหลายพันล้าน — โดยมีลายน้ำ SynthID และใบรับรองเนื้อหา C2PA ในตัว

ราคา

เลือกแผนที่เหมาะกับคุณที่สุด

สตาร์ทเตอร์

US$9.9/เดือน

ประสบการณ์ระดับเริ่มต้น อุปสรรคในการเข้าต่ำ


  • 60 เครดิตต่อเดือน (ประมาณ 20 วิดีโอ)
  • ตัวเลือกการชำระเงินรายเดือน/รายปี ยกเลิกได้ตลอดเวลา
  • เหมาะสำหรับมือใหม่และใช้งานเบาๆ
  • ดูและจัดการประวัติการสร้างวิดีโอของคุณได้ตลอดเวลา
  • ใช้ในเชิงพาณิชย์
  • ฝ่ายสนับสนุนลูกค้าตลอด 24 ชั่วโมงทุกวัน
    ยอดนิยม

    โปร

    US$23.9/เดือน

    รุ่นแนะนำหลัก คุ้มราคาที่สุด


    • 150 เครดิตต่อเดือน (ประมาณ 50 วิดีโอ)
    • ตัวเลือกการชำระเงินรายเดือน/รายปี ยกเลิกได้ตลอดเวลา
    • ตัวเลือกที่คุ้มค่าที่สุดสำหรับผู้สร้างรายบุคคลและทีมขนาดเล็ก
    • ดูและจัดการประวัติการสร้างวิดีโอของคุณได้ตลอดเวลา
    • ใช้ในเชิงพาณิชย์
    • ฝ่ายสนับสนุนลูกค้าตลอด 24 ชั่วโมงทุกวัน

      สตูดิโอ

      US$39.9/เดือน

      รุ่นมืออาชีพสำหรับผู้สร้างที่มีความถี่สูง


      • 270 เครดิตต่อเดือน (ประมาณ 90 วิดีโอ)
      • ตัวเลือกการชำระเงินรายเดือน/รายปี ยกเลิกได้ตลอดเวลา
      • เหมาะสำหรับผู้สร้างมืออาชีพและการสร้างความถี่สูง
      • ดูและจัดการประวัติการสร้างวิดีโอของคุณได้ตลอดเวลา
      • ใช้ในเชิงพาณิชย์
      • ฝ่ายสนับสนุนลูกค้าตลอด 24 ชั่วโมงทุกวัน
        เติมเงิน

        ต้องการเครดิตเพิ่มไหม?

        ซื้อครั้งเดียว เพิ่มเครดิตได้ตลอดเวลา — ใช้ได้กับทุกแผน

        เติมเงินครั้งเดียว
        US$9.9
        60 เครดิต
        ใช้ได้ 30 วัน
        พร้อมสำหรับการสร้างวิดีโอเพิ่มเติม
        ใช้ได้กับทุกแผนการสมัครสมาชิก
        คำถามที่พบบ่อย

        คำถามที่พบบ่อยเกี่ยวกับ Gemini Omni

        Gemini Omni คืออะไร?
        Gemini Omni คือโมเดล AI ต่อเนื่องหลายรูปแบบของ Google DeepMind ที่สร้างและแก้ไขวิดีโอจากอินพุตข้อความ รูปภาพ เสียง และวิดีโอ เปิดตัวในเดือนพฤษภาคมปี 2026 โดยสร้างขึ้นจากกลไกการให้เหตุผลของ Gemini ซึ่งหมายความว่าสามารถเข้าใจฟิสิกส์ ประวัติศาสตร์ และบริบท ไม่ใช่แค่รูปแบบการมองเห็นเท่านั้น
        Gemini Omni ฟรีหรือเปล่า? มีค่าใช้จ่ายเท่าไร?
        ใช่ — ลงทะเบียนแล้วคุณจะได้รับเครดิตฟรีเพื่อเริ่มสร้างทันที ไม่ต้องใช้บัตรเครดิต เมื่อคุณใช้เครดิตทดลองใช้แล้ว คุณสามารถซื้อแพ็คเกจเครดิตเพิ่มเติมเพื่อสร้างเครดิตต่อไปได้ ไม่มีการสมัครสมาชิก จ่ายเฉพาะสิ่งที่คุณใช้
        Gemini Omni แตกต่างจาก Veo อย่างไร?
        Veo เป็นโมเดลวิดีโอภาพยนตร์เฉพาะทางของ Google ที่เน้นไปที่การสร้างข้อความเป็นวิดีโอที่มีความเที่ยงตรงสูง Gemini Omni ก้าวไปอีกขั้น — โดยเพิ่มอินพุตหลายรูปแบบ (รูปภาพ เสียง วิดีโอ) การแก้ไขการสนทนาแบบหลายเลี้ยว ความเข้าใจฟิสิกส์ในโลกแห่งความเป็นจริง และการแสดงข้อความระดับชั้นนำ คิดว่า Gemini Omni เป็นรุ่นต่อไปที่ผสมผสานคุณภาพการมองเห็นของ Veo เข้ากับความสามารถในการให้เหตุผลของ Gemini
        ฉันจะเริ่มต้นกับ Gemini Omni ได้อย่างไร
        ลงทะเบียนฟรี — คุณจะได้รับเครดิตทันทีโดยไม่ต้องรอคิว เมื่อเข้าสู่ระบบแล้ว ให้พิมพ์ข้อความแจ้ง อัปโหลดภาพอ้างอิง หรือเลือกเทมเพลต วิดีโอแรกของคุณแสดงผลในไม่กี่นาที ไม่จำเป็นต้องดาวน์โหลดหรือติดตั้ง ทุกอย่างทำงานในเบราว์เซอร์ของคุณ
        Gemini Omni เปรียบเทียบกับ Sora 2 และ Seedance 2 เป็นอย่างไร
        Gemini Omni ข้อได้เปรียบที่สำคัญคือการแก้ไขการสนทนา คุณปรับแต่งผ่านการแชท ไม่ใช่โดยการเขียนข้อความแจ้งใหม่ตั้งแต่ต้น นอกจากนี้ยังนำไปสู่ความแม่นยำในการแสดงข้อความบนหน้าจอและประโยชน์จากความรู้ระดับโลกของ Gemini สำหรับผลลัพธ์ที่แม่นยำทางประวัติศาสตร์และทางวิทยาศาสตร์ Sora 2 และ Seedance 2 เป็นโมเดลการแปลงข้อความเป็นวิดีโอที่แข็งแกร่ง แต่ขาดการป้อนข้อมูลต่อเนื่องหลายรูปแบบและเวิร์กโฟลว์การสนทนาแบบครบวงจรของ Omni
        Gemini Omni สามารถแก้ไขวิดีโอผ่านการสนทนาได้หรือไม่
        ใช่ — นี่คือหนึ่งในคุณสมบัติหลักของมัน คุณสามารถเปลี่ยนมุมกล้อง สลับวัตถุ รีมิกซ์แอ็คชั่น เพิ่มตัวละคร หรือแปลงฉากทั้งหมดได้โดยการอธิบายสิ่งที่คุณต้องการในภาษาธรรมชาติ การแก้ไขแต่ละครั้งจะจดจำสิ่งที่เกิดขึ้นก่อนหน้านี้ ดังนั้นวิดีโอของคุณจึงมีความสม่ำเสมอในทุกเทิร์น
        วิดีโอ Gemini Omni สามารถยาวได้นานแค่ไหน? รองรับเสียงหรือไม่?
        ใช่ Gemini Omni สร้างวิดีโอด้วยเสียงที่ซิงค์แบบเนทีฟ รวมถึงเพลงพื้นหลัง เสียงพากย์ และเอฟเฟกต์เสียง ระยะเวลาของวิดีโอขึ้นอยู่กับความละเอียด: สูงสุด 10 วินาทีที่ 720p, 8 วินาทีที่ 1080p และ 4 วินาทีที่ 4K
        Gemini Omni แฟลชคืออะไร?
        Gemini Omni Flash เป็นรุ่นแรกในตระกูล Omni ซึ่งเปิดตัวในเดือนพฤษภาคม 2569 ซึ่งเป็นเวอร์ชันที่มีอยู่ในแอป Gemini ในปัจจุบัน Google Flow และ YouTube Shorts โมเดล Omni ในอนาคตจะรองรับรูปแบบเอาต์พุตเพิ่มเติม รวมถึงรูปภาพและเสียง
        Gemini Omni มี API หรือไม่?
        Google ได้ประกาศว่ามีการวางแผนการเข้าถึง API สำหรับนักพัฒนาและองค์กร แต่ยังไม่พร้อมใช้งานโดยทั่วไป เราจะอัปเดตหน้านี้เมื่อ API เปิดตัว
        วิดีโอ Gemini Omni มีลายน้ำหรือไม่
        ครับ Gemini Omni ใช้เทคโนโลยี SynthID ของ Google DeepMind เพื่อฝังลายน้ำที่มองไม่เห็น และสนับสนุนข้อมูลรับรองเนื้อหา C2PA เพื่อให้ผู้ดูสามารถตรวจสอบที่มาของ AI ของวิดีโอได้ สิ่งนี้จะปกป้องทั้งผู้สร้างและผู้ชม
        Gemini Omni มีข้อจำกัดอะไรบ้าง?
        Gemini Omni ถือเป็นความก้าวหน้าครั้งใหญ่ แต่การ์ดโมเดลของ Google ยอมรับว่าการรักษาความสอดคล้องที่สมบูรณ์แบบผ่านการแก้ไขหลายรอบที่ซับซ้อน การสร้างฉากที่มีการเคลื่อนไหวที่ซับซ้อนมาก และการแสดงข้อความที่แม่นยำอย่างสมบูรณ์แบบในทุกกรณียังคงเป็นความท้าทายที่ยังคงดำเนินอยู่ เราขอแนะนำให้ตรวจสอบผลลัพธ์ โดยเฉพาะสำหรับการใช้งานจริง
        Gemini Omni เหมาะกับใคร?
        ผู้สร้างเนื้อหา นักการตลาด นักการศึกษา ผู้สร้างภาพยนตร์ และนักออกแบบผลิตภัณฑ์ หากคุณต้องการเปลี่ยนแนวคิดให้เป็นวิดีโอ ไม่ว่าจะเริ่มต้นใหม่หรือโดยการรีมิกซ์เนื้อหาที่มีอยู่ Gemini Omni สร้างมาเพื่อคุณ
        เริ่มสร้าง

        ลอง Gemini Omni — เครดิตฟรี ไม่ต้องรอ

        เปลี่ยนข้อความ รูปภาพ เสียง และวิดีโอให้เป็นวิดีโอพร้อมการผลิตด้วย AI ที่เข้าใจโลกแห่งความเป็นจริง เครดิตฟรีเมื่อสมัครไม่ต้องใช้บัตรเครดิต