โมเดลวิดีโอที่ทรงพลังที่สุดจาก Alibaba มาแล้ว! สอนใช้ HappyHorse สร้างวิดีโอมีเสียงพากย์จากประโยคเดียว
หากคุณกำลังติดตามเทคโนโลยีสร้างวิดีโอด้วย AI คุณคงได้ยินข่าวเกี่ยวกับ HappyHorse 1.0 แล้ว มันให้ผลลัพธ์ที่น่าประทับใจในทั้งสองสถานการณ์การใช้งานยอดนิยม ได้แก่ Text-to-Video และ Image-to-Video โดยเฉพาะอย่างยิ่งคุณสมบัติ “การซิงค์เสียง-ภาพแบบธรรมชาติ” ซึ่งมีประโยชน์มาก: เพียงป้อนคำบรรยายหนึ่งประโยค ผลลัพธ์ที่ได้คือวิดีโอสมบูรณ์พร้อมเสียงพากย์ เสียงบรรยากาศ และเพลงประกอบ
สำหรับครีเอเตอร์ นี่คือการเปลี่ยนแปลงที่สำคัญ: ในอดีตต้องแยกขั้นตอนเป็น “สร้างภาพก่อน จากนั้นพากย์เสียง แล้วซิงค์ริมฝีปาก” แต่ทุกวันนี้วิดีโอสั้นหลายรายการสามารถเสร็จสิ้นในขั้นตอนเดียว
1. สามารถทดลองใช้ HappyHorse ได้ที่ไหน
ปัจจุบัน HappyHorse มีให้ใช้งานภายในแอป Qianwen หลังจากอัปเดตเป็นเวอร์ชั่นล่าสุด ทางเข้า HappyHorse จะปรากฏบนหน้าแรก เพียงแตะเข้าไปและคุณจะเข้าสู่หน้าสร้างวิดีโอ
2. ขั้นตอนพื้นฐานในการใช้งาน (ผู้เริ่มต้นใช้เวลา 3 นาที)
ขั้นตอนที่ 1: เข้าสู่หน้าสร้าง HappyHorse
- เปิดแอป Qianwen
- แตะที่ทางเข้า HappyHorse บนหน้าแรก
ขั้นตอนที่ 2: ป้อนคำบรรยายฉาก
ตัวอย่างเช่น:
ชายในชุดสูทเดินบนถนนฮ่องกงยามค่ำคืนที่ฝนตก ไฟนีออนกระพริบ สไตล์ภาพยนตร์ แนวหนังฮ่องกง
ขั้นตอนที่ 3: เลือกอัตราส่วนภาพ
| อัตราส่วนภาพ | สถานการณ์ที่เหมาะสม | แพลตฟอร์มยอดนิยม |
|---|---|---|
| 16:9 | วิดีโอแนวนอน บทช่วยสอน การสาธิตผลิตภัณฑ์ | YouTube, เว็บไซต์ |
| 9:16 | วิดีโอสั้นแนวตั้ง | TikTok, Shorts |
| 1:1 | โพสต์ฟีดสี่เหลี่ยม | โซเชียลมีเดีย |
ขั้นตอนที่ 4: คลิกสร้างและดูตัวอย่าง
หลังจากส่ง รอสักครู่แล้วคุณจะเห็นวิดีโอที่เสร็จสมบูรณ์ โดยค่าเริ่มต้นจะมีเสียงประกอบอยู่แล้ว ไม่จำเป็นต้องทำการประมวลผลซ้ำด้วยตนเอง
3. วิธีเขียน Prompt เพื่อผลลัพธ์ที่เสถียร
ยิ่งเขียน Prompt ชัดเจนเท่าไร ผลลัพธ์ยิ่งใกล้เคียงกับความคาดหวังมากเท่านั้น ต่อไปนี้คือเคล็ดลับที่มีประโยชน์ที่สุด
1) อธิบายตัวละครและสภาพแวดล้อมให้เฉพาะเจาะจง
อย่าเขียนแค่ “คนหนึ่งคนกำลังเดิน” แต่ลองเขียนแบบนี้:
ชายวัยกลางคนในทรันช์โค้ทสีเทากำลังเดินเร็วบนถนนที่เปียกฝน แสงโคมไฟถนนส่องสลัว พื้นถนนสะท้อนแสงจากน้ำท่วมขัง
2) เพิ่มข้อมูลสไตล์
ระบุแท็กสไตล์อย่างชัดเจนที่ท้ายประโยค เช่น “สไตล์ภาพยนตร์ฮ่องกง” “สไตล์จีนหมึก” หรือ “สไตล์อนิเมชันดินน้ำมัน” โมเดลจะรักษาความสอดคล้องทางสายตาได้ดีขึ้น
3) ระบุการเคลื่อนไหวของกล้อง
คุณสามารถระบุได้โดยตรงว่า:
- กล้องซูมช้าจากภาพกว้างไปที่ใบหน้าของตัวละคร
- กล้องติดตามตัวละครเคลื่อนที่จากซ้ายไปขวา
สิ่งนี้จะช่วยลด “กล้องกระโดดไปมา” ได้อย่างเห็นได้ชัด
4) ระบุภาษาเสียงล่วงหน้า
หากวิดีโอมีบทสนทนาของตัวละคร แนะนำให้ระบุภาษาใน Prompt เช่น ภาษาจีนกลาง กวางตุ้ง อังกฤษ หรือญี่ปุ่น เพื่อให้โมเดลสามารถประมวลผลเสียงและริมฝีปากพร้อมกันได้
ตัวอย่าง Prompt แบบสมบูรณ์
สาวสาวคนหนึ่งนั่งอ่านหนังสือริมหน้าต่างร้านกาแฟ แสงแดดส่องผ่านหน้าต่างเข้ามา บนโต๊ะมีถ้วยกาแฟที่มีไอลอยขึ้น กล้องซูมช้าจากด้านนอกเข้าไปที่ใบหน้าของเธอ เธอเงยหน้าขึ้นและยิ้ม สไตล์ภาพยนตร์ฮ่องกง อัตราส่วนภาพ 16:9 ตัวละครพูดเบาบน Mandarin ว่า "วันนี้เป็นวันที่ดีจริงๆ สำหรับการเริ่มต้นสร้างสรรค์"
4. สังเกตผลลัพธ์จริง: จุดไหนคุ้มค่าที่สุด
ความคมชัดของภาพ
ที่ความละเอียด 1080P ใบหน้าของตัวละครและพื้นผิวฉากทั่วไปมีความเสถียรพอสมควร เพียงพอสำหรับการเผยแพร่เป็นวิดีโอสั้น
ความต่อเนื่องของการตัดภาพหลายช็อต
เมื่อสลับภาพหลายช็อตภายใน 15 วินาที การเชื่อมต่อดูเป็นธรรมชาติ และเนื้อเรื่องไม่สะดุดบ่อย
การซิงค์เสียง-ภาพ
นี่คือจุดแข็งหลักของ HappyHorse เมื่อตัวละครพูด ความสอดคล้องระหว่างริมฝีปากและเสียงอยู่ในระดับที่ดี ช่วยประหยัดเวลาหลังการถ่ายทำได้มาก
อัปเดตล่าสุด
ทางการได้ประกาศกรอบเวลาเปิดให้ใช้ API แล้ว สำหรับผู้ใช้ทีม นี่หมายความว่าคุณสามารถเชื่อมต่อการสร้างวิดีโอเข้ากับเวิร์คโฟลเนื้อหาของตนเองได้โดยตรงในอนาคต
5. สรุป
HappyHorse บีบอัดกระบวนการสร้างวิดีโอทั้งหมดให้เหลือเพียง “เขียน Prompt → รับวิดีโอสำเร็จ” เหมาะอย่างยิ่งสำหรับทีมและบุคคลที่ต้องการทดสอบไอเดียอย่างรวดเร็วหรือสร้างวิดีโอสั้นจำนวนมาก
หากคุณพร้อมเริ่มทดสอบ แนะนำให้สร้างวิดีโอ 5-10 รายการจากหัวข้อเดียวกันอย่างต่อเนื่อง จากนั้นปรับปรุงเทมเพลต Prompt ของคุณตามผลลัพธ์ ประสิทธิภาพจะเพิ่มขึ้นอย่างเห็นได้ชัด