अली का सबसे मजबूत वीडियो मॉडल यहाँ है! __ HH __ में डब किया गया वीडियो जनरेट करने पर एक हैंडहेल्ड ट्यूटोरियल
अगर आप हाल ही में AI वीडियो जनरेशन को फ़ॉलो कर रहे हैं, तो आपको __ HH __ 1.0 का मैसेज देखना चाहिए था। यह विन्सेंट वीडियो और टक्सन वीडियो के दो सामान्य परिदृश्यों में बहुत मजबूत है, विशेष रूप से “देशी ध्वनि और चित्र सिंक्रनाइज़ेशन” बहुत व्यावहारिक है: एक त्वरित शब्द दर्ज करें, और आउटपुट वॉयसओवर, परिवेश ध्वनि और पृष्ठभूमि संगीत के साथ पूरा वीडियो है।
क्रिएटर्स के लिए, इसका मतलब है बदलाव: अतीत में, इसे “पहले तस्वीर से बाहर, फिर डब किया गया, और फिर तय किया गया” में विभाजित किया गया था, और अब कई छोटे वीडियो एक चरण में पूरे किए जा सकते हैं।
I. कहाँ अनुभव करें __ HH __
अब आप हज़ार सवाल ऐप में इसका अनुभव कर सकते हैं। नवीनतम संस्करण में अपडेट करने के बाद, एक __ HH __ पोर्टल होमपेज पर दिखाई देगा, और आप जनरेशन पेज दर्ज करने के लिए क्लिक कर सकते हैं।
II. बुनियादी ऑपरेशन चरण (शुरुआती लोगों के लिए 3 मिनट)
चरण 1: __ HH __ जनरेशन पेज पर जाएँ
- Qianqian ऐप खोलें
- होमपेज पर __ HH __ प्रवेश द्वार पर क्लिक करें
चरण 2: सीन का ब्यौरा डालें
उदाहरण के लिए:
一个穿西装的男人在雨夜的香港街头行走,霓虹灯闪烁,电影质感,港片风格。
चरण 3: फ़्रेम अनुपात चुनें
| फ़्रेम अनुपात | परिदृश्यों के लिए उपयुक्त | कॉमन प्लैटफ़ॉर्म |
|---|---|---|
| 16:9 | क्षैतिज कथा, ट्यूटोरियल, उत्पाद प्रदर्शन | YouTube, आधिकारिक वेबसाइट |
| 9:16 | वर्टिकल शॉर्ट वीडियो | TikTok, झटपट हाथ, वीडियो नंबर |
| 1:1 | स्क्वायर स्क्रीन ग्राफ़िक और टेक्स्ट मिक्सिंग | सोशल मीडिया स्ट्रीम |
चरण 4: जेनरेट और प्रीव्यू पर क्लिक करें
सबमिट करने के कुछ देर बाद इसे ऐक्शन में देखने के लिए इंतज़ार करें। डिफ़ॉल्ट रूप से, इसमें ध्वनि से संबंधित सामग्री होती है और इसे मैन्युअल रूप से पुन: संश्लेषित करने की आवश्यकता नहीं होती है।
3. त्वरित शब्द कैसे लिखें, प्रभाव अधिक स्थिर होता है
संकेत शब्द जितना स्पष्ट होगा, अपेक्षित परिणाम के उतना ही करीब होगा। निम्नलिखित सबसे व्यावहारिक हैं।
1) विशिष्ट लोगों और वातावरण का वर्णन करें
केवल “अकेले चलना” लिखने के बजाय, आप लिख सकते हैं:
一个穿灰色风衣的中年男人在下雨的街道上快步走,路灯昏黄,地面有积水反光。
2) स्टाइल की जानकारी जोड़ें
अंत में स्टाइल लेबल निर्दिष्ट करके, जैसे कि “हांगकांग विंड फिल्म सेंस ”,” इंक स्टाइल ”, और “क्ले एनीमेशन स्टाइल ”, मॉडल के लिए एक एकीकृत दृश्य टोनैलिटी बनाए रखना आसान है।
3) लेंस की गति को लिखें और साफ़ करें
आप सीधे बता सकते हैं :-
- कैमरा धीरे - धीरे किरदार के चेहरे के नज़दीक की ओर बढ़ता है
- शॉट चरित्र का अनुसरण करता है, बाएं से दाएं पैनिंग करता है
यह “लेंस जंप” को काफी कम कर देता है।
4) भाषण की भाषा पहले से निर्दिष्ट करें
यदि वीडियो में वर्ण हैं, तो प्रॉम्प्ट में भाषा को स्पष्ट रूप से लिखने की सिफारिश की जाती है, जैसे मंदारिन, कैंटोनीज़, अंग्रेजी, जापानी, आदि, ताकि मॉडल एक ही समय में भाषण और मौखिक शैली दोनों को संसाधित कर सके।
नमूना पूर्ण प्रॉम्प्ट
一个年轻女孩坐在咖啡馆窗边看书,阳光从窗外照进来,桌上有一杯冒着热气的咖啡。镜头从窗外缓慢推进到女孩面部,女孩抬头微笑。港风电影感,16:9 画幅,人物使用普通话轻声说“今天真是适合开始创作的一天”。
IV. वास्तविक प्रभाव का अवलोकन करना: कौन से स्थान उपयोग करने के लिए सबसे उपयुक्त हैं
पिक्चर क्लैरिटी
1080p आउटपुट के तहत, चरित्र का चेहरा और सामान्य दृश्यों की बनावट अपेक्षाकृत स्थिर होती है, और यह सामग्री को एक छोटे वीडियो के रूप में प्रकाशित करने के लिए पर्याप्त है।
मल्टी - कैमरा कॉहेरेंस
15 सेकंड के भीतर कई शॉट्स के बीच स्विच करते समय, कनेक्शन की स्वाभाविकता अच्छी होती है, और प्लॉट बार - बार नहीं टूटेगा।
ऑडियो - पिक्चर सिंक्रनाइज़ेशन
यह __ HH __ की मुख्य ताकत है। जब किरदार बोलते हैं, तो मुंह की शैली और आवाज अच्छी तरह से मेल खाती है, जिससे बहुत देर हो सकती है।
हाल के नोड्स
अधिकारी ने एपीआई (API) के खुलने के समय की विंडो दे दी है। टीम यूज़र के लिए, वीडियो जनरेशन को सीधे अपने कॉन्टेंट वर्कफ़्लोज़ में इंटीग्रेट किया जा सकता है।
V. सारांश
__ HH __ ने प्रॉम्प्ट लिखने के लिए वीडियो जनरेशन प्रक्रिया को संकुचित किया है -> डायरेक्ट वीडियो, जो विशेष रूप से उन टीमों और व्यक्तियों के लिए उपयुक्त है जो विचारों को जल्दी से मान्य करना चाहते हैं और बैचों में छोटे वीडियो का उत्पादन करना चाहते हैं।
यदि आप परीक्षण शुरू करने के लिए तैयार हैं, तो एक निश्चित विषय से 5 -10 लगातार आइटम उत्पन्न करने की सिफारिश की जाती है, और फिर परिणामों के अनुसार अपने प्रॉम्प्ट टेम्पलेट को दोहराएं। दक्षता में काफी सुधार होगा।