قدرتمندترین مدل ویدیویی علیبابا از راه رسید! گام به گام یاد بگیرید که چگونه با استفاده از HappyHorse و تنها در یک جمله، ویدیوهایی با صداگذاری تولید کنید.
اگر اخیراً تولید ویدیوی هوش مصنوعی را دنبال کردهاید، احتمالاً اخبار مربوط به HappyHorse 1.0 را دیدهاید. این نرمافزار در دو سناریوی رایج بسیار خوب عمل میکند: ویدیوی مبتنی بر متن و ویدیوی مبتنی بر تصویر، به خصوص ویژگی «همگامسازی صوتی-تصویری بومی» که بسیار مفید است: یک کلمه سریع وارد کنید و خروجی یک ویدیوی کامل با صدای روی تصویر، صدای محیط و موسیقی پسزمینه است.
برای سازندگان، این به معنای یک تغییر است: در گذشته، فرآیند «ابتدا خلق تصاویر، سپس اضافه کردن صداگذاری و در نهایت لبخوانی» بود، اما اکنون بسیاری از ویدیوهای کوتاه را میتوان در یک مرحله تکمیل کرد.
۱. کجا HappyHorse را تجربه کنیم؟
در حال حاضر، میتوانید این قابلیت را در اپلیکیشن Qianwen تجربه کنید. پس از بهروزرسانی به آخرین نسخه، یک نقطه ورود به نام HappyHorse در صفحه اصلی ظاهر میشود؛ برای ورود به صفحه تولید، روی آن کلیک کنید.
دوم. مراحل عملیاتی اولیه (مبتدیان میتوانند در ۳ دقیقه شروع کنند)
مرحله ۱: به صفحه تولید HappyHorse بروید
- برنامه Qianwen را باز کنید
- روی ورودی HappyHorse در صفحه اصلی کلیک کنید.
مرحله ۲: توضیحات صحنه را وارد کنید
…ميدوني
一个穿西装的男人在雨夜的香港街头行走,霓虹灯闪烁,电影质感,港片风格。
مرحله ۳: نسبت ابعاد را انتخاب کنید
| نسبت ابعاد | سناریوهای مناسب | پلتفرمهای رایج |
|---|---|---|
| 16:9 | داستانسرایی با محوریت مناظر، آموزشها، نمایش محصولات | یوتیوب، وبسایت رسمی |
| 9:16 | ویدیوهای کوتاه عمودی | حساب های ویدیویی Douyin، Kuaishou و WeChat |
| 1:1 | صفحه نمایش مربعی با متن و تصاویر ترکیبی | جریان اطلاعات رسانههای اجتماعی |
مرحله ۴: برای تولید و پیشنمایش کلیک کنید
پس از ارسال، لحظهای صبر کنید تا محصول نهایی را ببینید. به طور پیشفرض شامل صدا خواهد بود، بنابراین نیازی به سنتز ثانویه دستی نیست.
III. چگونه برای نتایج پایدارتر، دستورالعمل بنویسیم
هرچه دستورالعملها واضحتر باشند، نتایج تولید شده به انتظارات نزدیکتر خواهند بود. نکات زیر مفیدترین نکات هستند.
۱) شخصیتها و محیط خاص را توصیف کنید
فقط ننویسید «یک نفر در حال راه رفتن است»، میتوانید بنویسید:
一个穿灰色风衣的中年男人在下雨的街道上快步走,路灯昏黄,地面有积水反光。
۲) اطلاعات سبک را اضافه کنید
تعریف واضح تگهای سبک در انتها، مانند «سبک فیلم هنگ کنگ»، «سبک نقاشی جوهری» یا «سبک انیمیشن خمیری»، حفظ یک لحن بصری یکپارچه را برای مدل آسانتر میکند.
۳) حرکت دوربین را به وضوح توصیف کنید.
شما میتوانید مستقیماً مشخص کنید:
- دوربین به آرامی از یک نمای باز به نمای نزدیک از چهره فرد زوم میکند.
- دوربین از چپ به راست حرکت میکند و سوژه را دنبال میکند.
این کار میتواند «پرش دوربین» را به میزان قابل توجهی کاهش دهد.
۴) زبان صدا را از قبل مشخص کنید
اگر در ویدیو دیالوگ وجود دارد، توصیه میشود زبان آن را در راهنماها به وضوح مشخص کنید، مانند ماندارین، کانتونی، انگلیسی، ژاپنی و غیره، تا مدل بتواند گفتار و حرکات لب را به طور همزمان پردازش کند.
مثال کامل کلمه سریع
一个年轻女孩坐在咖啡馆窗边看书,阳光从窗外照进来,桌上有一杯冒着热气的咖啡。镜头从窗外缓慢推进到女孩面部,女孩抬头微笑。港风电影感,16:9 画幅,人物使用普通话轻声说“今天真是适合开始创作的一天”。
چهارم. مشاهده نتایج واقعی: کجا بیشترین ارزش استفاده را دارد؟
وضوح تصویر
در خروجی 1080P، ویژگیهای صورت و بافتهای صحنهی رایج نسبتاً پایدار هستند که برای استفاده به عنوان محتوای ویدیویی کوتاه کافی است.
تداوم چند شات
هنگام تغییر بین زوایای مختلف دوربین در عرض ۱۵ ثانیه، انتقالها روان و طبیعی هستند و داستان مرتباً دچار اختلال نمیشود.
هماهنگسازی صوتی و تصویری
این مزیت اصلی HappyHorse است. وقتی شخصیتها صحبت میکنند، حرکات لب و صداها خیلی خوب با هم مطابقت دارند و باعث صرفهجویی زیادی در زمان پس از تولید میشوند.
گرههای اخیر
پنجره رسمی انتشار API اعلام شده است. برای کاربران تیمی، این بدان معناست که میتوانند تولید ویدیو را مستقیماً در گردش کار محتوای خود ادغام کنند.
نتیجه گیری
HappyHorse فرآیند تولید ویدیو را به یک مرحلهی «نوشتن ایدهها -> تولید مستقیم ویدیو» خلاصه میکند، که آن را به ویژه برای تیمها و افرادی که میخواهند به سرعت ایدههای خود را اعتبارسنجی کرده و ویدیوهای کوتاه تولید انبوه کنند، مناسب میسازد.
اگر آماده شروع آزمایش هستید، توصیه میشود ابتدا ۵ تا ۱۰ پیام از یک قالب ثابت تولید کنید و سپس بر اساس نتایج، الگوی پیام خود را تکرار کنید. این کار به طور قابل توجهی کارایی را بهبود میبخشد.