قدرتمندترین مدل ویدیویی علی‌بابا از راه رسید! گام به گام یاد بگیرید که چگونه با استفاده از HappyHorse و تنها در یک جمله، ویدیوهایی با صداگذاری تولید کنید.

اگر اخیراً تولید ویدیوی هوش مصنوعی را دنبال کرده‌اید، احتمالاً اخبار مربوط به HappyHorse 1.0 را دیده‌اید. این نرم‌افزار در دو سناریوی رایج بسیار خوب عمل می‌کند: ویدیوی مبتنی بر متن و ویدیوی مبتنی بر تصویر، به خصوص ویژگی «همگام‌سازی صوتی-تصویری بومی» که بسیار مفید است: یک کلمه سریع وارد کنید و خروجی یک ویدیوی کامل با صدای روی تصویر، صدای محیط و موسیقی پس‌زمینه است.

برای سازندگان، این به معنای یک تغییر است: در گذشته، فرآیند «ابتدا خلق تصاویر، سپس اضافه کردن صداگذاری و در نهایت لب‌خوانی» بود، اما اکنون بسیاری از ویدیوهای کوتاه را می‌توان در یک مرحله تکمیل کرد.

۱. کجا HappyHorse را تجربه کنیم؟

در حال حاضر، می‌توانید این قابلیت را در اپلیکیشن Qianwen تجربه کنید. پس از به‌روزرسانی به آخرین نسخه، یک نقطه ورود به نام HappyHorse در صفحه اصلی ظاهر می‌شود؛ برای ورود به صفحه تولید، روی آن کلیک کنید.

دوم. مراحل عملیاتی اولیه (مبتدیان می‌توانند در ۳ دقیقه شروع کنند)

مرحله ۱: به صفحه تولید HappyHorse بروید

برنامه Qianwen را باز کنید
روی ورودی HappyHorse در صفحه اصلی کلیک کنید.

مرحله ۲: توضیحات صحنه را وارد کنید

…ميدوني

一个穿西装的男人在雨夜的香港街头行走，霓虹灯闪烁，电影质感，港片风格。

مرحله ۳: نسبت ابعاد را انتخاب کنید

نسبت ابعاد	سناریوهای مناسب	پلتفرم‌های رایج
16:9	داستان‌سرایی با محوریت مناظر، آموزش‌ها، نمایش محصولات	یوتیوب، وب‌سایت رسمی
9:16	ویدیوهای کوتاه عمودی	حساب های ویدیویی Douyin، Kuaishou و WeChat
1:1	صفحه نمایش مربعی با متن و تصاویر ترکیبی	جریان اطلاعات رسانه‌های اجتماعی

مرحله ۴: برای تولید و پیش‌نمایش کلیک کنید

پس از ارسال، لحظه‌ای صبر کنید تا محصول نهایی را ببینید. به طور پیش‌فرض شامل صدا خواهد بود، بنابراین نیازی به سنتز ثانویه دستی نیست.

III. چگونه برای نتایج پایدارتر، دستورالعمل بنویسیم

هرچه دستورالعمل‌ها واضح‌تر باشند، نتایج تولید شده به انتظارات نزدیک‌تر خواهند بود. نکات زیر مفیدترین نکات هستند.

۱) شخصیت‌ها و محیط خاص را توصیف کنید

فقط ننویسید «یک نفر در حال راه رفتن است»، می‌توانید بنویسید:

一个穿灰色风衣的中年男人在下雨的街道上快步走，路灯昏黄，地面有积水反光。

۲) اطلاعات سبک را اضافه کنید

تعریف واضح تگ‌های سبک در انتها، مانند «سبک فیلم هنگ کنگ»، «سبک نقاشی جوهری» یا «سبک انیمیشن خمیری»، حفظ یک لحن بصری یکپارچه را برای مدل آسان‌تر می‌کند.

۳) حرکت دوربین را به وضوح توصیف کنید.

شما می‌توانید مستقیماً مشخص کنید:

دوربین به آرامی از یک نمای باز به نمای نزدیک از چهره فرد زوم می‌کند.
دوربین از چپ به راست حرکت می‌کند و سوژه را دنبال می‌کند.

این کار می‌تواند «پرش دوربین» را به میزان قابل توجهی کاهش دهد.

۴) زبان صدا را از قبل مشخص کنید

اگر در ویدیو دیالوگ وجود دارد، توصیه می‌شود زبان آن را در راهنماها به وضوح مشخص کنید، مانند ماندارین، کانتونی، انگلیسی، ژاپنی و غیره، تا مدل بتواند گفتار و حرکات لب را به طور همزمان پردازش کند.

مثال کامل کلمه سریع

一个年轻女孩坐在咖啡馆窗边看书，阳光从窗外照进来，桌上有一杯冒着热气的咖啡。镜头从窗外缓慢推进到女孩面部，女孩抬头微笑。港风电影感，16:9 画幅，人物使用普通话轻声说“今天真是适合开始创作的一天”。

چهارم. مشاهده نتایج واقعی: کجا بیشترین ارزش استفاده را دارد؟

وضوح تصویر

در خروجی 1080P، ویژگی‌های صورت و بافت‌های صحنه‌ی رایج نسبتاً پایدار هستند که برای استفاده به عنوان محتوای ویدیویی کوتاه کافی است.

تداوم چند شات

هنگام تغییر بین زوایای مختلف دوربین در عرض ۱۵ ثانیه، انتقال‌ها روان و طبیعی هستند و داستان مرتباً دچار اختلال نمی‌شود.

هماهنگ‌سازی صوتی و تصویری

این مزیت اصلی HappyHorse است. وقتی شخصیت‌ها صحبت می‌کنند، حرکات لب و صداها خیلی خوب با هم مطابقت دارند و باعث صرفه‌جویی زیادی در زمان پس از تولید می‌شوند.

گره‌های اخیر

پنجره رسمی انتشار API اعلام شده است. برای کاربران تیمی، این بدان معناست که می‌توانند تولید ویدیو را مستقیماً در گردش کار محتوای خود ادغام کنند.

نتیجه گیری

HappyHorse فرآیند تولید ویدیو را به یک مرحله‌ی «نوشتن ایده‌ها -> تولید مستقیم ویدیو» خلاصه می‌کند، که آن را به ویژه برای تیم‌ها و افرادی که می‌خواهند به سرعت ایده‌های خود را اعتبارسنجی کرده و ویدیوهای کوتاه تولید انبوه کنند، مناسب می‌سازد.

اگر آماده شروع آزمایش هستید، توصیه می‌شود ابتدا ۵ تا ۱۰ پیام از یک قالب ثابت تولید کنید و سپس بر اساس نتایج، الگوی پیام خود را تکرار کنید. این کار به طور قابل توجهی کارایی را بهبود می‌بخشد.

شروع به استفاده از HappyHorse کنید