在短短24小时内,AI生成视频领域的格局发生了翻天覆地的变化。
文本到视频领域的两大巨头相继发布了新的API:
Runway推出了其第三代Alpha Turbo模型的API。
紧随其后,Runway的主要竞争对手Luma也宣布了其"梦幻机器"模型的API。
这可能会引发独立创业者的新一波淘金潮。
对我们这些创业者意味着什么?
我们已经见证了无数基于文本AI模型如GPT-4的成功独立SaaS企业。
这些企业在推出后不久,就能迅速达到每月数万甚至数十万美元的收入。
我们甚至看到了一些基于图像模型的成功独立初创企业,例如Pieter Levels的PhotoAI应用,其月收入刚刚突破了10万美元大关。
但一直以来,文本到视频AI模型的商业化应用却是一个空白。原因很简单,我们之前从未有过任何优秀的API。
而且,这些模型的训练成本高得令人望而却步,99.9%的创业者都无法承担。
因此,在Luma的"梦幻机器"API问世之前,制作AI视频的唯一方式是通过Luma的网站逐个生成。
但这一切在本周发生了改变。
这些模型的表现如何?
你或许还记得OpenAI发布的著名的Sora模型,它展示了令人惊叹的AI生成视频。
但我们从未真正接触到它。
而如今这些新近可访问的模型,其表现与Sora不相上下。Pieter Levels对Luma的"梦幻机器"模型赞不绝口:
"它绝对是目前最先进的,我认为它是目前最好的视频模型。它能够仅凭一张照片就高度准确地预测3D环境,我认为它与Open AI的Sora不相上下。"
Runway的表现也相当出色。这是从他们网站上取下的预告片,展示了一些使用他们的第三代Alpha Turbo模型创建的AI生成视频。
尽管如此,在我测试Luma的"梦幻机器"模型时,我发现设置提示并不容易。它通常接近我想要的结果,但并不完全准确。而且,反复尝试调整我的提示是乏味的,因为视频生成至少需要20或30秒,有时甚至更长。
如何获得访问权限?
遗憾的是,你需要申请才能获得Runway新API的访问权限。
幸运的是,申请过程相当简单。只需输入你的姓名、电子邮件地址、公司名称和你计划使用API的目的简述,他们会回复你。
建议尽早申请,以免陷入漫长的等待队列。
至于Luma,你可以立即开始使用,就在今天!他们的Web UI是免费的,但API的定价有点复杂:
每生成100万像素$0.0032
……这大约是每帧$0.0032,分辨率为1280×720p
……所以大约每5秒视频$0.40,每秒24帧
你可以构建哪些商业想法?
Danny Postma最近在推特上分享了他在AI时代的"致富公式"。他应该知道,因为他做到了:
在AI时代致富的方法:
找到一个现在可以被AI取代的乏味任务/工作/行业
构建它,并使其像当前的从业者一样运作。
像当前提供商一样进行市场推广,但专注于更便宜、更快10倍
盈利
— Danny Postma (@dannypostmaa) 2024年8月25日
为了激发你的创造力,这里有一些你可以在这些文本到视频API之上构建的软件工具的想法,其中第一个遵循了Danny的建议。
1. 在线课程内容
针对在线课程创作者。创建一个平台,可以直接从他们的课程大纲自动生成教学视频,这应该允许他们更快、更便宜地开发功能齐全的课程。
2. 企业培训视频
大公司内部的HR团队经常花费数周时间与视频制作机构协调,制作培训视频。想象一下,如果他们可以简单地输入培训主题的描述,立即获得专业质量的培训视频,以帮助员工进行入职、合规、技能发展等。
3. 内容再利用
允许用户输入一系列博客文章或文章的URL,然后使用AI提取内容中最重要的部分,使用像Eleven Labs这样的文本到语音API进行叙述,并使用这些文本到视频API生成相关视频。你可以很快地将一系列文章变成视频库。
4. 营销视频广告生成器
构建一个工具,人们可以输入他们的商业目标和他们想要的视频广告格式,例如Instagram、Facebook等。自动为他们生成视频,用于他们的广告活动。
5. 个人头像和个人资料照片
从Telegram到Tinder,许多应用程序允许用户上传视频以代表他们在头像和个人资料照片中的形象。Luma和Runway都支持使用照片作为创建视频文件的参考。你可以为你的用户生成一系列有趣、有吸引力或古怪的视频,以在其他应用程序上代表他们自己。
6. 励志名言
视频可能是创造真正吸引人的励志名言的缺失部分。目前有一些工具可以生成逼真的声音,但这些声音背后的大多数视频往往很平淡。