
“目下暂不相沿输入真东谈主素材当作主体参考。我们深知创意的领域是尊重。”
这是灵通即梦web平台时用户看到的请示。就在前一天,Seedance 2.0因真东谈主肖像生成智商激勉争议,字节越过要紧下线了真东谈主东谈主脸素材参考功能。
激勉禁令的是影视飓风Tim在凌晨发布的一条视频,他说Seedance 2.0是“改变视频行业的 AI”,可他的语气并不是讴颂,而是一种警悟。
原因是他发现,仅上传我方的东谈主脸相片,模子就能自动生成与他本东谈主高度相似的声息,致使精确匹配语气特色。真的地让东谈主感到发怵。
但在功能下线之前,Seedance 2.0依然完成了一次知足级的出圈。《黑别传·悟空》制作主谈主冯骥在微博上称其为“现时地表最强的视频生成模子”,并警戒“传神的视频将变得毫无门槛”。
印象中在此之前,冯骥赐与这样高评价的,也即是DeepSeek。
自字节越过开启 Seedance 2.0启动灰度测试,不到48小时,X、抖音等酬酢平台充满了漫天掩地多样基于该模子的 AI 视频。
《火影忍者》、《咒术回战》、《奥特曼》……基本上你能猜测的作品弥漫有。
国外反映不异炸裂。X 平台上,一位学习7年数字电影制作的用户发帖:“这是惟一让我感到发怵的模子,90% 我学到的妙技它皆能扫尾。”
AIGC圈大佬,Sensive和KidsHackClub的结伴首创东谈主莱纳斯·埃肯斯塔姆(Linus Ekenstam)径直薪金这条X说:“它会让互联网崩溃,百分之百。”Hacker News上,更是有东谈主直言“这是2026年最佳的视频模子,特出Sora 2”。
特出Sora尚在其次,更紧要的是,物理寰宇的准确建模被视为通用AGI的关节智商之一,而Seedance 2.0让业内东谈主士看到了扫尾这少量的可能性。
2月9日,A 股的传媒、短剧、AI 应用板块也跟着 Seedance 2.0 的爆火而集体大涨。上海电影、无缺寰宇等公司单日涨幅达 10%,分析师预期该模子将大幅裁汰制作资本、加快内容出产周期。
爆火背后,问题不异油滑。
Sora 2不错说是前车之鉴。刚推出时,Sora 2好评如潮,关连词只是曩昔两个月,留存率就无尽接近于零。除此以外,版权风险、数字授权等问题,也依然在Sora 2上头清晰过一次了。
字节会带着Seedance 2.0,找到另一条出息吗?
01
什么是Seedance 2.0
在了解Seedance 2.0火爆之前,不妨让我们先来意志一下它。
Seedance 2.0相沿文本、图片(最多 9 张)、视频(最多 3 段,总长≤15 秒)、音频(最多 3 段,总长≤15 秒)同期输入,搀杂上限 12 个文献。
用户可用图片界说构图和脚色、视频指定动作和镜头通顺、音频驱动节拍。
比拟之下,Sora 2的Cameo功能仅相沿单张相片植入,Veo 3和Kling 2.6主要依赖文本加单图输入。
这种多模态智商不是浮浅的素材重复。字节引入了@说起系统,这样就能明确独揽每个资源。
在请示词中,用户不错写“ @Image1当作第一帧,参考@Video1的运镜,使用@Audio1当作配景音乐节拍”。
其最大的公正即是,改变了以往“扔一堆素材给AI,然后试试看”的创作模式。
模子接受“Seedance V2通顺合成”时期,在重力、动量、碰撞、流体等物理知足的模拟上有光显校正。
实测炫耀,布料飘零、液体飞溅、肢体通顺的轨迹更接近真的物理限定,减少了“飘摇感”和物体穿模等常见伪影。
Seedance 2.0还有一个很紧要的智商即是精确首尾帧。
用户上传肇端帧与扫尾帧图像后,模子智能推演中间动态过程,确保转场当然、节拍踏实。这对告白定格动画、剧情衔尾等强独揽需求场景特等有效。
分镜驱动视频生成相沿按分镜剧本逐镜生成,跨镜头保管脚色外不雅、光影逻辑与好意思术立场一致性。有效户用Lovart的Skill生因素镜故事板,径直复制到Seedance 2.0中,生成的视频比用ComfyUI手工调参作念的还紧密。
这证实模子不仅清楚单个画面,还清楚镜头之间的叙事逻辑。
Seedance 2.0的编著智商也获得了增强,相沿对已有视频进行脚色更迭、删减、加多。用户不错径直在生成赶走中编著局部画面,真钱投注app平台而不是推倒重来。这大幅提高了成片率,也让创作过程更接近传统视频编著的体验。
从单一请示词可生成包含多个镜头切换的完整片断。
模子能自动臆想分镜、扩充运镜(如渐进、环绕、跟随)、添加编著恶果(如慢动作、镜头抖动)。多镜头间保捏脚色面部特征、服装细节、场景光照、叙事基调的一致性,过渡较为当然。
终末即是视听结伴生成方面,音频与视觉在创作过程中互相影响。
相沿8种以上话语的音素级口型同步,环境音效与视觉事件及时对应。脚步声匹副脚色出动,玻璃破灭奉陪动听音效。上传音频可驱动视频生成,BGM节拍对应镜头切换。
通过头山引擎RayFlow优化,生成速率比1.0版块提高约30%。10秒1080p带音频视频约需2-5分钟。Pro版块相沿原生2K分离率,视频可蔓延至2分钟,比拟Sora 2的15秒上限和Kling 2.6的10秒独揽有光显上风。
脚色一致性机制引入增强版“身份捏久性”提防力机制,在不同镜头、角度、光照条款下保捏脚色特征踏实。面部轮廓、发型、服装纹理等细节在镜头切换时漂移较少。
02
出圈竟是因为AGI?
在X、抖音等酬酢媒体上,Seedance 2.0最受眷注的内容聚合在热点IP脚色的格斗与动作视频:真东谈主版七龙珠战争、奥特曼对决、通顺告白。
这类内容的点赞数宽敞在数十万级别。
从视频的不雅感来讲,动作场景对物理模拟精度要求极高,任何失真皆会梗阻着实度。
拳击手出拳时的要点改变、击中主义的形变反馈、被击者后退距离需符协力学限定。AIGC艺术家DynamicWang用Seedance 2.0制作的Nike风告白中,四位女性的肌肉线条、动作幅度与其通顺名堂(体操、拳击、跑步、游水)高度匹配。
体操翻转、技击一语气踢腿、跑酷墙面反弹等动作链条中,任何一帧的速率、角度、加快度偏差皆会产生“机械感”。Seedance 2.0通过期序一致性建模,使动作开通度接近实拍恶果。
格斗时的扬尘、火器破风声、衣袂翻飞的褶皱等二次物理效应增强了场景真的感。
物理寰宇的准确建模被视为通用AGI的关节智商之一。
“物体若何通顺”“力若何传递”“因果若何发生”,固然这些事情对我们早已司空见惯了,然则关于AI这照旧崭新事。
当AI模子能准确估量拳头击中主义后的形变、水花溅起的轨迹、布料随风飘零的形态,意味着它不再是浮浅的“像素生成器”,而是诞生了对真的寰宇运作机制的里面表征。
杨立昆曾屡次强调,AGI必须具备对物理寰宇的学问性清楚。
Seedance 2.0在物理模拟上的提高,骨子上是其寰宇模子智商的增强,模子启动清楚物体之间的关系、动作的因果链条、环境对物体的遏抑。
传统生成模子依赖“数据中出现过什么,就生成什么”的统计限定,关连词真的寰宇慑服因果逻辑,推倒多米诺骨牌,开云体育后续骨牌势必倒下;拳头击中脸部,头部势必后仰。
Seedance 2.0冒昧生成允洽物理限定的格斗视频,证实模子里面依然造成了某种因果推明智商。
它不是记取了“拳击的边幅”,而是清楚了“力的作用势必产生副作用”这一底层逻辑。这种智商是从“模式识别”向“认识推理”的跨越。
传统AI是停留在统计层面的拟合,唯有当AI清楚了物理寰宇,智力信得过与践诺交互。
{jz:field.toptypename/}这亦然为什么之前各大厂一直强调多模态。
因为我们东谈主类的大脑清楚物理寰宇,骨子上即是多模态。我们通过视觉看到物体通顺,通过听觉感知碰撞声响,通过触觉清楚材质硬度,这些感官信息在大脑中和会造成结伴的寰宇清楚。
前文提到的Seedance 2.0视听结伴生成架构,在某种进度上即是模拟了这种多模态和会机制。
当模子冒昧清楚“重物落地应该发出低千里声息”“玻璃破灭应该奉陪动听音效”时,它依然在诞生跨模态的因果关连。这种智商远超单纯的文本生成或图像生成,依然预示着模子正朝着AGI逼近了。
还有少量,现时AI策动的共鸣是,AGI最终需要体当今具身智能上。
原因很浮浅,一个冒昧在物理寰宇中行动的智能体,不管是机器东谈主照旧自动驾驶,皆要求AI准确估量物理寰宇的动态变化。
Seedance 2.0固然是视频生成模子,但它对物理限定的清楚智商(重力、动量、碰撞、流膂力学)与具身智能所需的智商高度重合。
不错说,视频生成是具身智能的“沙盒”。
模子在臆造寰宇中学会了物理限定,改日不错迁徙到真的寰宇的机器东谈主独揽中。而基于Seedance 2.0的那些格斗视频,刚好聚合体现了模子对力学、通顺学、时序因果的空洞清楚,这些皆是具身智能的中枢智商。
GPT、Claude等空话语模子固然远大,但它们对物理寰宇的清楚是转折的、基于文本描述的。它们不错告诉你“苹果会掉下来”,但无法信得过“看到”重力若何作用。
Seedance 2.0的冲破在于,它通过视频生成这一任务,被动学习物理寰宇的径直表征。
这使得它在通往AGI的旅途上比纯话语或静态图像模子走得更远,是以它的运行逻辑更接近东谈主类“看到-清楚-估量”的默契闭环。
若是说话语模子是AGI的“左脑”(逻辑与标志),那么物理寰宇模子即是AGI的“右脑”(空间与直观)。
Sora 2在静态场景和慢节拍叙事上阐扬较好,但在快速动作场景存在光显短板。篮球弹跳轨迹、水流形态、布料飘零呈现“梦乡感”而非“真的感”,慢镜头下尤为光显。
脚色快速位移(冲刺、跳跃、挥拳)时容易产生通顺朦拢过度或肢体变形,源于扩散模子科罚时序剧烈变化的局限。
Sora 2 要生成单镜头,用户拼接多个动作片断时,脚色动作衔尾、速率一致性难以保证。
格斗视频需要“出招-藏匿-反击”的多回合结构,这是Sora 2的弱项。酬酢媒体上Sora 2生成的同类内容常因“动作僵硬”“物理违和”被用户月旦。
字节在短视频限度的数据荟萃可能是上风起首。
抖音逐日科罚数十亿条视频,这些数据匡助模子清楚“什么样的通顺眩惑眼球”“哪种节拍让东谈主捏续不雅看”。模子考研可能使用了大皆真的技击、体育、跳舞视频作监督信号。
03
字节能从Sora 2上吸取教授吗?
OpenAI将 Sora 2 定位为“AI 版抖音”。首日10万装配(邀请制 iOS)、4天登顶好意思国App Store总榜、5天破100万下载(快于 ChatGPT)。
但Appfigures数据炫耀,Sora 2在60天内的下载量出现断崖式下滑。12月环比着落32%,1月环比大幅着落45%,降至约120万次。
独揽发稿,Sora 2目下已跌出好意思国App Store免费应用总榜前100名。
Sora 2最大的战术失实是试图复制抖音那套社区文化。
AI生成内容自然缺少真的东谈主际关系,这是酬酢集聚的中枢之一。用户在抖音上刷到的是真的的东谈主、真的的生活片断、真的的格局纠合。而Sora 2生成的视频,不管何等细致,骨子上皆是算法的产物,缺少酬酢集聚赖以糊口的东谈主际纽带。
Seedance 2.0目下的作念法更求实,镶嵌剪映、即梦等郑重创作器用,当作“功能模块”而非“疏淡 App”。
将我方定位为创作家器用箱的一部分。用户不是来“刷AI视频”,而是来“用AI作念视频”。这个定位各异,决定了居品的生命周期。
Sora 2在版权上的扭捏清晰了西方监管环境的窘境。
上线初期,因缺少严格管控,用户曾可生成海绵宝宝、皮卡丘等有名IP脚色的视频,这虽在一定进度上有助于早期扩充,但激勉了版权方的浓烈反对。
面临压力,OpenAI将版权使用轨则从“默许可选”改为“需明确授权”,也恰是因为这种版权内容的变更,导致Sora 2失去了率先病毒式传播的能源起源。
目下来看,Seedance 2.0另一大爆火的原因,是创作家期骗AI生成了奥特曼、七龙珠等大皆有名脚色,但不异存在版权风险。
字节因真东谈主素材参考智商激勉争议后,已要紧下线该功能。这证实字节在版权问题上选定了更严慎的立场,试图在时期智商与合规风险之间找到均衡点。
但最紧要的是,当任何东谈主皆能在几分钟内生成一段细致视频,内容自己就失去了稀缺性。用户信得过需要的不是“更多视频”,而是“更专门念念的抒发”。
时期再强,若是不成回答“用户为什么需要这个”的问题,最终皆会沦为玩物。
AI生成的视频固然细致,但每每缺少中枢的格局内核与捏续的叙事价值。好多用户在酬酢平台上反馈,在率先的崭新感褪去后,Sora 2生成的内容舒服趋同且无趣。
Seedance 2.0若想历久存活,需要回答一个问题:在AI让视频生成资本趋近于零的期间,你为用户创造的中枢价值是什么?是神圣时期?是扫尾创意?照旧诞生身份招供?
从目下的居品策略来看,字节选拔了“器用”而非“平台”的阶梯。
但器用阶梯也有我方的挑战。当可灵、Sora、Veo皆在提供肖似智商时,用户凭什么选拔 Seedance 2.0?谜底可能不在时期自己,而在生态整合的深度。
字节领有抖音、剪映、即梦的完整创作生态,Seedance 2.0若是能与这些居品深度买通,造成从灵感到发布的闭环,就能诞生起其他竞争敌手难以复制的护城河。
不外归根结底,版权问题是历久不会消灭的,时期智商的领域也会约束被竞争敌手追平。信得过决定Seedance 2.0幸运的,是字节能否在爆火的窗口期内,将流量退换为用户俗例,将时期上风退换为生态壁垒。
谜底可能决定了它是成为字节的下一个抖音,照旧下一个 Sora 2。