字节跳动的下一代AI模型可以基于文本、图片、音频和视频生成剪辑

2026年02月13日由 alex 发表 1487 0

随着字节跳动下一代视频生成器的发布，大型科技公司继续超越最新AI模型。在一篇博客文章中，TikTok背后中国公司字节跳动表示，Seedance 2.0支持结合文本、图片、视频和音频的提示。

该公司声称“在生成质量上实现了显著飞跃”，在生成多主体复杂场景和执行指令的能力方面有所提升。用户可以通过向Seedance 2.0提供最多九张图片、三个视频片段和三个音频片段来细化文本提示。

该模型可以生成最多15秒的音频片段，同时考虑摄像机运动、视觉效果和运动。据字节跳动称，它还能引用基于文本的分镜。

过去一年，AI驱动的视频生成模型不断进步，Google Veo 3增加了生成支持音频的视频片段的能力，OpenAI推出了Sora 2，并推出了一款允许用户创建“超真实动态和声音”视频的新应用。人工智能初创公司Runway也发布了其AI视频模型的新版本，声称其准确度“前所未有”。

字节跳动分享的一个示例显示，两名花样滑冰选手共同表演，公司表示Seedance 2.0能够“可靠地完成一系列高难度动作——包括同步起跳、空中旋转和精准冰面着陆——同时严格遵循现实物理定律。”

社交媒体上的用户已经开始展示这款新工具的功能，有人发布了一段AI生成的视频，视频中出现了布拉德·皮特和汤姆·克鲁斯的电影式打斗场景。《死侍》编剧雷特·里斯转发了视频，并评论道：“我不想这么说。我们可能已经结束了。”

其他帖子展示了Seedance 2.0生成动漫风格片段、动画、电影科幻场景和看起来像内容创作者制作的视频的能力。目前尚不清楚Seedance 2.0是否提供版权保护，因为在X上快速搜索会发现大量包含《龙珠Z》、《恶搞之家》、《宝可梦》等角色的片段。

目前，Seedance 2.0仅通过字节跳动的Dreamina AI平台及其AI助手豆宝提供。目前尚不清楚它是否会登陆TikTok——尤其是在该应用在美国换了新所有权之后。

文章来源：https://www.theverge.com/ai-artificial-intelligence/877931/bytedance-seedance-2-video-generator-ai-launch

标签：

字节跳动 AI

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 OpenAI 又推出了一个新的编码模型，而且这次速度非常快

下一篇 OpenAI明天将永久淘汰GPT-4o及另外三款遗留模型

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

本周热门

热门企业

热门职位

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市