首页 > 人工智能>支持实时视频通话和语音控制视频走向，生数科技发布 Vidu S1 实时交互模型

支持实时视频通话和语音控制视频走向，生数科技发布 Vidu S1 实时交互模型

IT之家人工智能2026-07-04 05:56:57

Vidu S1 支持 540P（960x540）、25FPS（最高支持 42FPS），可基于真人、动漫、萌宠等任意初始形象及个性化音色，快速创建专属交互角色。...

最新 7 月 3 日消息，生数科技今日发布面向实时交互场景的新一代模型 ——Vidu S1 实时交互模型。

官方表示，Vidu S1 模型支持实时视频通话和语音控制视频走向，用户不仅能通过语音控制数字人的行为，还能实现无限时长连续互动。

Vidu S1 支持 540P（960x540）高清分辨率、25FPS 帧率（最高支持 42FPS），可基于真人、动漫、萌宠等任意初始形象及个性化音色，快速创建专属交互角色。

支持实时视频通话和语音控制视频走向，生数科技发布 Vidu S1 实时交互模型

据介绍，Vidu S1 采用自回归扩散模型 (AR + Diffusion) 路线，不再一次性生成完整视频，而是基于已经生成的历史画面，结合当前语音指令和对话上下文，持续预测并生成后续内容。

当用户发出新的语音指令时，模型可以实时理解并调整角色的表情、动作及后续视频走向，使视频从预先确定的固定内容，转变为一个持续生成、实时响应、动态演化的交互过程。

Vidu S1 已开启内测，最新附相关链接如下：

线上体验地址：https://www.vidu.cn/vidu-stream
API 体验地址：https://platform.vidu.cn/live/landing

《支持实时视频通话和语音控制视频走向，生数科技发布 Vidu S1 实时交互模型》转载自互联网，如有侵权，联系我们删除，QQ：369-8522。

本文网址：https://www.jsj.wang/2026/07/1783115830243.html

中国发布全球首个地层学 AI 大模型，给地球建“共享数据库”

在今日的第五届国际地层学大会上（江苏苏州），中国科学家面向全球发布了首个地层学 AI 大模型及智能全球地层剖面对比系统等新工具。...

人工智能 2026-07-04 0
亚马逊回应 Alexa AI 从 1 数到 40 出现“恐怖片音效”：正部署修复

科技媒体 Android Authority 昨日（7 月 2 日）发布博文，报道称亚马逊已确认并修复 Echo 智能音箱产生的诡异呼吸声问题。...

人工智能 2026-07-04 0
Anthropic 收紧 Claude Fable 5 最强模型，7 月 7 日从订阅中移除改为 AI 用量计费

科技媒体 bleepingcomputer 昨日（7 月 2 日）发布博文，报道称 Anthropic 公司计划 7 月 7 日后，从现有订阅中移除访问其最强模型 Claude Fable 5 权限。...

人工智能 2026-07-04 0
AI 交互革命：Claude Code 系统提示词精简 80%，示例约束反而遏制表现

Anthropic 公司技术人员表示，为适应新一代 Claude Fable 5 模型，已将 Claude Code 的系统提示词大幅精简 80%。这表明 AI 交互方式正发生根本转变，过多的提示和示例反而会限制先进模型的表现。AI 提示词正经历“短-长-短”的演变循环。#AI交互# #ClaudeFable5#...

人工智能 2026-07-04 0
英伟达开源 TwoTower AI 模型：保留 98.7% 质量，Token 生成提速 2.42 倍

英伟达昨日（7 月 2 日）发布博文，宣布推出 Nemotron-Labs-TwoTower，是一种基于预训练自回归骨干网络的离散扩散语言模型，致力于解决大模型 Token 生成速度瓶颈。...

人工智能 2026-07-04 0
威胁平面设计等远程工作者：AI 自动化 16.1% 项目已被攻克

AI 安全中心（CAIS）于 7 月 1 日更新远程劳动指数（RLI），指出 AI 远程劳动自动化率正在经历快速跃升，Claude Fable 5 模型自动化率达到 16.1%，刷新该基准测试纪录。...

人工智能 2026-07-04 0