Google Beam为工作场所带来逼真的3D视频通话和实时AI翻译

2025年05月21日由佚名发表 213 0

随着Google推出Beam，这一新一代AI驱动的通信平台，超逼真的3D视频通话在办公室和组织中成为现实。Beam在2025年的Google I/O大会上首次亮相，是Project Starline的商业化演变，旨在通过提供真实的存在感来弥合虚拟会议与面对面会议之间的差距——无需佩戴耳机或眼镜。

Beam的核心功能是其AI体积视频模型，它能够将标准的2D视频流重建为动态、真人大小的3D表现。这项技术依赖于六摄像头阵列从多个角度捕捉参与者，然后使用先进的AI技术实时合并这些视角。最终呈现的视频体验保留了微妙的面部表情、自然的眼神交流和细微的手势，使对话感觉就像每个人都在同一个房间里。

Google通过在Google Cloud上构建Beam来优化企业环境，确保其具有强大的可靠性并能顺畅地与现有工作流程集成。早期的企业用户可以期待毫米级的头部跟踪精度和每秒60帧的视频，最大限度地减少通常破坏远程协作的延迟和尴尬。系统的光场显示使用户可以自然互动——无需穿戴技术——为团队和客户消除采用障碍。

步骤1：在您的会议室或工作空间部署Google Beam硬件。该系统使用专门的六摄像头阵列和定制的光场显示来捕捉和渲染3D视频。将设备放置在可以从多个角度完全查看参与者的位置，以确保准确的体积捕捉。

步骤2：将Beam连接到您组织的网络，并与您首选的会议平台链接。Beam直接与Google Meet和Zoom集成，因此团队可以像往常一样安排或加入通话。这种兼容性消除了IT团队和用户的摩擦，让他们无需学习新软件即可利用Beam的高级功能。

步骤3：启动3D视频通话。当会议开始时，Beam的AI模型会立即处理视频流，重建每个参与者的3D形象。光场显示投射这些实时化身，实现自然的眼神交流和更真实的沟通。参与者可以读取肢体语言、面部线索，甚至是通常在平面视频通话中丢失的细微表情。

步骤4：在通话期间激活实时语音翻译。Beam的AI翻译系统允许用户用母语讲话，同时系统为其他参与者生成翻译的音频流——保留原始语调、语气和情感细微差别。此功能支持跨语言障碍的真实对话，已经在Google Meet中推出，未来几周将添加更多语言。

步骤5：与外部合作伙伴和客户安全协作。Beam的企业级安全性和与Google Cloud的集成使组织能够与全球的合作伙伴、客户或远程团队连接，无论他们使用的是Beam、Google Meet还是Zoom。这种灵活性支持混合工作和全球业务运营，而不牺牲沟通质量。

最初的推广目标是企业客户，HP将在InfoComm贸易展上首次展示Beam设备，并且包括德勤、Salesforce、Citadel、NEC、Hackensack Meridian Health、Duolingo和Recruit在内的选定组织已经排队等待早期访问。Google还与Diversified和AVI-SPL等渠道合作伙伴合作，以加速在商业环境中的采用。

对于希望解决远程会议中持续存在的挑战的团队——尴尬的延迟、错过的非语言线索和语言障碍——Beam提供了显著的提升。通过重建面对面互动的深度和即时性，它减少了误解并在分布式团队中建立信任。实时AI翻译的加入进一步简化了全球协作，使组织能够跨越国界进行操作而不失去对话的细微差别。

Google的Beam有望重新定义虚拟会议的可能性，为寻求使远程工作变得像在同一空间中一样自然和高效的公司提供技术飞跃。

文章来源：https://allthings.how/google-beam-brings-lifelike-3d-video-calls-and-real-time-ai-translation-to-the-workplace/

标签：

人工智能

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Atera推出IT自动驾驶仪，减轻技术人员的基础任务负担

下一篇 MIT研究揭示AI仍难以理解“否定”一词

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来