在一系列旨在帮助企业更轻松构建基于人工智能的代理和应用程序的公告中,Databricks公司今天在其Data+AI峰会上推出了Lakebridge,这是一款旨在简化和加速传统数据仓库迁移这一公认困难过程的工具。
Databricks表示,这项免费服务可以自动化多达80%的迁移生命周期,并可作为现代化分析和AI基础设施战略的一部分。公司指出,由于企业正在寻找传统系统的替代方案,这些系统通常运行缓慢且成本高昂,因此对其Databricks SQL数据仓库的需求正在激增。
Lakebridge旨在通过自动化、深度分析、智能SQL转换和内置验证来解决迁移的复杂性。它由三个主要组件组成。
分析器扫描公司的传统环境——包括表、视图、提取/转换/加载作业和存储过程——并按复杂性对其进行分类。这种清晰度有助于团队更有效地规划和排序迁移。转换器将其他数据仓库如Teradata公司的BTEQ、微软公司的T-SQL和甲骨文公司的PL/SQL转换为Databricks SQL或Apache Spark SQL。验证器确保数据质量和逻辑在迁移后保持完整,平台内置的对账工具。用户界面中嵌入的仪表板和多标签报告帮助团队保持进度。
Databricks押注许多公司准备从专有平台转向更开放的替代方案。Databricks SQL虽然不是开源的,但它基于并支持多种开源技术,包括Apache Spark、Delta Lake和ANSI SQL。Lakebridge将传统语法转换为符合ANSI标准的SQL,帮助客户转向开放目录和可互操作的平台。
Databricks表示,Lakebridge可以将项目时间表缩短一半,同时支持从超过10个流行系统的迁移,包括Teradata公司、Snowflake公司、微软公司SQL Server和Informatica公司。额外的连接器正在私人预览中。
Lakebridge集成了BladeBridge公司的技术,这是一款迁移引擎在今年早些时候被收购。据称,BladeBridge带来了强大的SQL解析、代码转换和验证能力。
在接下来的几个月中,Lakebridge将通过使用强化学习的AI驱动代码转换进行升级,以提高翻译准确性。一个专用的数据迁移模块和图形用户界面也在开发中。
Databricks还宣布了两个战略合作伙伴关系,旨在扩展其AI能力和云足迹。与Google LLC云的扩展合作将Google Gemini模型本地引入Databricks数据智能平台。客户可以通过SQL查询和模型端点直接访问Gemini 2.5 Pro和较小的Flash模型——包括“深度思考”模式。
深度思考是上个月推出的Gemini 2.5 Pro的专用推理模式,使模型能够并行遍历多个推理路径。集成意味着企业数据可以在Databricks中保持不变,同时由Google的高级模型处理,无需数据复制或复杂集成。
Databricks和微软也在通过与Azure AI Foundry、微软的低代码Power Platform和即将推出的SAP Databricks产品的更深层次集成来扩展其长期合作伙伴关系。该合作伙伴关系旨在简化数据访问、治理和AI开发。
与Google和微软的新合作伙伴关系进一步加强了Databricks成为跨云数据和AI操作系统默认选择的目标。原生集成领先的基础模型且无需数据移动,解决了企业AI部署的一个主要摩擦点。