2020年,Sridhar Ramaswamy与另一位谷歌前高管Vivek Raghunathan一起创立了Neeva,这是一家无广告、注重隐私的搜索引擎。在2021年最后一轮融资时,Neeva的估值约为2.5亿美元。
快进到现在,Snowflake是一个家喻户晓的企业名称。该公司最近推出了一系列开源模型,包括Arctic LLM,这些模型是为那些希望使用大型语言模型(LLM)创建会话SQL数据副本、代码副本和RAG聊天机器人的企业设计的。
这要归功于Sridhar Ramaswamy,他在今年早些时候成为了Snowflake的新任首席执行官。自上任以来,该公司已从一个单纯的数据管理服务提供商转变为一个数据和人工智能驱动的实体,高度重视生成式人工智能。
Ramaswamy在执掌Snowflake后最近的一次采访中表示:“我认为这是数据应用和人工智能领域的一个巨大机会。它将让我在未来的许多年里忙碌起来。”
Snowflake AI负责人Baris Gultekin表示,他在谷歌与Ramaswamy共事了20多年,称他是一位令人难以置信的领导者。Gultekin说:“Sridhar在人工智能和数据系统方面带来了令人难以置信的深度。他在谷歌管理过超大规模的数据系统和人工智能系统。”
Neeva在生成人工智能和LLM方面的专业知识现已集成到Snowflake数据云中,增强了Snowflak的人工智能能力。特别是在其云数据平台内的自然语言处理和搜索功能方面。
Gultekin表示:“Neeva是Snowflake的一笔重要收购。我们正在将Neeva的许多东西整合到Snowflak的产品中,其中最明显的是Snowflage的通用搜索产品。”。
Universal Search可帮助客户快速轻松地在其帐户中查找数据库对象、Snowflake Marketplace中提供的数据产品、相关的Snowflake Documentation主题以及Snowflake-Community知识库文章。
Snowflake的生成式人工智能项目
虽然市场上有几种生成型人工智能模型,但Snowflake选择了面向企业客户的利基市场。最近,该公司推出了Snowflake Cortex。
Cortex允许从各种供应商获得预先培训的LLM,包括Snowflake自己的Arctic LLM。这些模型可以在Snowflake环境中执行文本总结、情绪分析、问题回答和代码生成等任务。
此外,Cortex提供预构建的SQL函数,使用户无需广泛的编码专业知识即可对其数据执行机器学习任务。这些函数处理分类、回归和异常检测等任务。
Snowflake还与Mistral、Meta和Reka合作,在Cortex上托管他们的LLM。Gultekin说:“我们与Landing AI、AI21实验室和其他有能力的合作伙伴合作,开发出了令人惊叹的产品。它们对我们来说很重要,因为它们让我们能够为客户提供选择。”
Gultekin进一步表示,Snowflake正在以非常实惠的价格开发LLM,并优先考虑客户数据的安全性。Gultekin说:“尽管使用的计算预算减少了17倍,但Arctic在语言理解和推理方面与Llama 3 70B不相上下。”
此外,他表示,他们有1万名客户将敏感数据委托给Snowflake。考虑到这一点,他强调,他们运营的所有LLM都在严格的安全参数范围内,这意味着没有数据留下,一切都保持安全。
此外,他补充道,尽管Arctic LLM比OpenAI小了几个数量级,但该基准证明,他们在文档理解和文档数据模型问答方面表现出色。
Snowflake最近引入了Document AI,从PDF、图像和视频等非结构化数据中提取有价值的内容。它由多模式大型语言模型Arctic TILT提供支持,为企业提供高效的内容提取。
Gultekin总结道:“我们才刚刚开始。有很多东西需要构建。我想说,我们的核心用例是能够与数据对话,以及我们如何使其变得更好、更容易。”他说,他们最近刚刚发布了一大堆产品供公众预览。其中包括一系列能够使用结构化数据进行聊天的聊天产品。