
Speechify主要是一款帮助用户收听文章、PDF和文档的工具。该公司现已为其Chrome扩展程序新增语音识别功能,包括语音输入和能够回答问题的语音助手。
在过去的一年中,随着语音识别模型整体质量的提升,语音识别工具的数量激增。Speechify也顺应这一趋势,推出了支持英语的语音输入工具。与其他语音输入工具类似,Speechify的语音输入功能能够纠正错误并去除填充词。
在我短短一天多的测试中,我发现Speechify的工具还有很大的改进空间。例如,这些工具在Gmail和Google Docs上运行良好,但在WordPress等网站上,我在启动语音输入并让其正常工作时遇到了困难。公司表示正在逐步为热门网站进行优化。

在准确性方面,词错误率比其他一些工具如Wispr Flow、Willow和Monologue要高。Speechify指出,其模型随着使用次数的增加会学习得更快,错误率将逐渐降低。
这家初创公司还推出了一个位于浏览器侧边栏的对话式语音助手。用户可以询问它关于网站的问题,比如“三个关键点是什么?”或“用更简单的术语解释一下。”
虽然ChatGPT和Gemini也有对话模式,但Speechify认为它们在应用中只是附加功能,而这家初创公司的工具则将语音功能放在首位。
“我们相信,在打开应用时,聊天将始终是ChatGPT和Gemini的默认用户体验。这是他们的用户所期望的。语音将始终是次要的——在许多情况下,对于ChatGPT和Gemini来说是附加功能。我们从多年的Speechify开发中了解到,市场上有很大一部分用户,包括我们的用户,希望每次打开应用并与AI对话时,语音是主要的、默认的设置。”公司首席商务官Rohan Pavuluri通过电子邮件告诉TechCrunch。
一个显著的问题是,Speechify的助手目前无法与内置侧边栏助手的浏览器一起工作,如OpenAI的Atlas、Perplexity的Comet和Dia。初创公司对此并不太担心,因为该扩展程序主要是为Chrome及其庞大的用户群设计的。
Speechify表示计划逐步在其所有桌面和移动应用中加入语音输入和语音助手功能。
