即日起,硅基流动(SiliconCloud)平台正式推出了其 DeepSeek-R1 和 V3API 的批量推理(Batch Inference)功能,这一更新标志着平台在数据处理能力上的又一重大飞跃。通过全新的批量 API,用户可以不再受限于实时推理的速率,向 SiliconCloud 发送请求,从而更加高效地处理大规模数据任务。据悉,预期在24小时内即可完成大规模数据处理任务,这一功能无疑为广大用户提供了更为便捷和灵活的数据处理解决方案。
此次功能更新的一个显著亮点在于价格的大幅优惠。DeepSeek-V3 的批量推理价格相较于实时推理直降50%,为用户节省了大量成本。更令人振奋的是,在3月11日至3月18日这一特殊活动期间,DeepSeek-R1 的批量推理优惠价格更是低至75%的折扣,输入价格仅为1元/百万 Tokens,输出价格则为4元/百万 Tokens。这一价格策略无疑为想要尝试批量推理功能的用户提供了极大的吸引力和实惠。
批量推理功能的推出,旨在帮助用户更好地应对生成报告、数据清洗等大批量数据处理任务,实现更高的效率和更低的成本。此功能尤其适用于那些无需实时响应的数据分析、模型性能评估等场景,使得用户能够更为自由地安排数据处理时间,专注于核心业务的发展。
值得一提的是,在推出批量推理功能之前,DeepSeek-R1 和 V3API 已经相继支持了 Function Calling、JSON Mode、Prefix、FIM 等多项功能,这些功能的丰富性和灵活性使得平台能够满足用户多样化的数据处理需求。此外,Pro 版 DeepSeek-R1 和 V3API 的 TPM(每分钟处理的 Token)上限也已经从1万提升至100万,这一提升无疑将进一步提升平台的处理能力和用户的使用体验。
随着批量推理功能的推出和价格的大幅下调,SiliconCloud 平台将为广大用户提供更为强大、高效和便捷的数据处理服务。未来,平台还将继续不断优化和升级各项功能,为用户提供更加全面的数据处理解决方案,助力用户实现更高水平的业务发展和创新。