新浪科技讯7月29日晚间消息,今日闭幕的2025世界人工智能大会(展览)上,GMICloud发布自研“AI应用构建成本计算器”,宣布通过实时量化不同场景下的算力成本、时间损耗与供应商性价比,可为开发者提供成本规划支持。
典型场景评估显示,使用GMICloud方案可使海外IT成本降低40%以上,回本周期缩短至行业平均水平的1/3。
Token作为AI文本处理的基本单位,其消耗成本直接决定商业可行性。据行业数据显示,GPT-4Turbo处理单次多步骤Agent任务消耗可达200万Token(成本约2美元),而工程化部署周期普遍被低估60%。
据介绍,GMICloud“AI应用构建成本计算器”可基于Token数量与单价(区分输入/输出),核算AI应用/AIAgent构建总花费;结合Token吞吐量(输入/输出速度),计算处理总请求的耗时。同时,该工具还能实时对比OpenAI、Anthropic等15家供应商的Token单价,自动标记InferenceEngine等低成本替代方案。
此外,GMICloudInferenceEngine的底层调用GMICloud全栈能力,可直接调用英伟达H200、B200芯片,从硬件到软件进行了端到端的优化,极致优化单位时间内的Token吞吐量,确保其具备最佳的推理性能以及最低的成本,最大限度地帮助客户提升大规模工作时的负载速度以及带宽。同时,其让企业以及用户进行快速部署,选择好模型后即刻扩展,几分钟之后就可以启动模型,并用这个模型进行Serving。(文猛)