4月3日消息,据媒体报道,新年以来,随着Anthropic、字节跳动等AI巨头接连推出爆款应用,叠加“龙虾”热潮带动开源大模型调用量激增,英伟达H100芯片在租赁市场上迎来身价反转。
要知道,H100芯片是黄仁勋在2022年3月GTC大会上发布、同年秋季开始出货的产品。
据半导体研究机构SemiAnalysis最新发布的“H100一年期租赁合约价格指数”,该“老芯片”的租赁价格自2025年10月触及每小时1.7美元的低点后,于今年3月飙升至每块GPU每小时2.35美元,涨幅接近40%。
该指数基于对100多家云服务提供商及算力买卖双方的直接调查,每月采集一次数据。
报告指出,按需租用的GPU算力已在所有类型的GPU中售罄——即便近期价格上涨,已锁定按需实例的客户也不愿将算力释放回资源池。
至于架构更先进的Blackwell芯片?研究人员表示,由于对开放权重模型的需求强劲,叠加推理需求持续激增,新部署Blackwell的交付周期已延长至6到7个月。
2025年晚些时候,市场一度预期,随着性能更强、算力成本更低的Blackwell芯片加速部署,Hopper系列(H100、H200)的租赁价格将大幅下降。然而最新情况恰恰相反:H100的需求不仅保持坚挺,在许多场景下甚至进一步增强。
SemiAnalysis在报告中指出,今年年初算力需求的重要驱动之一来自原生媒体生成。例如,字节跳动的Seedance(即梦)和谷歌Nano Banana推动用户大量生成与优化视频、图像,带动词元(token)吞吐量大幅上升。而更显著的需求来源是多智能体(multi-agent)工作负载的兴起,使得词元使用量和算力消耗呈现抛物线式增长。
SemiAnalysis透露,仅其自身“在过去一周里就消耗了数十亿词元”,每百万词元成本约5美元。不过公司也表示,由此节省的时间以及工作流程与能力的扩展,带来的回报远超算力成本。