从机器学习、深度学习,到生成式AI、代理型AI,人工智能已成为当代企业IT应用的显学,当所有人都在追逐软件与AI模型的发展,以及硬件运算能力之余,对于网络、存储系统等IT基础架构的性能、效率要求,也跟着水涨船高。
单就网络环境而言,Nvidia这几年以来,陆续推出NVLink、NVLink Switch System,以及Spectrum-X以太网络平台、Quantum-X800 InfiniBand网络平台,而近期崛起、由多家IT厂商组成的超以太网络联盟(UEC),制定的1.0版规格今年6月正式定案,区分为连接外部环境的前端网络,以及连接AI集群内部多个节点的后端网络。
而在存储系统的搭配上,仍是以Nvidia经营的市场生态系最为知名,处于相对显著的位置,他们这几年以来,持续号召多家企业级存储系统厂商,参与他们主导的DGX SuperPOD对于存储产品的认证,以及DGX BasePOD针对存储产品的认证,截至目前未止,包含DDN、Dell、IBM、NetApp、VAST Data、WEKA等厂商,都加入这个合作计划,共同拉抬Nvidia整柜型AI基础架构解决方案DGX System市场声势,协助推广AI应用设备预先搭配存储系统的快速构建方案。
2024年6月,Nvidia发布名为Nvidia Cloud Partner(NCP)的参考架构,目的是提供组建高性能、高扩展性与安全的数据中心,可处理生成式AI与大型语言模型的工作负载,这项计划也号召通过DGX SuperPOD认证的存储厂商加入,后续Nvidia也发展出NCP存储认证。
而在今年3月GTC大会期间,Nvidia针对存储系统产品发布新的AI基础架构参考设计,称为Nvidia AI Data Platform,厂商可依此为代理型AI应用系统与工具的需求,量身打造适合的数据平台,并且运用特定的AI查询代理人机制,加速AI推理(reasoning)的工作负载。Nvidia点名10家厂商都将支持这个平台,其中有许多都是与Nvidia密切合作的,包含DDN、Dell、Hitachi Vantara、HPE、IBM、NetApp、Nutanix、Pure Storage、VAST Data,以及WEKA。
基本上,Nvidia AI Data Platform提供的这些AI代理,是基于Nvidia AI Enterprise软件平台而成,其中囊括以NIM微服务形式打包、具备推理能力的Nvidia Llama Nemotron模型,以及新的Nvidia AI-Q Blueprint蓝图,能以近乎即时的速度从处理的数据其中,产生洞察分析。而在底层基础架构的部分,AI代理可借助Nvidia的GPU、DPU、网络等技术,以及开放源码的推论程序库Nvidia Dynamo,提供优化性能。
以AI-Q Blueprint为例,提供AI代理系统的推理,以及连接企业数据的能力。首先,都以Nvidia GPU处理时,Nvidia声称AI-Q Blueprint用Nvidia NeMo Retriever微服务,数据提取速度可因此暴增15倍;而通过AI-Q Blueprint组建而成的AI查询代理,能在执行推论(inference)作业之际,同时连接数据,提供更精准、具有前后文脉络感知的回应内容。而且,这样的AI查询代理能快速访问大规模的数据、处理各式数据,涵盖不同来源的结构化数据、半结构化数据、非结构化数据,如文本、PDF文件、图片、视频。
除了以Nvidia为首的AI(GPU)存储厂商阵营,我们今年3月制作GPU直连对象存储的技术专题,提到MinIO、Cloudian、DDN投入;近期我们也注意到出现越来越多创业公司存储系统厂商正在发展KV Cache技术或解决方案,于是,本期iThome计算机报周刊的封面故事也以此为题,在所有市场调查机构都尚未提出相关分析报告之前,抢先于此时初步整理这类型产品的市场现况,并且探讨最新应用。目前,我们总共列出6家厂商(WEKA、焱融科技、VAST Data、PEAK:AIO、Pliops、GridGain),以及开放源码软件(Nvidia Dynamo、llm-d)的解决方案。
基于上述趋于多样的AI存储系统发展路线,有望带动新一波企业存储系统产品的转型,我们期盼能有更多厂商投入,Dell、IBM、HPE、NetApp、Pure Storage等大厂也必须加紧脚步,通过积极研发或并购合适的厂商,尽早扩大相关布局,以免错失商机。
申宝配资-炒股公司-中国股票配资网网-丹东股票配资提示:文章来自网络,不代表本站观点。