智铠100是一款基于自研芯片的通用GPU推理加速卡,具有应用覆盖广,计算性能高,应用成本低及落地支持强的特性。兼容CUDA生态,生态应用和新模型适配迁移迅速,成本小,无需重新开发。
智铠100显卡支持FP32,FP16,INT8等多种精度计算。智铠100具备gao性能算力,单卡提供384 TFLOPS INT8 算力,搭配大容量HBM2e显存和高传输带宽,性能对标英伟达RTX 4090,在AI推理领域性能优异,在大模型推理场景优势明显,可通过单机1卡/4卡/8卡/16卡等多种形态部署,适应多种行业落地需求,具备行业很好的综合使用成本。
智铠100加速卡可广泛应用于智慧金融、智能推荐、快速搜索、内容审核、人工智能生成、智能客服等领域。
智铠100显卡配套完善gao效的软件栈,支持x86和ARM等架构。软件栈兼容主流GPU通用计算模型,提供基于C/C++的编程接口拓展,主流深度学习编程框架,高、gao性能推理引擎和多种加速库,配套调试和调优辅助工具,为gao性能计算和人工智能应用的开发和部署提供了便利。
国产GPU显卡智铠100产品参数(性能对标英伟达RTX 4090):
GPU 架构:通用GPU;
FP32 算力:** TFLOPS;
FP16 算力:** TFLOPS;
INT8 算力:384 TFLOPS@INT8(支持 INT32,INT16 计算);
内存:32 GB HBM2E;
接口:PCIe Gen4.0 x 16 lane;
电源:8 pin PCIe;
功耗:板级功耗 150W (TDP);
散热方式:被动散热;
尺寸:全长全高单槽 PCIe 卡;
视频解ma:支持128路并发(1080P @30fps)、支持HEVC/AVC/VP9/AVS2;
图像解ma/编码:2000/500 fps(JPEG);
ECC:支持;
软件生态:兼容主流通用计算软件框架、支持主流深度学习开发框架;
虚拟化:支持;