2016年才成立的斯洛伐克创业公司Tachyum今天抛出一枚重磅炸弹,宣布了全新的128核心Prodigy处理器,号称“性能可超越Intel最快的至强,同时功耗仅有十分之一”。首先说一下Tachyum的背景:这家公司设立在斯洛伐克,并得到过斯洛伐克政府1700万美元投资,但几位创始人都是美国人,且大有来头。
 
尤其是CEO Radoslav Danilak,拥有25年的半导体行业经验,一度大红大紫的SSD主控巨头SandForce就是他创立的,还亲自担任CEO,后被希捷收购,后来又创立了Skyera,继续研究SSD主控技术,2014年又被西数收购。
 
Tachyum Prodigy号称是全球第一颗“通用处理器”(universal processor),因为它在单独一颗硅片内,集成了通用目的处理器、高性能计算、AI人工智能、DML深度机械学习、可解释人工智能(Explainable AI)、生物人工智能(Bio AI)等等,基于并行多处理器环境,可简化编程模型和环境。
 
最新的顶级型号为Prodigy T6128,单路单芯片集成128个物理核心,乱序执行架构,每时钟周期4条指令,支持64位寻址、512位矢量操作、AI/ML矢量和矩阵乘法加速、虚拟化、高级RAS,运行频率最高4GHz。
 
缓存方面,每个核心32KB一级指令缓存、32KB一级数据缓存,均支持ECC,末级缓存共享64MB,支持DECTED ECC。
 
内存方面,支持12个通道的DDR4、DDR5,最高频率DDR5-4800,但每通道只能有一条内存条,单条最大容量512GB,合计最大6TB,并支持高级纠错和RAS。
 
IO方面,集成了多达36个PCIe 5.0控制器,最多48条通道,同时还集成了两组400G(40万兆)以太网控制器。
 
更惊人的是,所有这些强大的规格,在台积电7nm工艺的加持下,封装面积才不过85×85平方毫米,略大于Intel LGA2066的酷睿,但小于AMD SP3的线程撕裂者。
 
Tachyum没有披露Prodigy的具体架构,不知道基于RISC-V、MIPS、ARM还是自研,只是说无论单线程还是多线程应用,都已经超越了Intel至强,但是又比ARM更小巧。
 
据介绍,Prodigy T6128处理器适合大规模超级计算机、大数据、大型AI应用,可提供262TFlops AI训练和推理性能、16TFlops HPC高性能计算性能。
 
开发环境方面,Tachyum也提供了一系列工具,包括FPGA模拟器、软件模拟器、二进制翻译器、C/C++/Fortran编译器、调试器和配置文件、TensorFlow编译器,都在Linux操作系统下。
 
如果客户不需要128核心这么高大上的规格,Tachyum也提供64/32/24/16核心等不同配置。
 
64核心的有两款型号,一个是T864,支持八通道DDR4/DDR5内存、72条PCIe 5.0通道、两组400G以太网、两组HBM3(可选)、32MB完全一致性二级/三级缓存,运行频率4GHz,核心电压0.8V,热设计功耗180W,核心面积290平方毫米,封装面积66×66平方毫米,可以取代单路/双路的至强E7、至强E5。
 
另一个是TH24,专供AI/HPC,四通道DDR5和/或32GB HBM3,后者可作为缓存也可以是独立内存,需要高精密水冷。
 
32核心的型号为T432,四通道DDR4,32条PCIe 4.0,两组100G以太网。16核心的则是T216,双通道DDR4,32条PCIe 4.0,两组50G以太网。二者都是小尺寸封装,成本和价格低廉,适合取代至强E5、至强E3、至强D系列。
 
当然,这些产品大部分都还在纸面上,目前只流片成功了64核心的T864,预计今年内投入量产。