在人工智能快速发展的当今时代,算力已成为其进步的核心驱动力。全球人工智能算力每3-4个月翻一番。然而算力成本高、GPU供应短缺等问题却如迷雾般困扰着众多企业和开发者。在2024腾讯数字制作大会上,传统计算巨头英特尔凭借强大的产品线,为AI计算市场带来了一系列引人注目的解决方案。
走进英特尔展区,首先映入眼帘的是一只正在做各种动作的机器狗。它头上的钩子引起了很多人的好奇。事实证明,这是为了解决机器人停止时的平衡问题,体现了当前技术的局限性。基于英特尔芯片的掌上游戏机也吸引了不少关注。近年来X86掌上游戏机开始流行,而英特尔新发布的Luna Lake处理器更是令人兴奋。此外,Intel的arc显卡也备受关注。现场展示了采用四块弧形显卡的液冷工作站,展示了其在消费市场的广泛应用,驱动也日趋完善。展区里还有一些AI玩具原型,可以与用户对话并做出肢体反应,非常有趣。这些玩具背后的大型模型都运行在西强处理器上。
Intel Xeon 6在AI领域的表现令人惊叹。它具有以下显着特点: - 微架构创新:志强分为六大类:性能核心(P-core)和能效核心(E-core)。与消费级处理器不同,其P核和E核对应两种不同类型的处理器,因为服务器环境有更专业的需求,数据中心可以根据具体需求进行配置。这一代的西强核心数量大幅增加。 P核希强可以达到128个物理核心和256个逻辑核心,E核希强可以达到288个物理核心。两者均基于Intel 3.0工艺技术,具有较高的计算密度。改进是显而易见的。 P核可以实现更高的性能,满足计算密集型工作负载,AI相关性能提升2~3倍; E-core可以实现更好的能效,满足高密度、水平扩展的工作负载需求,机架密度提升2.5倍。 ,每瓦性能提高2.4倍。 - 高内存性能:志强VI的内存MCR时钟频率可达8800 MHz,内存带宽提升2.8倍。这对于AI的推理和反应速度具有重要意义,因为随着处理器核心数量的增加,内存发展相对缓慢,计算瓶颈往往在内存。智强VI的科学计算性能提升了2.9倍,对于REDIS、MYSQL等数据库的性能提升也非常显着。 - 指令集优化:志强VI拥有AVX512指令集,每个核心有两个AVXV2计算单元,可以加速时空向量计算。同时Intel的AMX指令集也为其增添了不少内容。它可以加速矩阵乘法和卷积运算,引入尾寄存器,支持INT8和BF16数据格式,广泛应用于AI训练和推理。添加AMX后,计算能力得到了显着提升。 CPU相当于GPU卡甚至更强的计算能力。具有自然语言处理、图像分类、游戏AI、OCR、TTS等场景以及推荐系统的嵌入性能。很大的进步。
除了智强VI之外,英特尔的Gaudi AI加速器也不容小觑。 Gaudi现已发展到第三代,采用5纳米工艺制造。与上一代相比,Gaudi 3拥有4倍的bf16 AI算力、1.5倍的内存带宽、2倍的网络带宽。它包含64个AI定制可编程张量处理器核心(TPC)和8个矩阵乘法引擎(MME)。每个MME能够执行64,000个并行操作,显着提高计算效率。 Gaudi 3配备128GB HBM E2内存和3.7TB内存带宽,以及96MB板载静态随机存取存储器(SRAM),为处理大型GenAI数据集提供充足的内存。此外,它还集成了24个200GB以太网端口,支持高效扩展。该软件集成了PyTorch框架,并提供优化的Hugging Face模型,以提高开发效率。
腾讯云与英特尔一直保持着密切的合作关系。腾讯云第八代服务器S8采用第五代西强处理器,每秒100万次读写存储次数,2100G双上行网络。本次大会上,双方还联合发布了基于西强6处理器的新一代云实例,配备自主研发的智能网卡、星海底座和全新网络架构。腾讯自主研发的星星海服务器支持节点热维护,大大降低了业务故障率,并且由于使用了智强VI,机器整体性能得到了大幅提升。
AI时代,算力为王。英特尔凭借在CPU领域的深厚积累和持续创新,以及在加速卡等领域的积极布局,为AI市场提供全面、强大的算力解决方案。如果你在屏幕前,你在搭建AI计算集群时会考虑英特尔产品吗?欢迎在评论区留言,分享你的看法!
分享到Twitter 在脸书上分享
评论
目前没有任何评论