当前位置：首页 > 科技资讯 > Intel 10nm十代酷睿改造转战M.2：神经网络推理

Intel 10nm十代酷睿改造转战M.2：神经网络推理

作者宏煊网络科技

2025-06-11 阅读 0

Intel10nmIceLake十代酷睿处理器已经上市，但它可不仅仅会用于轻薄笔记本，未来还会登陆服务器，而在两个月前以色列海法(Intel重要研发基地)，Intel还展示了一款基于10nmIceLake打造的NervanaNNP-I(神经网络推理处理器)，但采用了M.2样式。

HotChips31芯片大会上，Intel首次公布了这款特殊产品的架构细节。

这是10nmIceLake十代酷睿处理器

这是基于IceLake改造的M.2NNP-I

在无处不AI(AIEverywhere)的指导思想下，Intel正在研究各种各样的AI软硬件方案，包括CPU、GPU、FPGA、ASIC等等。

这款新的NNP-I代号为“SpringHill”(温泉山丘)，面向数据中心领域的轻度AI推理工作，能做成M.2扩展卡正是得益于10nm芯片的超小面积。

在原有10nmIceLake处理器的基础上，Intel拿掉了两个CPU计算核心、GPU核芯显卡，同时加入12个推理计算引擎(ICE)，彼此基于硬件同步，同时每个ICE有自己的4MBSRAM缓存来减少数据转移，并且和两个CPU核心共享一致性互连、24MB三级缓存。

Intel还设计了一个深度学习计算网格(DLComputeGrid)，作为张量引擎的它通过数据和控制总线与SRAM、VP6DSP互连，支持FP16、INT8、INT4、INT2、INT1等类型操作，其中DSP还可以处理一些特殊的算法。

CPU核心仍然是标准的SunnyCove架构，支持AVX-512、VNNI指令集，可加速卷积神经网络，而完全继承的FIVR电压调节器可动态调整功耗，优先满足最需要的硬件单元。

内置两个LPDDR4X内存控制器，整合封装一颗内存芯片与之配合，传输带宽4.2GT/s(68GB/s)，并支持带内ECC，但容量未公布。

NNP-I与系统的通信通道走的是PCIe3.0x4或者PCIe3.0x8，带宽不是事儿，但没有用NVMe协议，只是标准的PCIe界面。

TDP功耗非常灵活，低可至10W，高可达50W，完全视性能需要而定，作为扩展卡也不受M.215W的限制。根据不同功耗配置，INT8整数能效在2-4.8TOP/s范围内。

Intel表示，10WTDP功耗下跑ResNet500，每分钟推理数可达3600，等于效率高达4.8TOP/s，还是相当高的。

软件方面，Intel会提供相应的开发工具，帮助负载将推理工作完全转移到加速器上，完成后再通知至强CPU进行下一步处理，从而使得至强CPU不再需要通过PCIe总线和其他加速器彼此通信、转移数据，大大节省计算资源和功耗。

IntelNNP-I目前已经试产，将在年底投入规模量产并出货，而且后续还有两代新品正在设计中……

预约SEO专家添加微信号：xxxxxxx 领取免费VIP内部课程

上一篇：Word文档怎么变成PDF？这个PDF转换器可以转换成功

上一篇：“新基建”有了样板案例：百度智能云联合河北港口集团打造智慧港口

宏煊网络科技作者

宏煊网络科技是专业科技新媒体网站。网站著眼于新一代科技新闻的全面及时处理报导,让网民在外面第二时间交待全球新一代的科技资讯。内容涵括AI+、互联网、IT、创业投资、核定、区块链、智能硬件等领域

曾操作某大型门户网站日IP达100万（纯SEO流量），拥有上千网站提供SEO友情链接资源（参加培训免费赠送100个单向友情链接），免费赠送附子SEO内部VIP课程，2018年新版实战课程介绍