塔奇姆的最新通用处理器Prodigy将CPU和GPU的功能结合到一个单一架构中。

对于许多设计工程师来说,选择合适的处理器很快可能是一个更简单的决定,即使是在高性能计算(HPC)、数据分析、5G网络处理以及人工智能和机器学习操作领域。

与其决定实现CPU或GPU,单片设备现在可能是由Tachyum开发的通用处理器Prodigy形式的选项。Prodigy将CPU和GPU的功能结合到一个单一的架构中。公司创始人兼首席执行官Rado Danilak在与EE Times的简报中表示,这种单一设备有可能为云计算、AI和HPC环境提供更好的性能、功率和总体拥有成本。

Prodigy预计将于今年年底开始采样,并于2023年上半年批量生产,由128个高性能统一核心组成,运行频率高达5.7 GHz,并为风冷和液冷数据中心提供机架解决方案。Tachyum采用了CPU模型,扩展了向量处理器以处理超级计算工作负载,然后对其进行了修改,以处理AI数据类型和矩阵。达尼拉克说:“每一个内核都比任何Intel/AMD内核都快,芯片对芯片的总体速度约为4倍。”。

数据中心最关键的痛点之一是功耗,这可能会限制扩展。如今,它们消耗了全球约4%的电力,产生的全球排放量比整个航空业多50%。

达尼拉克表示:“如果当前趋势没有变化,数据中心到2040年将消耗40%的电力。”。

Danilak补充道,尽管耗电量很高,但许多服务器的利用率严重不足。他援引Facebook的研究发现,每24小时的平均利用率低于50%。这种低服务器利用率每年要花费数十亿美元。

丹尼拉克说:“如果他们开始使用通用处理器,而不是在人们不使用它们的夜晚关闭服务器,他们可以将它们用于AI,而且他们可以在不购买单个GPU的情况下获得10倍的AI。”。

所有这一切都发生在处理器性能增长放缓,摩尔定律似乎不再适用于进程收缩的情况下。此外,即使晶体管速度更快,布线也会变慢,这意味着布线延迟现在限制了功能块的性能。

缓慢的改善导致了过度的预见,从而增加了电力消耗,这就是Tachuym决定从电气和物理的角度来看待这个问题的原因。


处理器的性能增长已经放缓,摩尔定律不再适用于进程收缩。(来源:Tachyum)

最终,Prodigy通过选择不跨线移动数据来解决电源和性能方面的挑战,这是导致速度放缓的根本问题。达尼拉克说:“我们不仅提高了速度,还节省了电力。”。这使得Prodigy可以用更少的资源做更多的事情。


Tachyum的通用处理器避免了通过电线传输数据,因为即使晶体管速度更快,数据传输速度也会随着进程收缩而变慢,因为电线延迟现在限制了功能块的性能。(来源:Tachyum)

丹尼拉克强调,Prodigy不是人工智能加速器,而是一种非常适合人工智能的CPU替代品。该公司在6月初宣布,将在今年晚些时候推出数量有限的Tachyum Prodigy评估平台,为合格的客户和合作伙伴提供功能齐全的Prodigy处理器以及内存和应用软件。

评估平台提供了一个标准2U风冷外形的高性能服务器,使各细分市场的客户能够测试和评估通用处理器。

-加里·希尔森(Gary Hilson)是《EE时报》的特约编辑,专注于内存和闪存技术。

>>这篇文章最初发表在我们的姐妹网站上,EE时间.