2019/10/23 11:45 快科技
GitHub开源社区最新公布的AMD ROCm开发库显示,AMD GPU将在未来加入对BFloat16(BF16)浮点指令的支持,相比现在的FP16浮点可带来巨大的飞跃。
目前,Intel Cascade Lake至强、Ice Lake酷睿处理器已经支持BF16,ARM下一代ARMv8 CPU架构也会加入。BF16虽然不属于IEEE标准规范,但它的优势正得到越来越广泛的验证和认可。
BF16可以视为精简版的FP32单精度浮点指令,使用8个有效位、8个阶位,内存和带宽占用减半,执行效率大大提升,同时又在性能方面远胜FP16,可以大大提升AI人工智能、ML机器学习、DL深度学习等应用的性能、效率,不再受限于FP16的性能、FP32的效率。
根据模拟,BF16相比于FP16带来的性能提升在不同运算类型中,少则可达1.6倍,多则能够超过4倍。
现代3D游戏渲染不太可能从BF16中获益,但是随着GPU越来越多地参与AI、ML、DL运算,BF16的加入必将会给AMD显卡带来强大的加成,未来值得期待。
榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn(把#换成@)。