南宫·NG28通盘这些不同的算法皆是不同的-南宫·NG28(China)官方网站-登录入口
发布日期:2024-09-15 05:00 点击次数:74
新浪科技讯 9月12日上昼音尘,在出席高盛Communacopia Tech大会访谈时南宫·NG28,NVIDIA独创东谈主兼首席实行官黄仁勋在谈及通用磋议与加速磋议之间的分歧时指出,若是将5%的代码卸载到加速器上,从时刻上将能将哄骗依次的速率提升100倍,而英伟达将图像加速科罚的速率提升了500倍。
在黄仁勋看来,接续在软件编写的主体中有许多文献IO,需要建筑数据结构,软件里面有一部分包含一些神奇的内核和神奇的算法,这些算法因磋议机图形学、图像科罚或其他任何限度而异,可能是流体、粒子,也可能是图像域类型的东西,通盘这些不同的算法皆是不同的。“因此,若是你创建了一个科罚器,它在某些算法上十分出色,况且你在通用科罚器(CPU)擅长的限度与 CPU 互补,那么从表面上讲,你不错大大加速哄骗依次的速率,因为接续约5%或10%的代码,代表了99.999%的开动时刻。”
黄仁勋以数据科罚为例指出,为了加速数据科罚,英伟达创建了一个名为cuDNN 的库,这是宇宙上第一个神经收罗磋议库,因此英伟达有了cuDNN,有效于组合优化的cuOpt,也有效于量子模拟和仿果真cuQuantum等各式不同的库。这些不同的库,它们接受哄骗依次中开动的算法,并以英伟达加速器不错开动的阵势重构算法,不错将依次的开动速率提升100倍。
海量资讯、精确解读,尽在新浪财经APP职守剪辑:郝欣煜 南宫·NG28