去年 6 月,英特尔发布首款桌面级独立显卡锐炫 A380 时,持观望态度的消费者居多。
一年过去,英特尔为独立显卡更新了 21 次驱动更新,每一次更新都实现了性能的提升。用行动展示了英特尔在做独立显卡方面的决心,也增加了消费者的兴趣。
(资料图)
" 我们在显卡 GPU 的路径上一定会坚持‘一条道走到亮’。" 英特尔公司中国区技术部总经理高宇在近期的一场技术分享会上再次强调。但真正能够直接打动用户的,是过去一段时间有 42 款新发售的游戏首日英特尔就提供了驱动优化支持。另外,针对视频创作者常用的 DaVinci 和剪映,英特尔也进行了充分适配。
追求更高性价比的游戏玩家,以及追求更高效率的内容创作者,显然会更期待锐炫带来的不一样的选择。锐炫 GPU 硬件的六大特性
强大的 GPU 一定是优秀的硬件和软件的融合。对于英特尔来说,设计出一款硬件架构优秀的独立 GPU 难度不高。
去年发布基于英特尔 Xe HPG 微架构的桌面级独立显卡锐炫 A 系列时,六大硬件先进性就让人印象深刻,包含:
一是锐炫近乎完美地支持 DirectX 12 Ultimate 的所有功能;
二是首代产品就实现了光线追踪,锐炫显卡中光线追踪的物理加速单元,每一个 Xe Core 里都有 Ray Tracking 单元(RTU)和 Thread Sorting 单元(TSU),都是为光线追踪效率提升而设计专门的硬件加速器;
三是架构中包含 XMX AI 矩阵加速器,AI 的性能可以有数量级的提升;
四是借助高性能的 AI 加速器,设计了 XeSS AI 超级采样技术,让所有游戏从画质到性能都能实现飞跃式提升;
五是继承了英特尔媒体功能的 " 强大血统 ",锐炫 GPU 中包含两个专用媒体编解码器,几乎可以支持互联网上的所有媒体格式;
六是英特尔 GPU 率先支持 AV1 编解码的硬解和硬编。得益于 AV1 免费、高压缩、高画质的特点,视频网站未来将快速的从传统编解码格式迁移到 AV1,英特尔做到了第一个支持。
游戏玩家期待更高性价比的独立显卡
GPU 用户要感知到硬件的先进性,还需要借助软件。
也就是说,GPU 的打磨,发布之前的重心在于硬件,发布之后的焦点在于软件。
" 软件层面的优化既包括显卡综合软件性能的提升也需要生态方面的不断拓展。" 高宇指出。
从提升游戏体验的角度,可以优化的有两个方面,驱动和与开发者合作。
驱动的更新能够带来游戏性能的提升,也决定着游戏支持的效果。
" 我们听到很多的客户反馈,说英特尔的显卡很先进,但对老游戏支持稍显欠缺。于是我们致力于解决这个问题,锐炫在二月的驱动更新中,DX9 游戏的性能提升高达 43%。" 从高宇举的例子就足以说明英特尔对于玩家的重视。
实际上,英特尔 GPU 软件团队在产品发布后根据获得的反馈,对 DX9 的驱动进行重构,实现了性能提升。
和开发者的合作和支持游戏生态的挑战更加巨大。以取得不错成绩的英特尔 XeSS 技术为例,目前已经有超过 50 款游戏集成了 XeSS 选项,其中许多是国际大作。
XeSS 是一个基于深度学习的时间摊销的超级采样技术,主要的目的有两个,一个是进行高质量图像放大,比如将 1080P 的图像放大到 4K,另一个是做到非常高的的抗锯齿。超级采样技术在 GPU 领域不是一个新技术,技术层面有挑战,但更难的是与开发者合作充分发挥出 XeSS 的优势。" 一些游戏默认只要检测到是英特尔的显卡,就会识别成一个集成显卡,光线追踪等效果默认关闭。" 英特尔 GPU 软件团队的工程师说," 首先要让开发者拿到我们的卡,才能进一步适配和优化,要展现出英特尔 XeSS 在性能和画质上的优势,然后说服他们集成英特尔的技术。"
游戏开发者想要发挥出 XeSS 的优势,需要动态矢量图和低分辨率的 RGB 的图像两个数据,利用这两块数据就能让 XeSS 模型输出高质量、高分辨率的图像。
XeSS 作为基于 AI 的技术,一个显著的优势就是可以调整参数进行优化。
" 我们用非常多数据集训练 XeSS 模型,但难免有一些非常罕见的场景缺乏数据。现在我们通过和一些游戏开发者合作,把他们的数据加到我们的训练集里面,新训练出来的模型就可以很好的解决比如罕见闪烁的情况。" 英特尔的工程师说。
最新发布的 XeSS 1.1 版本,相比 XeSS 1.0 进一步提高了图像质量和时间稳定性,并添加了自动曝光功能支持以提高视觉质量。通过针对性的优化,XeSS 1.1 改善了游戏中出现闪烁和摩尔纹等情况,英特尔独立显卡和集成显卡用户都能享受到更好的游戏体验。
在 XeSS 的游戏集成上,英特尔也提供了全面的支持。对于基于 Unreal Engine 的游戏,通过插件这种简单的方式支持 XeSS,包括 Unreal Engine* 4.26+ 和 Unreal Engine* 5,刚刚发布的 Unreal Engine* 5.2 版本,XeSS 也率先提供了支持。至于自研游戏引擎,英特尔提供了丰富的文档、示例代码和工程师来帮助开发者集成 XeSS 技术。
英特尔如此多举措就是希望方便开发者集成 XeSS 技术,当然也就是让最终的游戏玩家能够有更好的游戏体验。
借助 XeSS 技术,配合内核性能的优化,在锐炫 A770 和 A750 显卡上,把游戏画质开到最高,把光追效果开启,也可以达到非常流畅的效果,畅玩 3A 大作。
用主流的锐炫 A380,可以在 1080P 的分辨率上,配合 XeSS 技术,绝大部分游戏可以跑在 60 帧或以上,有非常流畅的游戏体验。显然,对于大部分购买 1 千元级显卡的玩家,能有以足够高的性价比获得足够的游戏体验,这对于大量游戏玩家来说,都是一个不错的新选择。视频创作者期待导出时间加速
GPU 游戏的体验在于适配的游戏以及画质的流畅和稳定,那用 GPU 作为生产力工具关键的就是效率。
在视频创作者圈子,DaVinci(达芬奇)和剪映都是非常流行的专业视频剪辑软件。针对这两个视频剪辑软件的性能优化,就足以让许多视频创作者充满期待。
锐炫 GPU 全系产品都配备了完整的高级 Xe 的媒体引擎,这个媒体引擎中包含了两套视频编解码器和视频后处理器,通过驱动的优化,可以减少硬件额外的开销并发挥硬件的潜能。
达芬奇的工作负载比较复杂的,有编码、解码,也会用局部的通用计算处理一些比较复杂的特效。
英特尔锐炫软件团队针对芬奇的负载优化了 OpenCL 的驱动,以去年发布的 3959 驱动和最新发布的 4369 驱动对比,运用 PugetBench 的达芬奇,在锐炫 A750 上面,总体性能提升达到 33%,其中一些 fusion 任务子项的提升有 40%,4K media 任务提升 27%。在锐炫 A770 上提升的幅度更大,总体提升能够达到 40%。
这些性能的提升主要得益于针对 OpenCL 驱动做了三个主要的优化:集中式缓存池,针对主存和显存拷贝的优化,资源延迟销毁。除了减少驱动开销,通过精细化的同步来提高 GPU 引擎的利用率。锐炫 GPU 也通过适配内容创作软件,可以充分发挥 GPU 的独特功能加速任务。
典型的一个场景,DaVinci 能够充分利用英特尔锐炫显卡的视频后处理器引擎,从而带来 近 2 倍性能提升,实现了双路 8K60FPS 视频素材的实时预览。
针对剪映优化的一个难点是有时候会出现解码引擎、编码引擎、3D 引擎等三五个引擎一起工作的情况,这些引擎一起工作就像流水线一样,要进行优化就需要处理好引擎之间的依赖关系。" 针对剪映的纯视频导出的场景,我们在驱动内部实现了更加精细化的 GPU 引擎之间的依赖管理,在解码和 3D 特效之间需要依赖的地方才加等待。这样可以避免很多引擎之间的空等现象,视频导出性能提升达到 10%,对应用户导出时间也可以减少 10%。" 英特尔 GPU 软件工程师表示。针对剪映特效导出的优化是重点也是难点,与其它视频剪辑软件不同,剪映最初是移动端的软件,后来才有 PC 端的剪映专业版,所以剪映使用的是流行的跨平台技术移动端 OpenGL ES。
但在 PC 端没有原生的 OpenGL ES 驱动," 针对这个特别的软件栈,我们和剪映密切合作,把锐炫显卡当中的内存压缩技术应用到软件栈当中,解决了显存带宽压力的问题,现了剪映特效着色器(Shader)性能近一倍的提升,满足了剪映 OpenGL ES on D3D11 软件栈与英特尔锐炫显卡的充分适配。" 英特尔 GPU 软件工程师介绍。除了专业视频剪辑软件,面对当下火热的生成式 AI,英特尔也在为创作者进行了许多工作。
基于英特尔 OpenVINO,AI 绘图开源模型 Stable Diffusion 可以使用开源图片编辑软件 GIMP 在英特尔锐炫 A750、A770 等显卡上流畅运行,简单的文本输入就能智能实现创意绘图。
对于英特尔来说,独立显卡的路还很长,需要持续和游戏引擎提供商、游戏工作室、内容创作开发者、AIC 厂商等紧密合作,才能打造出更具竞争力的 GPU 产品。现在,游戏玩家和内容创作者可以购买到英特尔公版显卡以及来自宏碁、华擎、蓝戟等合作伙伴提供的显卡。
显然,英特尔的独立显卡为大量玩家供了一个更具性价比的选择,多一个高性价比的选择对游戏玩家和内容创作者来说总是一件值得庆幸和期待的事情。雷峰网
标签: