首頁 遊戲資訊 NVIDIA 媒體品鑒會回...

NVIDIA 媒體品鑒會回顧:AI 即將深入生活的方方面面

2022 年年初,ChatGPT 3.5 的公布讓大眾直觀見識到了「AI」的進化幅度,而不久之後的 Stable Diffusion 又讓沒接受過任何藝術訓練的「小白」也能嘗試繪畫的樂趣。但兩年過去,似乎過了那段「新鮮勁兒」之後,AI 在我們日常生活中的「滲透」程度似乎並沒有想像中那麼高。

實際上確實如此嗎?

全球 AI 行業領軍人之一的 NVIDIA,近日在其深圳辦公室展開了一次「RTX AI 品鑒會」,現場邀請了吐司/Tensor.Art、火星時代教育、海辛、言蕭等合作夥伴和 AI 藝術傢夥伴的嘉賓們,就現階段的幾個 AI 案例進行了分享,還向大家展示了很多 AI 深入生活的實例。

NVIDIA 媒體品鑒會回顧:AI 即將深入生活的方方面面

自 2018 年英偉達的顯卡從「GTX」開頭轉變為「RTX」以來,AI 加速器「Tensor Core」在 GPU 中所占據的「分量」就越來越重,使得消費級顯卡也逐漸擁有了曾經雲端才能實現的功能。

以 GeForce RTX 40 系顯卡為例,40 系桌面端與筆記本電腦 GPU 可提供的算力,涵蓋了從 200 AI TOPS(萬億次運算每秒)到 1300 AI TOPS 之間;而作為對比,沒有獨立 GPU 的輕量級 AI PC 僅能提供 10 到 45 TOPS。

在線生圖 AI 模型社區「吐司/Tensor.Art」發布了一系列完整評測,測試了 GeForce RTX 40 系多款GPU基於 Stable Diffusion 的 AI 生圖能力,並總結了一篇《個人用戶玩轉Stable Diffusion 的 GPU 配置推薦》,方便入門用戶選擇合適的配置。

在《個人用戶玩轉Stable Diffusion 的 GPU 配置推薦》中,吐司/Tensor.Art 聚焦 SD 1.5 和 SDXL 1.0,使用第三方測試軟體 UL Procyon AI 基準測試完整測試 RTX 40 系列多款型號的顯卡、筆記本電腦 GPU 在 Stable Diffusion 的推理性能表現。

NVIDIA 媒體品鑒會回顧:AI 即將深入生活的方方面面

其中在 UL Benchmark SD1.5 TRT vs. OpenVINO 的對比測試中,RTX 4090 筆記本電腦 GPU 相對於 iGPU(Arc Graphics)有超過 27 倍的性能提升。

NVIDIA 媒體品鑒會回顧:AI 即將深入生活的方方面面

AI 學習機構「火星時代教育」則製作了一套詳細教程《NVIDIA TensorRT Stable Diffusion 創作加速指南》,詳細介紹了 SD 的安裝、設置、加速引擎構建、實際應用場景,旨在幫助創作者快速實現創意落地,提升創作效率。

NVIDIA 媒體品鑒會回顧:AI 即將深入生活的方方面面

遊戲領域,本次英偉達主要展示了還在開發中的「NVIDIA ACE」技術 DEMO。

《Covert Protocol》是一部應用了此技術的 DEMO,由 Inworld AI 公司開發。玩家要扮演一位私家偵探,試圖在酒店中獲取目標人物的必要信息。與一般的冒險推理遊戲相比,玩家在這個 DEMO 中可以直接與 3 位 NPC 對話,並獲得實時反饋,突破了傳統遊戲中的「互動」界限。

為了實現這一功能,《Covert Protocol》集成了 NVIDIA Riva 與 NVIDIA Audio2Face 技術,前者是精確的語音轉換文字插件,後者可以基於語音自動適配口型,再結合類似 ChatGPT 的 AI 雲端實時對話系統,使得我們能在遊戲中「即時」與任意 NPC 進行真正意義上的互動。

NVIDIA 媒體品鑒會回顧:AI 即將深入生活的方方面面

英偉達表示,目前已有騰訊、米哈游、網易等諸多國內遊戲公司正在基於此技術開發遊戲,而國際上首個應用這一功能並上架 STEAM 的作品或許將是前暴雪員工組建的「冰霜巨人」工作室所開發的 RTS 遊戲《風暴之門》。

NVIDIA RTX Remix 是一個正在內測中的 AI 工具,能夠幫助 Mod 開發者快速截取遊戲素材,利用 AI 自動增強老遊戲的材質、貼圖,並藉助全景光追和 DLSS 快速「重製」經典遊戲。目前已經可供玩家體驗的內容如《傳送門》,已擁有遊戲的玩家可以通過免費升級來體驗這款十幾年前的作品在「RTX Remix」優化後的效果。

現場還展示了《心靈殺手2》和《傳送門》RTX 版經過光追與 DLSS 3.5 加持之後的畫面對比,這些遊戲想必各位玩家都很熟悉,就不多介紹了。

NVIDIA 媒體品鑒會回顧:AI 即將深入生活的方方面面

一個能讓國內玩家興奮的消息是,將於今年 8 月上市的《黑神話悟空》會在上市當日就支持 DLSS 3.5 光線重建以及全景光線追蹤技術,實現畫質與性能的同步提升。

最後是已經在測試中的 PC 端應用程式NVIDIA app 。簡單的說,它是一款用於替代現有「GeForce Experience」的新軟體,提供各式顯卡設置與遊戲優化 —— 最有意義的改動是更新驅動再也不用注冊/登錄英偉達帳號了。

接下來有一些我們能在生活中應用到的案例。

基於人像生成控制的 Stable Diffusion 模塊化插件 InstantID,我們可以將任何一張具備面部特徵的照片直接生成影棚級肖像照、證件照 。現場還拉了一位媒體朋友作演示 —— 在搭載了 RTX 4090D 桌面端 GPU 的台式機上,生成這樣一張肖像照僅需幾秒。

NVIDIA 媒體品鑒會回顧:AI 即將深入生活的方方面面

還有非常神奇的聲音克隆技術。通過採集一段 5 秒鍾的錄音,GPT-SoVITS 項目可以以此為基礎實現高質量聲音克隆;如果能提供更長時間的樣本(1 分鍾左右),甚至能生成基本 1:1 的高質量語音,極大節省了「人工配音」所需時間,亦或通過採集親人信息,來實現更多人文關懷角度的應用。

建築設計領域,一款名叫「即致 AI」的工具基於擴散模型和蒸餾技術,在 RTX GPU 的加速下,能在幾秒內完成從手繪草圖到實時渲染的全過程,極大提高設計師的工作效率。雖然現階段應用還僅限於家裝、公裝與建築外觀設計,但相信推廣到工業設計、服裝設計等領域僅僅是時間問題。

NVIDIA 媒體品鑒會回顧:AI 即將深入生活的方方面面

最後是類似「ChatGPT」的本地應用演示DEMO,ChatRTX。

ChatRTX 使用檢索增強生成、NVIDIA TensorRT-LLM 軟體和 NVIDIA RTX 加速,將本地生成式 AI 功能引入到支持 RTX 的 Windows 系統中。用戶可快速、輕松地將本地文件作為數據集連接到開放式大語言模型(如:來自智譜 AI 的 ChatGLM3-6B),快速查詢與上下文相關的答案。

由於數據與運行都在本地,有著其他對話類應用難以比擬的速度優勢。ChatRTX 還支持圖像識別,能迅速實現圖片庫中進行檢索的能力。比如在圖像識別模型中輸入「沐浴在陽光下的房間」,它就會篩選出符合需求的圖片;輸入特定文字,還能找到包含相關文本的圖片 —— 想必在財務、報帳相關領域能得到廣泛應用。

NVIDIA 媒體品鑒會回顧:AI 即將深入生活的方方面面

以上這些案例和應用絕大多數已經對外發布,有興趣的用戶隨時可以嘗試;而騰訊、米哈游、育碧等開發商也在著手將 NVIDIA ACE 應用於遊戲領域,想必很快就會有「成品」面世。

來源:篝火