2022 年年初,ChatGPT 3.5 的公布讓大眾直觀見識到了「AI」的進化幅度,而不久之後的 Stable Diffusion 又讓沒接受過任何藝術訓練的「小白」也能嘗試繪畫的樂趣。但兩年過去,似乎過了那段「新鮮勁兒」之後,AI 在我們日常生活中的「滲透」程度似乎並沒有想像中那麼高。
實際上確實如此嗎?
全球 AI 行業領軍人之一的 NVIDIA,近日在其深圳辦公室展開了一次「RTX AI 品鑒會」,現場邀請了吐司/Tensor.Art、火星時代教育、海辛、言蕭等合作夥伴和 AI 藝術傢夥伴的嘉賓們,就現階段的幾個 AI 案例進行了分享,還向大家展示了很多 AI 深入生活的實例。
自 2018 年英偉達的顯卡從「GTX」開頭轉變為「RTX」以來,AI 加速器「Tensor Core」在 GPU 中所占據的「分量」就越來越重,使得消費級顯卡也逐漸擁有了曾經雲端才能實現的功能。
以 GeForce RTX 40 系顯卡為例,40 系桌面端與筆記本電腦 GPU 可提供的算力,涵蓋了從 200 AI TOPS(萬億次運算每秒)到 1300 AI TOPS 之間;而作為對比,沒有獨立 GPU 的輕量級 AI PC 僅能提供 10 到 45 TOPS。
在線生圖 AI 模型社區「吐司/Tensor.Art」發布了一系列完整評測,測試了 GeForce RTX 40 系多款GPU基於 Stable Diffusion 的 AI 生圖能力,並總結了一篇《個人用戶玩轉Stable Diffusion 的 GPU 配置推薦》,方便入門用戶選擇合適的配置。
在《個人用戶玩轉Stable Diffusion 的 GPU 配置推薦》中,吐司/Tensor.Art 聚焦 SD 1.5 和 SDXL 1.0,使用第三方測試軟體 UL Procyon AI 基準測試完整測試 RTX 40 系列多款型號的顯卡、筆記本電腦 GPU 在 Stable Diffusion 的推理性能表現。
其中在 UL Benchmark SD1.5 TRT vs. OpenVINO 的對比測試中,RTX 4090 筆記本電腦 GPU 相對於 iGPU(Arc Graphics)有超過 27 倍的性能提升。
AI 學習機構「火星時代教育」則製作了一套詳細教程《NVIDIA TensorRT Stable Diffusion 創作加速指南》,詳細介紹了 SD 的安裝、設置、加速引擎構建、實際應用場景,旨在幫助創作者快速實現創意落地,提升創作效率。
遊戲領域,本次英偉達主要展示了還在開發中的「NVIDIA ACE」技術 DEMO。
《Covert Protocol》是一部應用了此技術的 DEMO,由 Inworld AI 公司開發。玩家要扮演一位私家偵探,試圖在酒店中獲取目標人物的必要信息。與一般的冒險推理遊戲相比,玩家在這個 DEMO 中可以直接與 3 位 NPC 對話,並獲得實時反饋,突破了傳統遊戲中的「互動」界限。
為了實現這一功能,《Covert Protocol》集成了 NVIDIA Riva 與 NVIDIA Audio2Face 技術,前者是精確的語音轉換文字插件,後者可以基於語音自動適配口型,再結合類似 ChatGPT 的 AI 雲端實時對話系統,使得我們能在遊戲中「即時」與任意 NPC 進行真正意義上的互動。
英偉達表示,目前已有騰訊、米哈游、網易等諸多國內遊戲公司正在基於此技術開發遊戲,而國際上首個應用這一功能並上架 STEAM 的作品或許將是前暴雪員工組建的「冰霜巨人」工作室所開發的 RTS 遊戲《風暴之門》。
NVIDIA RTX Remix 是一個正在內測中的 AI 工具,能夠幫助 Mod 開發者快速截取遊戲素材,利用 AI 自動增強老遊戲的材質、貼圖,並藉助全景光追和 DLSS 快速「重製」經典遊戲。目前已經可供玩家體驗的內容如《傳送門》,已擁有遊戲的玩家可以通過免費升級來體驗這款十幾年前的作品在「RTX Remix」優化後的效果。
現場還展示了《心靈殺手2》和《傳送門》RTX 版經過光追與 DLSS 3.5 加持之後的畫面對比,這些遊戲想必各位玩家都很熟悉,就不多介紹了。
一個能讓國內玩家興奮的消息是,將於今年 8 月上市的《黑神話悟空》會在上市當日就支持 DLSS 3.5 光線重建以及全景光線追蹤技術,實現畫質與性能的同步提升。
最後是已經在測試中的 PC 端應用程式NVIDIA app 。簡單的說,它是一款用於替代現有「GeForce Experience」的新軟體,提供各式顯卡設置與遊戲優化 —— 最有意義的改動是更新驅動再也不用注冊/登錄英偉達帳號了。
接下來有一些我們能在生活中應用到的案例。
基於人像生成控制的 Stable Diffusion 模塊化插件 InstantID,我們可以將任何一張具備面部特徵的照片直接生成影棚級肖像照、證件照 。現場還拉了一位媒體朋友作演示 —— 在搭載了 RTX 4090D 桌面端 GPU 的台式機上,生成這樣一張肖像照僅需幾秒。
還有非常神奇的聲音克隆技術。通過採集一段 5 秒鍾的錄音,GPT-SoVITS 項目可以以此為基礎實現高質量聲音克隆;如果能提供更長時間的樣本(1 分鍾左右),甚至能生成基本 1:1 的高質量語音,極大節省了「人工配音」所需時間,亦或通過採集親人信息,來實現更多人文關懷角度的應用。
建築設計領域,一款名叫「即致 AI」的工具基於擴散模型和蒸餾技術,在 RTX GPU 的加速下,能在幾秒內完成從手繪草圖到實時渲染的全過程,極大提高設計師的工作效率。雖然現階段應用還僅限於家裝、公裝與建築外觀設計,但相信推廣到工業設計、服裝設計等領域僅僅是時間問題。
最後是類似「ChatGPT」的本地應用演示DEMO,ChatRTX。
ChatRTX 使用檢索增強生成、NVIDIA TensorRT-LLM 軟體和 NVIDIA RTX 加速,將本地生成式 AI 功能引入到支持 RTX 的 Windows 系統中。用戶可快速、輕松地將本地文件作為數據集連接到開放式大語言模型(如:來自智譜 AI 的 ChatGLM3-6B),快速查詢與上下文相關的答案。
由於數據與運行都在本地,有著其他對話類應用難以比擬的速度優勢。ChatRTX 還支持圖像識別,能迅速實現圖片庫中進行檢索的能力。比如在圖像識別模型中輸入「沐浴在陽光下的房間」,它就會篩選出符合需求的圖片;輸入特定文字,還能找到包含相關文本的圖片 —— 想必在財務、報帳相關領域能得到廣泛應用。
以上這些案例和應用絕大多數已經對外發布,有興趣的用戶隨時可以嘗試;而騰訊、米哈游、育碧等開發商也在著手將 NVIDIA ACE 應用於遊戲領域,想必很快就會有「成品」面世。
來源:篝火