• 旗標
  • Posts
  • 🌠給我一張圖,我給你一整個3D世界! World Labs 互動式 AI 場景問世🌠

🌠給我一張圖,我給你一整個3D世界! World Labs 互動式 AI 場景問世🌠

新書 x 4、Claude AI 自訂風格教學、博客來 2024 暢銷榜入榜 x 25

本周重點 TODAY’S MENU 

  • 📰科技News速遞:World Labs 互動式 AI 場景問世

  • 📚|新書:Raspberry Pi 樹莓派 / 條漫教科書 / 超圖解 Arduino 互動設計入門 / 寵物網美時代

  • 👨‍🏫|教學:Claude AI 設定自訂寫作風格

  • 🎈恭喜:博客來 2024 年度各類暢銷榜,旗標 25 本入榜!

📰
科技News速遞 

由「人工智慧教母」李飛飛共同創立並擔任執行長的創新公司 World Labs,近日在其官網上推出了一項嶄新的人工智慧技術。該技術讓使用者只需上傳一張靜態圖片,就能生成一個可720度互動的立體環景,使用者還能在場景裡跑來跑去!

電玩場景般的立體世界

只需鍵盤和滑鼠 就能在名畫場景裡遊走

獨特的 3D 場景生成技術

World Labs 的技術能將靜態圖片轉化為互動性強、可探索的 3D 場景。使用者只需上傳一張靜態圖像,系統就能生成以第一人稱視角呈現的 720 度立體環景。透過滑鼠、鍵盤或觸控板,使用者可以調整視角方向或在特定範圍內移動,進一步沉浸於場景之中。

與市場上已有的 AI 技術相比,World Labs 的獨特之處在於其生成的場景具備互動性和修改能力。生成的 3D 場景不僅呈現出真實的深度感,還能根據物理規律運作,例如符合物件間距和光影效果。此外,該技術支持即時互動修改,例如調整物體顏色、增強燈光效果等,為創作者提供了極大的靈活性。

技術與應用範圍

World Labs 的技術屬於「世界模型」範疇,致力於模擬真實世界的 3D 環境。許多現有模型常受限於解析度低、場景不穩定等問題。例如,其他公司開發的系統可能會因結構記憶不足而產生不一致的場景。而 World Labs 的技術則通過優化算法,確保生成的場景穩定一致,並能重現細膩的物理細節。

儘管目前技術仍處於早期測試階段,使用者的移動範圍尚有限制,且偶爾會出現物體融合不自然的情況,但這些問題並未削弱其潛力。World Labs 表示,他們將持續改進生成場景的精細度與規模,並開發更多創新互動方式,以滿足市場需求。

該技術的應用範圍極為廣泛,涵蓋電影製作、遊戲開發、自駕車虛擬場景建置等。它能顯著降低 3D 場景構建的時間與人力成本,讓創作者能專注於提升內容的品質。

技術展示與用戶反饋

目前,World Labs 已在官網上展示多個生成場景範例,用戶可以即時探索這些 3D 環境。這些場景帶有一定的卡通風格,但整體表現令人驚豔,尤其是在景深模擬效果(DoF)方面,能根據視角調整物體的清晰度與背景模糊度,進一步提升沉浸感。

儘管技術仍有改進空間,特別是場景的完全探索性和渲染細節,許多用戶已對其潛力表示肯定。World Labs 表示,這僅是「早期預覽版本」,未來將在用戶體驗和技術細節方面進一步提升。

商業價值與未來計畫

World Labs 自成立以來,已成功獲得 2.3 億美元的風險投資,背後支持者包括 Andreessen Horowitz (a16z)、Intel Capital、AMD Ventures 等知名投資機構,公司目前估值超過 10 億美元,並計畫於 2025 年推出首款商業產品。除了互動場景生成技術外,World Labs 還計畫開發專為藝術家、設計師、開發者、電影製作人和工程師設計的創作工具。

這個技術對我們的影響有哪些?

影像製作人 Eric Solorio 拍了一部測試影片,分享 World Labs 這項技術對設計流程可能會有以下影響:

  1. 快速生成3D環境,提升實驗空間

    傳統設計流程中需要花費大量時間來建立幾何結構和佈置場景,但透過 World Labs 的技術,只需輸入提示或參考圖像,即可在數秒內生成可導航的3D環境,大幅縮短準備時間。設計師可以快速生成多個3D環境,嘗試不同場景佈局,減少重複工作,並更具創造性地進行場景實驗。

  2. 一致性更高的背景設計

    動畫工作室能利用這項技術快速建立3D背景,拍攝各種角度的截圖,再透過影像生成工具進行風格化處理,解決傳統背景設計中因視角變化導致的一致性挑戰。

  3. 改進影片生成過程

    新技術支援更精確的攝影機控制,例如關鍵幀設定,讓生成的3D環境能融入影片生成工具(如 Runway),實現更細緻的鏡頭運動效果。

  4. 降低時間和成本,開啟更多創意可能性

    傳統需要數小時甚至數天的製作流程,現可在幾分鐘內完成,節省大量資源,特別適合大型或有時間壓力的專案和緊湊時程。

李飛飛是誰? World Labs 是什麼?

李飛飛是人工智慧領域中極具影響力的學者與先驅,被譽為「人工智慧教母」。主要研究領域涵蓋電腦視覺、認知神經科學、電腦神經科學以及大數據分析。她已發表超過 200 篇科學論文,並在許多世界頂級期刊和會議上展示其研究成果。

她最知名的貢獻包括 Caltech 101 和 ImageNet,尤其是 ImageNet 作為一個全球研究人員可免費使用的資料庫,對人工智慧物體識別領域產生了深遠影響,被視為計算機視覺領域的重要里程碑。

曾擔任史丹佛大學教授、Google 雲端 AI 首席科學家的李飛飛,致力於推動人工智慧的研究與應用。同時,她創立了非營利組織 AI4ALL,旨在促進 AI 領域的多元化教育,培養更多來自不同背景的人才。

近期,她創辦了創新公司 World Labs,專注於開發名為「空間智慧」(Spatial Intelligence)的人工智慧技術,能生成 720 度立體環景,提供沉浸式的 3D 體驗。該技術可廣泛應用於電影製作、遊戲開發和虛擬場景建置等領域,顯著提升創作效率。World Labs 已成功籌集超過 2.3 億美元資金,並計畫推出更多創新工具,為數位世界創作帶來新的可能性。

📚
NEW BOOKS  

Raspberry Pi 樹莓派:AI × OpenCV × LLM × AIoT 創客聖經

已上市

全面講解利用樹莓派 5 或 4 打造 IoT 與 AIoT 創客專案!從基礎安裝設定到硬體控制,結合 Python、ChatGPT API、LLM、大型語言模型,輕鬆掌握 Linux 系統與伺服器架設,無需額外設備即可從 Windows 遠端操作樹莓派。透過 Pi 相機模組或 Webcam 結合 OpenCV、TensorFlow Lite 等套件,實作人臉偵測、物體追蹤、自駕車等 AI 應用。還能活用 Node-RED 建立 AIoT 儀表板,打造串流視訊車、自動避障車等創意專案,新手和進階創客都適合。

條漫教科書:漫畫家必學!條漫分鏡.構圖.上色.作畫.完稿技法

12/13 上市

條漫創作的全方位指南,無論是初學者還是現役漫畫家,都能從中學到製作條漫的技巧與方法。書中詳細介紹如何適應條漫的全彩、直向瀏覽特點,並依循「分鏡→作畫→上色→完稿」的流程,分享 46 個實用的創作秘訣。此外,還附贈超值工具包,包括 6 篇專業條漫範例、原始檔案和免費素材,幫助讀者深入學習專業漫畫的製作過程,提升創作靈感與技術。

超圖解 Arduino 互動設計入門 第五版

12/16 上市

專為沒有基礎的初學者設計,以手繪圖解方式簡化學習難度,從電子電路、程式語法到硬體實作全面涵蓋。書中介紹最新的 Arduino UNO R4 與經典 R3 開發板,結合 Wi-Fi、藍牙等物聯網技術,並透過 70 多個動手實驗,如循跡車、RFID 門禁系統、光電子琴等,帶你輕鬆學會軟硬體整合,實現創意專案。

寵物網美時代:用 AI 打造爆款萌寵日常

12/18 上市

專為寵物爸媽設計的創作指南,教你用 AI 和免費工具,輕鬆捕捉毛孩的萌照與影片,還能創作獨一無二的藝術作品。作者以專業視覺技巧,分享拍攝、修圖、剪輯方法,並分享 IG 和 YouTube 的社群經營秘訣。透過生成式 AI 打造毛孩的專屬形象,從卡通角色到經典名畫任你選,將美好回憶化作感動的永恆紀念。無論是萌寵爸媽還是創作愛好者,都能用這本書開啟充滿溫暖與創意的數位旅程!

👨‍🏫
TUTORIAL

Claude 自訂風格寫作教學

Claude 推出自訂寫作風格功能(官方介紹請點我),允許用戶根據需求和工作流程調整 Claude 的回應方式,打造更個性化的溝通體驗。

目前提供以下風格選項:

  • 預設風格

  • 正式風格:清晰且有條理的回應

  • 精簡風格:簡潔直接的回應

  • 解釋風格:針對學習新概念的教育性回應

  • 自訂風格:如果都不滿意以上選項,也開放使用者自訂想要的回覆風格!

—以下為教學—

本篇將以「自訂風格」功能為例進行教學。情境設定為聖誕節即將來臨,你正為如何撰寫一封情書給熱愛浪漫氣氛的另一半而苦惱。不用擔心!Claude 將成為你的最佳代筆,讓靈感源源不絕,別說一封情書,寫 100 封也沒問題!

Voting Election Day GIF by Nickelodeon

Claude幫你寫信文思泉湧
Gif by nickelodeon on Giphy

首先在對話框下方點「Choose style」-「Create & Edit Styles」-「Create Custom Style」

接著會彈出一個視窗,要求提供資料供 Claude 模仿語氣。你可以選擇上傳電腦中的檔案,或是直接將文字貼到指定欄位中。範例選擇貼上一段風靡年輕族群的心靈雞湯節錄,然後點選 「Create Style」,讓 Claude 進行分析並生成對應的語氣風格。

Claude 會根據你貼上的文字自動分析並定義出文字特色,這些特色會顯示在左方。右方則提供多種主題測試選項,例如撰寫短文、撰寫客戶信件等,讓你查看 Claude 的生成效果。如果對結果不滿意,也可以點選「Edit with Claude」進行微調以達到預期效果。

確認風格無誤後,最後只需點選「Use Style」,即可套用該風格進行後續創作。

到了最後階段,小編只需在對話框輸入提示詞(例如寫信的主題或特定要求),Claude 就生成了一篇既動人又浪漫的情書,輕鬆解決你的寫作煩惱~推薦大家也一起嘗試看看 Claude 的自定寫作風格喔!

🎈
EVENTS

  • 🎉|博客來 2024 年度各類百大暢銷榜 旗標入榜 25 本|🎉

    今年旗標的書在博客來 2024 暢銷榜大豐收!光是電腦榜就入榜 19 本,藝術設計榜和投資理財榜也有驚喜,總共 25 本入榜~感謝大家的支持,我們會繼續努力 💪

    截自博客來官網
    電腦資訊類排名第一名