人工智慧(AI)產業正在迅速變化和發展。我們見證了一些令人驚嘆的進步和創新產品,它們突破了我們認為可能的界限。

本週,我們推出了一些令人印象深刻的尖端產品,這些產品將徹底改變各個行業並提高個人生產力。

OpenAI 正式啟動 ChatGPT 網頁搜索 功能,可以快速即時地檢索帶有相關網頁連結的搜尋結果。您不再需要使用其他網路擴充功能或應用程式來實現此功能。

所有搜尋答案還包括來源引用。 ChatGPT 也將透過將上下文納入搜尋查詢來提供更深入的答案。

此外,透過下載 Chrome 瀏覽器擴充功能,可以將 ChatGPT 設定為預設搜尋引擎。這樣您就可以快速直接地使用它!

如何使用 ChatGPT 網頁搜索 如果您不是 ChatGPT Plus 訂閱者,則可以使用此功能

OpenAI 宣布,ChatGPT Search 僅供 ChatGPT Plus 和 Team 用戶使用,可以立即使用。無需付費用戶等待一段時間。

不過,OpenAI 計劃在未來幾個月內向免費用戶推出存取權限

等待推出:如果您不是付費用戶,您必須等待 OpenAI 將該功能擴展到免費用戶,預計將在未來幾個月內推出。

加入候補名單:如果可用,請考慮加入 OpenAI 可能提供的任何候補名單,以便提前使用 ChatGPT Search 等功能。

定期檢查:請關注 OpenAI 的公告,以了解搜尋功能何時向免費用戶開放的更新。

ChatGPT 如何確保其網路搜尋結果的準確性?

ChatGPT 透過多種方法確保其搜尋結果的準確性:

即時資料檢索:它透過搜尋引擎獲取最新信息,從信譽良好的來源收集內容並引用它們。

選擇標準:ChatGPT 優先考慮相關、權威和最近的來源來匹配使用者查詢。
搜尋優化:如果缺乏初步結果,它會優化查詢以提高相關性。
使用者回饋:它會根據用戶修正進行調整,以隨著時間的推移改善回應。

HeyGen 推出創建數位人類的新功能

HeyGen 推出了一項新功能,用戶無需拍攝,僅使用照片即可創建數位人。

你可以上傳自己的照片或是輸入文字提示來產生虛擬角色形象,用於訓練自己的AI影片數位化身。

上傳的角色參考圖越多,產生的影像中臉部特徵的一致性就越高。

這些數字人具有自然的身體動作、可自訂的服裝、姿勢和可互換的背景,並且您可以選擇性別、年齡和種族。

您可以編輯腳本,選擇不同的聲音和情感表達,並在短時間內快速生成影片。

Suno 推出 Personas

桑諾 推出了一項名為 Personas 的新功能。

它允許使用者保存歌曲的核心特徵,例如人聲、風格和氛圍,然後可以在新的創作中重複使用。

此功能旨在幫助您保持獨特的音樂風格。

如何創建角色:選擇一首你喜歡的歌曲,點擊“創建”,然後製作一個角色。添加歌詞和風格:用戶可以像常規創作一樣添加歌詞和風格。

公開和私人設定:您可以選擇將角色設定為公開或私人。公共角色將擁有自己的頁面,可供其他使用者使用,並將出現在您的圖書館和個人資料中。

GitHub 在 GitHub Copilot 中引入了更多 AI 模型

GitHub 宣布將在 GitHub Copilot 中引入更多 AI 模型,以增強開發人員的選項和自訂能力。

新型號包括:

克勞德 3.5 詩篇
雙子座 1.5 專業版
o1-preview 和 o1-mini

GitHub 也推出了 GitHub Spark,這是一個完全用自然語言建立應用程式的工具。

您不需要了解配置伺服器或資料庫等複雜的部署技術。

GitHub Spark 將在後台自動完成所有雲端設定和資源分配,即使是初學者也可以完全透過自然語言來建立 Web 應用程式。

換句話說,你只需要告訴它“你想做什麼”,它就會為你提供一個功能齊全的應用程序,讓整個過程變得像對話一樣簡單。

Stability AI 發布了 Stable Diffusion 3.5 Medium 模型。

它可供商業和非商業用戶免費使用。它擁有 25 億個參數模型,專為消費級硬體設計。

該模型僅需要 9.9 GB 的 VRAM。它可以在大多數具有消費硬體的標準顯示卡上運行。

它可以以多種解析度產生高品質影像,產生優於其他中型模型的結果。

根據 Stability AI 的分析,Stable Diffusion 3.5 Large 在及時遵守方面領先市場,並在影像品質方面可與更大的型號相媲美。

如何使用 Stable Diffusion 3.5?

本地使用的安裝步驟


現在,您可以從以下網址下載 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Large Turbo 模型 擁抱臉 推理程式碼如下 GitHub。然後您就可以在您的電腦或其他硬體上運行它。

然後才可以在計算機上運行它。您應該設定先決條件並安裝必要的程式庫。

當您安裝所需的 Python 程式庫時,您可以在本機上執行 Stable Diffusion。

在線訪問

使用 ComfyUI

ComfyUI 提供了一個使用者友善的介面,可使用 Stable Diffusion 3.5 管理您的工作流程。您可以將不同的檔案拖入介面並輕鬆運行圖像生成任務。

使用 Hugging Face Spaces

造訪 Hugging Face Spaces 即可直接在瀏覽器中執行穩定擴散模型,無需安裝。

對於更多用戶來說,許多應用程式和網站將很快整合最新的 Stable Diffusion 3.5 模型用於圖像生成,敬請關注更新!

Ultralight-Digital-Human:可在手機上運行的超輕量級數位人模型

超輕數字人:支援行動裝置即時操作的超輕量級數位人模型。

該模型的演算法經過優化,即使在低功耗設備上也能順利運作。
只需要3到5分鐘的影片就可以完成訓練。

確保影片的每個畫面都露出人物的整個臉部,並且聲音清晰無噪音。將其放入新資料夾中。

此外,透過優化的資料流和推理過程,該模型可以即時處理輸入資料(如視訊和音訊),實現即時的數位人回應。

AI視訊平台D-ID 推出新的數位人工具


AI視訊平台D-ID推出兩款新品 數位人工具—Express 和 Premium+,專為內容創作而設計,旨在使企業能夠在行銷、銷售和客戶支援等領域應用更逼真的虛擬人類。

Express虛擬人只需一分鐘的影片訓練即可生成,並能與使用者的頭部動作同步。

Premium+虛擬人需要更長的訓練視頻,但可以進行手部和軀幹動作,從而創造更逼真的人際互動。

這些工具使得產生虛擬人影片變得更加容易,降低了企業在行銷方面的成本,並提供了更廣泛的適用性。

Google Gemini API 引入了“搜尋錨定”

谷歌在其 Gemini API 和 Google AI Studio 中推出了新功能「Google Search Anchoring」。使用非常方便。

該功能利用來自 Google 搜尋的即時數據為用戶提供更準確、最新的信息,以及支援連結和搜尋建議,使 AI 響應更加可靠。

利用透過搜尋獲得的最新新聞數據可以減少錯誤訊息。
即時搜尋可獲取最新信息,從而在某些搜尋結果中提供更好的答案。

答案中包含資訊來源的鏈接,方便用戶驗證資訊的可信度。

Claude 桌面版

人類學 已經建立了 Claude 桌面應用程式!現在您可以在 Mac 和 Windows 上使用。

作為你的 人工智慧助手,Claude可以幫助您更快、更有創意地進行更深入的工作。

現在您可以在任何裝置上使用 Claude,與 Claude 交談,並讓 Claude 幫助您找到問題的答案並分析影像的內容。

克勞德已經學會理解 PDF 中的圖表和圖形!


Anthropic 正在推出 Anthropic API 中傳送 Claude PDF 的功能。
透過他們新的 PDF 支援測試版,您可以直接在 API 請求中包含 PDF。閱讀研究論文現在變得更加容易。

新的 Claude 3.5 Sonnet 模型現在支援 PDF 輸入並能理解文件中的文字和視覺內容。

您可以在功能預覽中體驗此功能。

您可以詢問有關 PDF 內容的任何特定問題,Claude 可以根據其圖像讀取功能回答您的問題。

PDF 支援如何運作?

  • 系統會將 PDF 的每一頁轉換為影像。
  • 系統透過分析文字和圖像可以更好地理解 PDF。
  • 可同時使用其他 Claude 功能。

如何在 Claude 中啟用 Visual PDF 功能

若要在 Claude 中啟用 Visual PDF 功能,請依照下列步驟操作:

  1. 訪問設定:
    打開 Claude 介面並尋找燒瓶圖示或設定選單。
  2. 啟用視覺化 PDF:
    點擊燒瓶圖標,導航到 Visual PDF 選項並將其開啟。這將允許 Claude 處理和解釋 PDF 文件中的圖像和視覺元素。
  3. 上傳您的 PDF:
    一旦啟用該功能,您可以透過將 PDF 文件拖入聊天視窗或使用上傳按鈕來上傳它。它非常簡單和方便。
  4. 與克勞德互動:
    上傳 PDF 文件後,您可以向 Claude 詢問有關 PDF 中包含的文字和圖像的任何問題,從而增強您與複雜文件的互動。這將幫助您更方便地閱讀文件並提高您的效率!

類似職位