人工智能 (AI) 行业正在迅速变化和发展。我们见证了一些令人惊叹的进步和创新产品,它们突破了我们想象的界限。

本周,我们推出了一些令人印象深刻的尖端产品,这些产品将彻底改变各个行业并提高个人生产力。

OpenAI 正式启动 ChatGPT 网页搜索 功能,可以快速实时地检索带有相关网页链接的搜索结果。您不再需要使用其他网页扩展或应用程序来实现此功能。

所有搜索答案都包含来源引文。ChatGPT 还将通过将上下文纳入搜索查询来提供更深入的答案。

此外,通过下载 Chrome 浏览器扩展程序,可以将 ChatGPT 设置为默认搜索引擎。这样,您就可以快速直接地使用它!

如何使用 ChatGPT 网页搜索 如果您不是 ChatGPT Plus 订阅者,则可以使用此功能

OpenAI 宣布 ChatGPT Search 仅对 ChatGPT Plus 和 Team 用户开放,可立即使用。付费用户无需等待一段时间。

不过,OpenAI 计划在未来几个月内向免费用户推出访问权限

等待推出:如果您不是付费用户,您必须等待 OpenAI 将该功能扩展到免费用户,预计将在未来几个月内推出。

加入候补名单:如果可用,请考虑加入 OpenAI 可能提供的任何候补名单,以便提前使用 ChatGPT Search 等功能。

定期检查:请关注 OpenAI 的公告,了解搜索功能何时向免费用户开放的更新。

ChatGPT 如何确保其网络搜索结果的准确性?

ChatGPT 通过多种方法确保其搜索结果的准确性:

实时数据检索:它通过搜索引擎获取最新信息,从信誉良好的来源收集内容并引用它们。

选择标准:ChatGPT 优先考虑相关、权威和最近的来源来匹配用户查询。
搜索优化:如果缺乏初步结果,它会优化查询以提高相关性。
用户反馈:它会根据用户修正进行调整,以随着时间的推移改善响应。

HeyGen 推出创建数字人类的新功能

HeyGen 推出了一项新功能,用户无需拍摄,仅使用照片即可创建数字人。

你可以上传自己的照片或者输入文字提示来生成虚拟角色形象,用于训练自己的AI视频数字化身。

上传的角色参考图越多,生成的图像中面部特征的一致性就越高。

这些数字人具有自然的身体动作、可定制的服装、姿势和可互换的背景,并且您可以选择性别、年龄和种族。

您可以编辑脚本,选择不同的声音和情感表达,并在短时间内快速生成视频。

Suno 推出 Personas

桑诺 推出了一项名为 Personas 的新功能。

它允许用户保存歌曲的核心特征,例如人声、风格和氛围,然后可以在新的创作中重复使用。

此功能旨在帮助您保持独特的音乐风格。

如何创建角色:选择一首喜欢的歌曲,点击“创建”,即可创建角色。添加歌词和风格:用户可以像平常创作一样添加歌词和风格。

公开和私人设置:您可以选择将角色设置为公开或私人。公开角色将拥有自己的页面,可供其他用户使用,并会出现在您的图书馆和个人资料中。

GitHub 在 GitHub Copilot 中引入了更多 AI 模型

GitHub 宣布将在 GitHub Copilot 中引入更多 AI 模型,以增强开发人员的选项和定制能力。

新型号包括:

克劳德 3.5 十四行诗
双子座 1.5 专业版
o1-preview 和 o1-mini

GitHub 还推出了 GitHub Spark,一种完全用自然语言构建应用程序的工具。

您不需要了解配置服务器或数据库等复杂的部署技术。

GitHub Spark 将在后台自动完成所有云设置和资源分配,即使是初学者也可以完全通过自然语言来创建 Web 应用程序。

换句话说,你只需要告诉它“你想做什么”,它就会为你提供一个功能齐全的应用程序,让整个过程变得像对话一样简单。

Stability AI 发布了 Stable Diffusion 3.5 Medium 模型。

它可供商业和非商业用户免费使用。它拥有 25 亿个参数模型,专为消费级硬件设计。

该模型仅需要 9.9 GB 的 VRAM。它可以在大多数配备消费级硬件的标准显卡上运行。

它可以以多种分辨率生成高质量图像,产生优于其他中型模型的结果。

根据 Stability AI 的分析,Stable Diffusion 3.5 Large 在及时遵守方面领先市场,并在图像质量方面可与更大的型号相媲美。

如何使用 Stable Diffusion 3.5?

本地使用的安装步骤


现在,您可以从以下网址下载 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Large Turbo 模型 拥抱脸 推理代码如下 GitHub.然后你就可以在自己的计算机或其他硬件上运行它了。

在计算机上运行它之前,您应该设置先决条件并安装必要的库。

当您安装所需的 Python 库时,您可以在本地运行 Stable Diffusion。

在线访问

使用 ComfyUI

ComfyUI 提供了一个用户友好的界面,可使用 Stable Diffusion 3.5 管理您的工作流程。您可以将不同的文件拖入界面并轻松运行图像生成任务。

使用 Hugging Face Spaces

访问 Hugging Face Spaces 即可直接在浏览器中运行稳定扩散模型,无需安装。

对于更多用户来说,许多应用程序和网站将很快集成最新的 Stable Diffusion 3.5 模型用于图像生成,敬请关注更新!

Ultralight-Digital-Human:可在手机上运行的超轻量级数字人模型

超轻数字人:支持移动设备实时操作的超轻量级数字人模型。

该模型的算法经过优化,即使在低功耗设备上也能顺利运行。
只需要3到5分钟的视频就可以完成训练。

确保视频的每一帧都能露出人物的整个脸部,并且声音清晰无噪音。将其放入新文件夹中。

此外,通过优化的数据流和推理过程,该模型可以实时处理输入数据(如视频和音频),实现即时的数字人响应。

AI视频平台D-ID 推出新的数字人工具


AI视频平台D-ID推出两款新品 数字人工具—Express 和 Premium+,专为内容创作而设计,旨在使企业能够在营销、销售和客户支持等领域应用更逼真的虚拟人类。

Express虚拟人仅需要一分钟的视频训练即可生成,并能与用户的头部动作同步。

Premium+虚拟人需要更长的训练视频,但可以进行手部和躯干动作,从而创造更逼真的人际互动。

这些工具使得生成虚拟人视频变得更加容易,降低了企业在营销方面的成本,并提供了更广泛的适用性。

Google Gemini API 引入了“搜索锚定”

Google 在其 Gemini API 和 Google AI Studio 中推出了新功能“Google Search Anchoring”,使用起来非常方便。

该功能利用来自 Google 搜索的实时数据为用户提供更准确、最新的信息,以及支持链接和搜索建议,使 AI 响应更加可靠。

利用通过搜索获得的最新新闻数据可以减少错误信息。
实时搜索可获取最新信息,从而在某些搜索结果中提供更好的答案。

答案中包含信息来源的链接,方便用户验证信息的可信度。

Claude 桌面版

人类学 已经构建了 Claude 桌面应用程序!现在您可以在 Mac 和 Windows 上使用。

作为你的 人工智能助手,Claude可以帮助您更快、更有创意地进行更深入的工作。

您现在可以在任何设备上使用 Claude,与 Claude 交谈,并让 Claude 帮助您找到问题的答案并分析图像的内容。

克劳德已经学会理解 PDF 中的图表和图形!


Anthropic 正在推出在 Anthropic API 中发送 Claude PDF 的功能。
借助其新的 PDF 支持测试版,您可以直接在 API 请求中包含 PDF。阅读研究论文现在变得更加容易。

新的 Claude 3.5 Sonnet 模型现在支持 PDF 输入并能理解文档中的文本和视觉内容。

您可以在功能预览中体验此功能。

您可以询问有关 PDF 内容的任何具体问题,Claude 可以根据其图像读取功能回答您的问题。

PDF 支持如何工作?

  • 系统会将 PDF 的每一页转换为图像。
  • 系统通过分析文本和图像可以更好地理解 PDF。
  • 可同时使用其他 Claude 功能。

如何在 Claude 中启用 Visual PDF 功能

要在 Claude 中启用 Visual PDF 功能,请按照以下步骤操作:

  1. 访问设置:
    打开 Claude 界面并查找烧瓶图标或设置菜单。
  2. 启用可视化 PDF:
    单击烧瓶图标,导航到 Visual PDF 选项并将其打开。这将允许 Claude 处理和解释 PDF 文档中的图像和视觉元素。
  3. 上传您的 PDF:
    一旦启用该功能,您可以通过将 PDF 文档拖入聊天窗口或使用上传按钮来上传它,非常简单方便。
  4. 与克劳德互动:
    上传 PDF 文件后,您可以向 Claude 询问有关 PDF 中包含的文本和图像的任何问题,从而增强您与复杂文档的交互。这将帮助您更方便地阅读文档并提高您的效率!

类似职位