OpenAI为Responses API新增了包括远程MCP服务器支持、图像生成和代码解释器工具等功能
支持 Remote MCP Sever
https://openai.com/index/new-tools-and-features-in-the-responses-api/
New tools and features in the Responses API
We’re adding support for remote MCP servers(opens in a new window) in the Responses API, building on the release of MCP support in the Agents SDK(opens in a new window). MCP is an open protocol that standardizes how applications provide context to LLMs. By supporting MCP servers in the Responses API, developers will be able to connect our models to tools hosted on any MCP server with just a few lines of code.Popular remote MCP servers include Cloudflare(opens in a new window), HubSpot(opens in a new window), Intercom(opens in a new window), PayPal(opens in a new window), Plaid(opens in a new window), Shopify(opens in a new window), Stripe(opens in a new window), Square(opens in a new window), Twilio(opens in a new window), Zapier(opens in a new window), and more. We expect the ecosystem of remote MCP servers to grow quickly in the coming months, making it easier for developers to build powerful agents that can connect to the tools and data sources their users already rely on. In order to best support the ecosystem and contribute to this developing standard, OpenAI has also joined the steering committee for MCP.
我们正在添加对远程 MCP 服务器的支持, 在响应 API 中,基于代理 SDK 的 mcp 支持的发布。 MCP 是一个开放协议,标准化应用程序如何为 LLM 提供上下文。通过支持响应 API 中的 MCP 服务器,开发人员能用几行代码将我们的模型连接到任何 MCP 服务器上托管的工具。
案例
- 使用 Shopify
1 | response = client.responses.create( |
- 使用 DeepWiki
1 | response = client.responses.create( |
- 使用 Stripe
1 | response = client.responses.create( |
多模态
推理接口(使用内置工具),支持图像生成,代码解释,文件搜索.
With built-in tools in the Responses API, developers can easily create more capable agents with just a single API call. By calling multiple tools while reasoning, models now achieve significantly higher tool calling performance on industry-standard benchmarks like Humanity’s Last Exam (source). Today, we’re adding new tools including:
使用响应 API 中的内置工具,开发人员只需单个 API 调用即可轻松创建功能更强大的代理。通过在推理时调用多个工具,模型现在可以在行业标准的基准上获得更高的工具,例如人类的最后考试( source )。
后台模式/Background mode
针对部分耗时任务的优化,现在可以使用Background mode在 O3 等模型上构建类似的体验,而不必担心超时或其他连接问题 - Background Mode 会不同步地启动这些任务。开发人员可以对这些对象进行轮询以检查完成,或者在需要赶上最新状态时开始流媒体事件。了解更多
1 | response = client.responses.create( |
支持摘要: Reasoning summaries
API 现在可以生成摘要,类似于您在 Chatgpt 中看到的内容。这使开发人员更容易调试,审核和建立更好的最终用户体验。推理摘要无需额外费用。了解更多
1 | response = client.responses.create( |
Cline新特性:全局Workflow & Rules
Workflow
Workflows allow you to define a series of steps to guide Cline through a repetitive set of tasks, such as deploying a service or submitting a PR. To invoke a workflow, type /workflow-name in the chat.
Global workflows live in ~/Documents/Cline/Workflows
Local workflows in .clinerules/workflows/ take precedence
工作流程使您可以定义一系列步骤,以指导Cline通过一组重复的任务,例如部署服务或提交PR。要调用工作流程,请在聊天中键入 /工作流程名称。
Rules
类似Cursor的Rules,与Workflow类似同样支持全局和项目Rules
B站发布首个开源动漫视频生成模型Index-AniSora
查看效果: https://www.bilibili.com/video/BV1iMJbzuE1M
B站开源文本转语音模型(Index-TTS)
最近,基于大型语言模型(LLM)的文本到语音(TTS)系统由于其自然性高和强大的零声音克隆功能而逐渐成为行业中的主流。在这里,我们介绍了主要基于 XTTS 模型的 INDEXTTS 系统。我们增加了一些新颖的改进。具体而言,在中文场景中,我们采用了一种混合建模方法,该方法结合了角色和拼音,使多形字符和长尾字符的发音可控制。我们还对矢量量化(VQ)进行了比较分析,并使用有限量表量化(FSQ)进行了声音语音令牌的代码书利用。为了进一步增强语音克隆的效果和稳定性,我们引入了基于构象异构体的语音条件编码器,并用 BigVgan2 替换语音码解码器。与 XTT 相比,它在自然性,内容一致性和零声音克隆方面取得了重大改善。至于开源中流行的 TTS 系统,例如 Fish 语音,Cosyvoice2,FireredTTS 和 F5-TTS,Indextts 具有相对简单的训练过程,更可控制的用法和更快的推理速度。 此外,其性能超过了这些系统的性能。
与其他开源tts方案对比效果,点击前往查看
套娃:使用Manus制作的Awsome-Manus网站
搜集了多大650个使用Manus制作的Manus Space,含回放和Space
砺算科技6nm高性能GPU成功点亮:对标RTX4060 已获亿元预订单
来源:财联社据介绍,该GPU芯片支持主流图形API,同时具备高算力、大显存和低功耗特性,在游戏、专业设计、智能汽车等领域均有着广泛的应用前景。5月26日晚间,砺算科技母公司东芯股份也发布公告称,2025年5月26日收到上海砺算出具的《关于G100芯片进展的告知函》,具体情况如下: 2025年5月24日,上海砺算收到了首批封装完成的G100芯片,即刻启动功能测试。
一季度华为手机销量继续保持领先地位
2025年Q1,华为以19.4%市场份额连续两个季度领跑中国智能手机市场,nova 13与Pura 70系列销量强劲,叠加补贴及高端价格段优势,创2021年以来新高。
vivo以17%紧随其后,Y系列中端机型与X200系列影像表现推动增长。
Xiaomi以16.6%份额实现快速增长,得益于补贴覆盖、电动车带动品牌声量及15 Ultra新品发布。
Gitalking ...