AI 产品追踪

    2026年06月12日

    新闻概览今日精选速览,点击标题跳转详情
    • ChatGPT #2
    • Claude #3
    • 通义千问Qwen #1
    • MiniMax #1
    • MiniMax #5
    • 可灵Kling #1
    • 剪映CapCut #1
    ChatGPT
    ChatGPT

    01Sam Altman 公布 AI 发展路线图与安全策略

    AGI路线图安全策略平台生态组织架构

    OpenAI首席执行官Sam Altman在最新推文中公布了公司未来四年的技术发展蓝图与组织架构调整。根据规划,该公司设定了到2026年实现自动化AI研究实习生的具体目标,并计划在2028年达成真正的自动化AI研究员。

    02OpenAI 发布 gpt-oss-safeguard 安全分类模型

    安全模型开源权重内容分类开发者工具

    在安全层面,OpenAI发布了gpt-oss-safeguard,这是一组用于安全分类任务的开放权重推理模型,包括gpt-oss-safeguard-120b和gpt-oss-safeguard-20b两个版本。这些模型基于gpt-oss开放模型进行微调,采用Apache 2.0许可证,允许自由使用、修改和部署。开发者可以提供自定义的安全政策,模型在推理时直接解释政策并分类用户内容,同时提供推理过程以增强透明度。

    03OpenAI 在巴西推出 ChatGPT Go 订阅计划

    产品发布订阅计划巴西市场功能升级

    在产品矩阵拓展上,OpenAI 于 2025 年 10 月 28 日在巴西正式推出了低成本订阅计划 ChatGPT Go。该计划在免费版所有功能的基础上,提供了更多消息数量、更大的文件上传容量以及扩展的图像生成能力,同时还包含高级数据分析功能和更长的记忆能力,以实现更个性化的回复。

    04OpenAI 发布 ChatGPT Pulse 个性化更新功能

    新功能个性化更新用户体验Pro用户

    与此同时,为了深化用户体验,OpenAI推出了ChatGPT Pulse,这是一项新功能,能够主动为用户生成个性化的每日更新。该更新整合了聊天记录、用户反馈以及连接的应用程序(如日历)数据,旨在提升用户的日常信息管理效率。

    05OpenAI 举办 gpt-oss-safeguard 黑客松活动

    开发者活动黑客松社区合作AI安全

    # OpenAI 举办 GPT-OSS-Safeguard 黑客松活动

    Gemini
    Gemini

    01Google 推出 AI for Math 计划

    AI for Math基础研究战略合作Google DeepMindAI工具集

    Google DeepMind 宣布启动 "AI for Math"倡议,旨在通过人工智能技术加速数学研究进程。该计划联合了帝国理工学院、高等研究院、法国高等科学研究所、加州大学伯克利分校的Simons理论计算研究所和印度塔塔基础研究学院等五所全球顶尖研究机构。

    02Gemini API 成本优化更新

    API更新成本优化开发者工具上下文缓存异步处理

    在开发者生态层面,Google AI Studio 发布了 Gemini API 的两项重要更新,旨在优化开发者体验并显著降低成本。其中 Context Caching 功能通过隐式缓存机制,无需代码更改即可实现高达90%的成本节省。Batch API 的引入则支持异步处理,为开发者提供更灵活的模型调用方式。

    03NotebookLM 聊天功能升级

    NotebookLM功能升级Gemini模型上下文窗口AI研究伙伴

    在具体应用层面,NotebookLM的最新更新旨在提升其作为AI研究伙伴的智能性和实用性,通过扩展上下文窗口、延长对话记忆和优化响应质量,更好地支持用户处理大规模文档和进行多轮对话。这些改进基于最新的Gemini模型,显著提升了性能、质量和上下文理解能力。 系统会自动保存对话历史,确保用户能够无缝继续之前的互动。

    04Gemini CLI Jules 扩展发布

    开发者工具CLI扩展自主编码后台任务效率提升

    同样面向开发者,Google推出了Jules extension for Gemini CLI,这是一款旨在后台协助开发者处理编码任务的自主工具。该扩展与Gemini CLI集成,允许用户在不中断工作流程的情况下,委托诸如错误修复、代码转换和分支更新等任务。

    05Google DeepMind 发现国际象棋谜题

    AI研究强化学习生成模型国际象棋创造力

    在探索AI创造力方面,Google DeepMind 的 Discovery 团队通过结合强化学习和生成模型,成功开发出新的创意国际象棋谜题。该方法显著提升了新谜题的生成数量,同时确保了谜题的美学多样性。三位国际象棋专家参与了评估过程,以验证谜题的质量和创意水平。

    06Pixel Watch 4 集成 Gemini 功能

    硬件集成Pixel Watch语音交互智能穿戴生态扩展

    在硬件生态方面,用户现在可以在Pixel Watch 4上启用Raise to Talk功能以访问Gemini。该功能允许用户通过简单的手势启动语音交互,无需使用传统的唤醒词,提升了智能手表的使用便捷性。

    07DevFest Google Cloud 出海专场活动

    开发者活动Google Cloud技术出海社区生态AI落地

    为推动技术落地,《DevFest Google Cloud 出海专场》作为 DevFest 2025 的重要组成部分,由 Google 官方谷歌开发者专家(GDE) 及资深社区讲师联合打造。活动聚焦出海业务需求,提供技术与商业深度融合的解决方案,特别关注 AI 技术落地智能体技术栈GenMedia 模型应用 等前沿领域。

    08Gemini Discord 技术分享活动

    社区活动技术分享DeepMindDiscord开发者交流

    此外,Google Gemini App 发布了关于 Discord 事件的公告,邀请用户参加由 Google DeepMind 超级明星 @DynamicWebPaige 主讲的活动。该活动时间定于 10 月 29 日上午 11 点太平洋时间,内容涉及 Gemini 的使用案例和技术细节

    09Gemini API 文档功能增强

    文档更新开发者体验功能增强API

    最后,一项细节优化体现在Gemini API文档上,其已在每一页顶部添加了“复制为 Markdown”按钮,该功能现已实现。

    Google 系列
    Google 系列Google旗下AI产品(Gemini单独呈现)

    01FlowbyGoogle 免费积分升级至每月180个

    产品更新用户福利免费试用降低门槛

    FlowbyGoogle 近期将新用户的每月免费试用积分从100个提升至180个,这一调整旨在让用户体验更多剪辑和扩展场景功能。增加的免费额度让新用户可以更充分地测试平台的核心能力,无需担心资源限制影响试用效果。

    Claude
    Claude

    01Anthropic 东京办公室开业及亚太业务拓展

    国际扩张亚太市场战略合作业务增长

    人工智能公司 Anthropic 正式在东京设立亚太地区首个办公室,标志着其国际扩张战略迈出关键一步。公司首席执行官 Dario Amodei 与日本首相高市早苗及数字大臣松本刚明会面,探讨 Claude 模型如何支持日本的数字化转型和人工智能生态系统建设。

    02Claude 开发者平台模型停用及功能更新

    开发者平台模型弃用功能更新API

    在技术层面,Claude开发者平台也发布了更新公告。2025年10月28日,平台宣布弃用Claude Sonnet 3.7模型,并已正式停用Claude Sonnet 3.5系列模型。所有向这些已停用模型发起的请求将返回错误。同时,平台扩展了上下文编辑功能,新增思维块清除功能(`clear_thinking_20251015`),支持自动管理思维块。

    03Anthropic 发布 Claude 自我反思能力研究

    AI研究模型能力自我反思LLM

    与此同时,在基础能力探索上,Anthropic发布了关于其大型语言模型Claude的新研究,该研究表明大型语言模型可能具备一定程度的自我反思能力。

    通义千问Qwen
    通义千问Qwen

    01Gradient 发布 Sovereign AI OS

    本地部署模型生态AI操作系统大模型应用

    Gradient发布了Sovereign AI OS,该系统支持在Mac和PC上搭建本地AI集群,并能运行大型模型如Alibaba Qwen 235B。Alex Mirran及其团队展示了该系统的快速部署能力,突出了其在本地环境中的高效应用潜力。

    腾讯AI
    腾讯AI

    01腾讯混元推出交互式 AI 播客

    交互式播客混元大模型内容生成AIGC应用

    腾讯混元发布了国内首个交互式AI播客产品,允许用户在收听过程中通过语音或文字实时打断主持人和嘉宾进行提问,实现了播客内容的动态互动体验。该产品基于大模型的意图识别、长上下文理解、多轮对话及外部联网检索能力,能够结合上下文提供更精准的回答。

    02元宝工具推出数据分析功能

    数据分析效率工具自然语言处理可视化图表

    在效率工具方面,一款名为“元宝”的工具旨在帮助用户在不打开表格的情况下,通过提问完成多种数据分析任务。该工具支持描述性分析、差异性分析、聚类分析、诊断性分析以及函数图像绘制等功能,并能生成可视化图表,方便用户用于汇报或报告。用户只需上传数据或直接输入需求,即可获得分析结果和图表。此外,元宝还支持文件处理,如格式转换和数据修正。作者希望该工具能提升用户效率,帮助更早下班。

    MiniMax
    MiniMax

    01MiniMax M2模型发布与限时免费

    模型发布限时免费开源MiniMax M2智能体

    MiniMax M2模型在发布后经历了服务不稳定问题,现已恢复并承诺保持99%以上的服务成功率。该模型以限时免费方式提供,并支持多种访问渠道。

    02Vercel AI Gateway 集成 MiniMax M2

    生态集成Vercel开发者平台限时免费

    在生态层面,Vercel AI Gateway 宣布正式上线 MiniMax M2 模型,该模型由 Vercel 与 MiniMax AI 工程团队合作集成,旨在提升服务的可靠性与性能。此次集成标志着 Vercel 在扩展其人工智能模型生态方面迈出重要一步。用户可免费使用该模型至 2025 年 11 月 7 日,这一限时免费策略有望吸引开发者广泛采用并测试其在实际应用中的表现。

    03极狐驭码平台适配 MiniMax M2

    生态集成AI编程DevOps极狐驭码

    同样在开发者工具领域,极狐驭码平台宣布已完成对 MiniMax M2 模型的全面适配。MiniMax M2 是一款专为编码与智能体任务优化的模型,具备顶级代码能力、强大的 Agentic 表现以及高性价比和速度,在多个权威榜单中编程能力稳居国内第一梯队。

    04MLX 支持 MiniMax M2

    硬件支持MLXApple Silicon模型部署

    针对特定硬件生态,MLX 框架现已支持 MiniMax-M2 模型,并发布了在 Apple Silicon Mac 上的使用指南。该指南要求用户设备配备 M3 Ultra 或更高版本芯片,并拥有至少 256GB 的统一内存。

    05MiniMax Speech 2.6语音模型发布

    语音模型语音交互多模态低延迟Speech 2.6

    与此同时,MiniMax 发布了语音模型 Speech 2.6,专注于提升 Voice Agent(语音代理)场景下的语音交互体验。该版本在延迟、格式处理和语音自然度方面进行了全面优化,旨在提高实时对话的流畅性和信息传递效率。

    ComfyUI
    ComfyUI

    01Lightricks LTX-2 系列视频生成模型在 ComfyUI 中支持

    模型集成视频生成ComfyUI生态合作

    Lightricks的LTX-2系列视频生成模型现已作为合作节点在ComfyUI中通过API集成,为用户提供高效的视频内容创作工具。该模型支持文本到视频和图像到视频的生成,并具备同步音频生成能力,包含专业版和快速版两种版本,旨在满足不同场景下的需求。

    可灵Kling
    可灵Kling

    01可灵 AI 发布多图参考模型 2.1 版本

    模型更新图像生成多图参考技术细节

    可灵 AI 发布了图片生成-多图参考模型的2.1版本,该更新专注于增强图像生成的美观度、多样性和对用户指令的遵循能力。模型通过架构优化和训练策略改进,实现了更精准的控制和更高质量的图像输出,适用于多图参考任务,以支持丰富的创意表达。

    剪映CapCut
    剪映CapCut

    01CapCut 发布 AI 视频模型 VEO 3.1 和 Sora 2

    AI视频模型发布CapCut新品VEO 3.1

    CapCut 推出了 VEO 3.1 和 Sora 2 AI 视频模型,旨在为用户提供专业级视频生成和编辑能力。这些模型强调好莱坞级别的输出质量,并附带限时免费试用和 1000 积分奖励活动。

    02CapCut 对比 Open-Sora 2.0 功能特性

    AI视频产品对比Open-Sora功能评测

    在技术对标层面,Open-Sora 2.0 是一款先进的 AI 视频生成工具,能够根据文本或图像提示创建高质量、逼真的视频。相较于前代版本,它在场景流畅性、视频长度和细节表现上均有提升,并具备更强的稳定性和视觉一致性。该工具支持图像到视频、文本到视频、视频混剪以及 AI 客串等功能,适用于数字艺术家和内容创作者。

    03CapCut 对比 Sora 与 Veo 视频生成工具

    SoraVeoAI视频工具对比行业分析

    与此同时,《Sora vs Veo - Which AI is the Best Choice for You in 2025》一文对OpenAI开发的Sora和Google DeepMind开发的Veo两款AI视频生成工具进行了全面比较。文章从输入类型、视频分辨率、音频生成、编辑工具、安全性、视频长度及生成速度等维度分析了两者的差异,帮助用户根据需求做出选择。

    04CapCut 对比 DeepAI 系列工具功能

    DeepAIAI工具集图像生成功能对比

    在图像生成领域,DeepAI 发布了三款基于人工智能的创意工具,分别专注于文本到图像生成、文本生成和图像生成,旨在帮助设计师、营销人员和内容创作者快速高效地创建视觉和文本内容。这些工具通过深度学习模型实现快速内容生成,并支持多种自定义选项以提升输出质量。 文章还推荐了 CapCut 作为补充工具,提供更丰富的编辑和优化功能,帮助用户进一步完善 AI 生成的内容。

    05CapCut 对比 Getimg.ai 图像生成工具

    Getimg.ai图像生成AI工具功能评测

    《What To Know About Getimg.ai Image Generator And Editor In 2025》一文全面介绍了Getimg.ai这一AI图像生成与编辑工具的功能特性、使用流程、定价策略及其优缺点。该平台主要面向设计师、营销人员和内容创作者,通过人工智能技术将文字描述快速转化为图像。作为一款高效的图像生成工具,Getimg.ai提供了从创意到输出的完整工作流支持。

    06CapCut 对比 DreamStudio AI 图像平台

    DreamStudio.ai图像生成AI平台产品对比

    同样,DreamStudio.ai 是一个人工智能驱动的图像生成平台,专为艺术家、设计师、营销人员和内容创作者设计,旨在快速生成高质量的视觉内容。该平台通过文本到图像的转换功能,支持自定义风格、分辨率和画布大小,适用于插图、概念艺术和社交媒体视觉等多种场景。

    07CapCut 对比 NightCafe AI 图像生成器

    NightCafeAI艺术图像AI工具评测

    另一篇分析则聚焦于NightCafe AI图像生成器,它是一款面向艺术家、设计师和爱好者的工具,旨在通过文字描述快速生成高质量数字艺术,覆盖写实照片、抽象设计或幻想艺术等多种风格,无需专业技能即可将创意转化为图像。

    08CapCut 对比 Fotor AI 艺术生成器

    FotorAI艺术图像生成在线工具

    与Fotor的对比也体现了类似的定位策略,Fotor AI艺术生成器是一款在线人工智能工具,旨在根据文本提示或简单草图快速生成数字艺术品,适用于社交媒体插图、书籍封面和个人项目等场景,无需专业绘画技能即可操作。该工具强调易用性和快速生成能力,通过三步流程简化创作过程,但免费版本存在功能限制。

    09CapCut 推出 AI 惊悚节日特效

    AI特效节日活动功能更新内容创作

    在具体的创意功能层面,CapCut 推出了 AI 惊悚节日特效,用户可通过 #GhostChaseMe 和 #CapCutAIHalloween 分享自己的惊悚作品。

    Perplexity
    Perplexity

    01Perplexity 发布 AI 专利搜索工具

    产品发布AI搜索垂直领域应用知识产权

    Perplexity推出全球首个AI专利研究代理工具Perplexity Patents,旨在简化传统复杂耗时的专利搜索流程,使知识产权情报对各类用户开放。该工具允许用户使用自然语言提问,无需依赖精确关键词或技术语法,即可快速获取相关专利信息。

    Notion AI
    Notion AI

    01Lovable 联合创始人 Fabian Hedin 分享 AI 产品开发经验

    AI产品开发创业经验快速增长创始人访谈

    在"First Block"系列访谈中,Lovable联合创始人兼CTO Fabian Hedin分享了这家AI软件开发平台的创业历程与产品开发理念。Lovable通过AI技术让非技术人员能够使用自然语言构建生产级应用,自2024年11月推出后,年度经常性收入在八个月内从100万美元增长至1亿美元,成为AI领域增长最快的公司之一。

    ElevenLabs
    ElevenLabs

    01ElevenLabs 与 StrokeOnward 合作支持中风幸存者

    语音克隆医疗康复社会责任技术向善

    人工智能语音技术公司 ElevenLabs 在世界中风日宣布与非营利组织 StrokeOnward 达成战略合作。此次合作旨在通过 ElevenLabs 的 Impact Program,为中风后语言功能受损的患者提供先进的语音克隆技术支持。该计划将帮助中风幸存者重建个人化的声音特征,使其能够使用与自己原声高度相似的合成语音进行沟通。这项技术应用标志着语音克隆技术从商业用途向医疗康复领域的拓展,为语言障碍患者提供了新的沟通解决方案。合作双方表示,这一项目将重点关注中风后失语症患者的需求,通过技术创新改善其生活质量。

    02ElevenLabs 推出音乐生成工具

    AI音乐内容创作视频配乐产品更新

    在创意工具方面,ElevenLabs 推出音乐生成工具,用户可通过该工具为视频添加原创音乐,并支持多种风格和情绪的创作。Alec 展示了如何在短时间内完成操作。

    V0 by Vercel
    V0 by Vercel

    01v0 推出 IRLs 计划:用户可申请举办线下活动

    社群活动开发者生态线下计划

    v0 推出了IRLs计划,允许用户申请举办线下活动。 该计划为活动组织者提供全面的工具包支持,包括平台信用额度和品牌周边产品。用户可以通过申请成为活动主办方,获得官方提供的资源支持。

    02v0 性能优化与功能更新

    性能优化产品更新用户体验

    与此同时,v0的大型聊天功能加载速度提高了12倍。

    © 2025 AI动态简报 · 技术突破与产品创新