从 109 条内容中筛选出 16 条重要资讯


  1. GPT-5.6 Sol 预览:下一代前沿模型 ⭐️ 9.0/10
  2. IBM 推出全球首款亚纳米芯片,采用纳米堆叠架构 ⭐️ 9.0/10
  3. 赫库兰尼姆古卷首次被完整虚拟解读 ⭐️ 9.0/10
  4. General Intuition 获 3.2 亿美元,用游戏数据训练 AI 智能体 ⭐️ 9.0/10
  5. 美团 LongCat 开源 VitaBench 2.0,长期 AI 智能体基准 ⭐️ 9.0/10
  6. Codex 智能体在内部报告中超越 ChatGPT ⭐️ 9.0/10
  7. DFlash:块扩散草稿模型实现 15 倍吞吐量提升 ⭐️ 9.0/10
  8. OpenAI 与 Broadcom 发布 Jalapeño LLM 推理芯片 ⭐️ 9.0/10
  9. AI 招聘工具存在系统性种族偏见,排斥黑人和亚裔 ⭐️ 9.0/10
  10. 微软通过转售 GPT 和 DeepSeek 成为最大 AI 中间商 ⭐️ 9.0/10
  11. 首个统一科学大模型 LOGOS 正式开源 ⭐️ 9.0/10
  12. 智谱 GLM-5.2 发布:百万上下文,下周开源 ⭐️ 9.0/10
  13. 微软发布首款推理 AI 模型 MAI-Thinking-1 ⭐️ 9.0/10
  14. 定制 AI 芯片挑战英伟达主导地位 ⭐️ 8.0/10
  15. 纽约时报修改诉状:微软建造超级计算机协助 OpenAI 侵权 ⭐️ 8.0/10
  16. AI 聊天机器人被指存在左翼偏见 ⭐️ 8.0/10

GPT-5.6 Sol 预览:下一代前沿模型 ⭐️ 9.0/10

OpenAI 预览了旗舰前沿推理模型 GPT-5.6 Sol,以及 Terra 和 Luna 变体。 该系列以空前的速度(在 Cerebras 上高达 750 tok/s)和更低的成本层级为开发者提供前沿智能。 Sol 在 Cerebras 硬件上运行速度高达每秒 750 个 token,而 Terra 以两倍更低的成本提供与 GPT-5.5 竞争的性能。

hackernews · OpenAI Blog · Jun 26, 17:06 · 社区讨论T2 社区与开源

背景: Cerebras Systems 制造晶圆级 AI 芯片,可替代数百个 GPU 以加速训练和推理。

参考链接

社区讨论: 社区成员指出在 Cerebras 上 750 tok/s 的速度是最有趣的部分,并注意到定价趋势迫使升级到更高级别。

标签: #AI, #GPT, #OpenAI, #large language models, #frontier models


IBM 推出全球首款亚纳米芯片,采用纳米堆叠架构 ⭐️ 9.0/10

IBM 发布了全球首款亚纳米级芯片技术,采用 0.7nm 节点和全新三维纳米堆叠架构,并在 VLSI 2026 会议上得到验证。 这一突破延长了摩尔定律,相比 2nm 芯片性能提升 50%、能效提升 70%,对 AI 硬件和未来计算至关重要。 纳米堆叠架构垂直堆叠晶体管,指甲盖大小的芯片上集成约 1000 亿个晶体管,SRAM 面积缩减 40%。

rss · AIHOT 精选 · Jun 25, 18:52AIHOT 精选

背景: 纳米堆叠是 IBM 的新三维晶体管架构,将晶体管堆叠成两层,解锁 Z 轴缩放,超越传统 2D 方法。这与当前的纳米片或 FinFET 设计不同。

参考链接

标签: #semiconductor, #chip technology, #IBM, #nanotechnology, #AI hardware


赫库兰尼姆古卷首次被完整虚拟解读 ⭐️ 9.0/10

赫库兰尼姆古卷 PHerc.1667 首次被完整虚拟读取,展示斯多葛哲学。 无需展开即可读取碳化卷轴,恢复失传古代文献。 PHerc.1667 被从头到尾连续读取;数据和代码开源。

rss · AIHOT 精选 · Jun 25, 18:03AIHOT 精选

背景: X 射线显微断层扫描可无损生成高分辨率 3D 图像。赫库兰尼姆卷轴是公元 79 年碳化的纸莎草。虚拟展开在数字上展平卷轴。

参考链接

标签: #archaeology, #machine learning, #X-ray tomography, #digital humanities, #ancient texts


General Intuition 获 3.2 亿美元,用游戏数据训练 AI 智能体 ⭐️ 9.0/10

General Intuition 以 23 亿美元估值完成 3.2 亿美元融资,用游戏数据训练 AI 智能体。 这表明游戏数据能训练单一模型同时用于虚拟和现实机器人,可能革新 AI 智能体。 模型在 Fortnite 中连续运行 100 小时,机器人仅用 8 分钟真实数据即可适应。

rss · AIHOT 精选 · Jun 25, 16:00AIHOT 精选

背景: Medal 是一个游戏剪辑平台,提供数十亿小时带标签的游戏操作数据用于训练。

标签: #AI Agents, #Robotics, #Game Data, #Reinforcement Learning, #Funding


美团 LongCat 开源 VitaBench 2.0,长期 AI 智能体基准 ⭐️ 9.0/10

美团 LongCat 团队发布 VitaBench 2.0,这是首个面向长期动态用户建模的 AI 智能体开源基准。 该基准揭示了当前 AI 智能体的重大缺陷(最佳模型得分仅 0.5),为长期评估树立了新标准。 该基准包含 56 个模拟用户、819 个任务、2000 多个动态偏好、66 个工具,每个用户平均 2093 次交互,跨度 1580 天。

rss · AIHOT 精选 · Jun 25, 11:58AIHOT 精选

背景: VitaBench 2.0 旨在评估 AI 智能体在长期交互中的个性化和主动性行为,弥补现有静态基准的不足。它同时评测长上下文理解和记忆策略。

参考链接

标签: #benchmark, #AI agents, #lifelong learning, #evaluation, #dynamic user modeling


Codex 智能体在内部报告中超越 ChatGPT ⭐️ 9.0/10

Codex 取代 ChatGPT 成为 99.8%工作 token 的来源,非开发者用户增长 137 倍。 标志着企业工作从聊天转向自主智能体。 80.6%的用户发起了等效超过 30 分钟人类工作的任务;25.6%超过 8 小时。

rss · AIHOT 精选 · Jun 25, 02:00AIHOT 精选

背景: Codex 是 OpenAI 于 2025 年 4 月发布的 AI 编码智能体,最初用于软件工程任务。

参考链接

标签: #AI agents, #Codex, #OpenAI, #productivity, #automation


DFlash:块扩散草稿模型实现 15 倍吞吐量提升 ⭐️ 9.0/10

DFlash 通过块扩散草稿模型实现最高 15 倍吞吐量提升。 DFlash 比 EAGLE-3 快 2.5 倍,显著加速大模型推理。 创新性地将目标模型多层隐藏特征注入草稿模型的键值投影中,使接受长度随草稿深度增长。

rss · AIHOT 精选 · Jun 24, 07:21AIHOT 精选

背景: 投机解码通过草稿模型并行验证加速推理。EAGLE-3 是自回归草稿方法;DFlash 使用块扩散一次生成整块 token。

参考链接

标签: #speculative decoding, #LLM inference, #throughput optimization, #draft model, #block diffusion


OpenAI 与 Broadcom 发布 Jalapeño LLM 推理芯片 ⭐️ 9.0/10

OpenAI 与 Broadcom 联合推出 Jalapeño 芯片,专为 LLM 推理设计,性能功耗比领先,从设计到流片仅用 9 个月。 这标志着 OpenAI 首次自研芯片,将从 2026 年起部署千兆瓦级 AI 数据中心,重塑 AI 硬件格局。 早期实验室样品已以目标频率和功耗运行 GPT-5.3-Codex-Spark;芯片利用 AI 加速部分设计流程。

rss · AIHOT 精选 · Jun 24, 06:00AIHOT 精选

背景: 流片是集成电路设计完成后送交制造前的最后阶段。GPT-5.3-Codex-Spark 是 OpenAI 为实时编码优化的模型。

参考链接

标签: #AI Hardware, #LLM Inference, #OpenAI, #Custom Chip, #Broadcom


AI 招聘工具存在系统性种族偏见,排斥黑人和亚裔 ⭐️ 9.0/10

一项大规模实地研究发现,AI 招聘工具系统性地拒绝了 26%的黑人申请者和 15%的亚裔申请者。 这揭示了“算法单一文化”——多数雇主使用相同的第三方 AI,导致偏见在系统层面被放大。 该研究覆盖 340 万人、400 万份申请、150 家雇主和 1700 个职位,并与未使用 AI 的 108 家财富 500 强企业的 8.3 万份申请进行了对比。

rss · AIHOT 精选 · Jun 23, 21:48AIHOT 精选

背景: “算法单一文化”指多个决策系统使用几乎相同的算法和训练数据,导致结果趋同和系统性排斥。在招聘中,许多雇主依赖同一 AI 供应商的工具,导致偏见在整个行业中被复制。

参考链接

社区讨论: 该研究引发了对算法招聘进行独立监管的呼声,专家指出算法单一文化是一个工程问题,而不仅仅是恶意行为。

标签: #AI bias, #hiring, #ethics, #algorithmic fairness, #regulation


微软通过转售 GPT 和 DeepSeek 成为最大 AI 中间商 ⭐️ 9.0/10

微软开始双向转售 GPT 和 DeepSeek 模型,成为全球最大 AI 中间商。 此举改变 AI 市场格局,让微软在与谷歌和亚马逊的竞争中占据优势。 微软通过 Azure 同时提供西方和中国 AI 模型,将竞争对手的技术整合在一起。

rss · AIHOT 日报 · Jun 21, 00:00AIHOT 日报

背景: DeepSeek 是一家中国 AI 公司,开发大语言模型,例如拥有 671B 参数的 DeepSeek-V3。

参考链接

标签: #Microsoft, #GPT, #DeepSeek, #AI business, #industry shift


首个统一科学大模型 LOGOS 正式开源 ⭐️ 9.0/10

首个统一科学大模型 LOGOS 已开源。 整合多学科,加速科学发现。

rss · AIHOT 日报 · Jun 19, 00:00AIHOT 日报

标签: #AI, #open-source, #science, #large model, #LOGOS


智谱 GLM-5.2 发布:百万上下文,下周开源 ⭐️ 9.0/10

智谱(Z.ai)正式发布 GLM-5.2 模型,支持百万 token 上下文窗口,并宣布将于下周开源。 该模型能一次性处理超长文本(如整个代码库或书籍),对研究人员和企业均具有重大价值。 在 PostTrainBench 上,GLM-5.2 性能超越 Opus 4.7 和 GPT-5.5,仅次于 Opus 4.8。

rss · AIHOT 日报 · Jun 14, 00:00AIHOT 日报

背景: 上下文窗口是指大语言模型一次能处理的文本量(以 token 计)。百万 token 的窗口大幅增强了模型处理多步骤自动化和软件工程等长周期任务的能力。

参考链接

标签: #AI, #LLM, #open-source, #GLM, #context window


微软发布首款推理 AI 模型 MAI-Thinking-1 ⭐️ 9.0/10

微软宣布推出其首款自研高级推理 AI 模型 MAI-Thinking-1,该模型从头构建,旨在与 OpenAI 和其他专有模型竞争。 这表明微软战略性地减少对 OpenAI 的依赖,并将自身打造为第一方 AI 模型构建者,可能重塑企业 AI 格局。 该模型通过结构化思考令牌和工具调用模式将内部思考与外部响应分离,支持多步推理并保持输出整洁。

rss · AIHOT 日报 · Jun 3, 00:00AIHOT 日报

背景: 推理模型(也称为大型推理模型 LRM)是一种专门针对多步逻辑推理任务训练的大语言模型,在数学、逻辑和编程上通常优于标准 LLM。与典型 LLM 不同,它可以回溯并修正前面的步骤,并在推理时使用额外计算。

参考链接

社区讨论: 领英公告强调了该模型的‘从头构建’特性,评论者称赞微软的独立行动,但指出其在基准测试中仍落后于 OpenAI o1。

标签: #AI, #Microsoft, #reasoning model, #machine learning, #breakthrough


定制 AI 芯片挑战英伟达主导地位 ⭐️ 8.0/10

OpenAI 与博通联合发布了其定制推理芯片 ‘Jalapeño’。 此举减少了对英伟达的依赖,重塑 AI 硬件市场。 该芯片在九个月内完成设计与流片。

rss · TechCrunch · Jun 26, 17:43T1 官方实验室

背景: 推理芯片专门用于运行训练后的 AI 模型,与训练芯片不同。它们优化低延迟和高吞吐量。

参考链接

标签: #AI hardware, #custom chips, #Nvidia, #chip design, #industry trends


纽约时报修改诉状:微软建造超级计算机协助 OpenAI 侵权 ⭐️ 8.0/10

《纽约时报》修改版权诉讼,指控微软建造超级计算机以故意帮助 OpenAI 侵犯其作品版权。 这可能根据 Cox 案确立的新帮助侵权标准,为 AI 训练数据版权责任树立先例。 时报援引要求证明故意诱导侵权的新标准,主张微软设计该超级计算机是为了实现未经授权的训练。

rss · AIHOT 精选 · Jun 26, 20:04AIHOT 精选

背景: Cox 通信公司案中,最高法院确立了帮助侵权的认定标准:原告必须证明被告故意诱导侵权行为,而不仅仅是知情。

参考链接

标签: #copyright, #lawsuit, #AI, #OpenAI, #Microsoft


AI 聊天机器人被指存在左翼偏见 ⭐️ 8.0/10

《华盛顿邮报》报道,基于达特茅斯和斯坦福的研究表明,主流 AI 聊天机器人在 30 个政策议题上表现出左翼偏见。 这动摇了人们对 AI 作为客观信息来源的信任,并引发对广泛使用的工具中隐含政治框架的担忧。 GPT-5.5 在 80%的情况下给出左倾立场,而 Grok 是唯一右倾回答占 33%的模型。

rss · AIHOT 精选 · Jun 26, 16:51AIHOT 精选

背景: 研究测试了聊天机器人在税收、医保、移民等议题上的表现,指出偏见并非来自答案本身,而是模型在展现权衡之前已用单一道德框架压缩政治分歧。

标签: #AI bias, #chatbots, #ethics, #political bias, #AI research



附录

以下内容来自 AIHOT 日报,每天 08:00 北京时间发布

  1. AI HOT 日报 · 2026-06-26 — Ornith-1.0 开源模型家族发布,专注 Agentic Coding 全参数规模 Ornith-1.0 开源模型家族发布,专注 Agentic Coding 全参数规模 — 点击查看完整日报

  2. AI HOT 日报 · 2026-06-25 — OpenAI ChatGPT 语音最大规模升级:双向 AI 语音模型 Bidi 1 已上线测试 OpenAI ChatGPT 语音最大规模升级:双向 AI 语音模型 Bidi 1 已上线测试 — 点击查看完整日报

  3. AI HOT 日报 · 2026-06-24 — FastWan-QAD:单卡 5090 上 1.8 秒生成 5 秒视频 FastWan-QAD:单卡 5090 上 1.8 秒生成 5 秒视频 — 点击查看完整日报

  4. AI HOT 日报 · 2026-06-23 — PP-OCRv6 on Hugging Face:50 语言 OCR,参数规模 1.5M 至 34.5M PP-OCRv6 on Hugging Face:50 语言 OCR,参数规模 1.5M 至 34.5M — 点击查看完整日报

  5. AI HOT 日报 · 2026-06-22 — 美团 tabbit 国际版免费接入 GPT-5.5/Claude Opus 4.8 等旗舰模型 美团 tabbit 国际版免费接入 GPT-5.5/Claude Opus 4.8 等旗舰模型 — 点击查看完整日报

  6. AI HOT 日报 · 2026-06-21 — 微软双向转售 GPT 与 DeepSeek 成全球最大 AI 中间商 微软双向转售 GPT 与 DeepSeek 成全球最大 AI 中间商 — 点击查看完整日报

  7. AI HOT 日报 · 2026-06-20 — 阿里开源向量数据库 Zvec,UCSD 黄碧薇教授提出因果 AI 第四代范式 阿里开源向量数据库 Zvec,UCSD 黄碧薇教授提出因果 AI 第四代范式 — 点击查看完整日报

  8. AI HOT 日报 · 2026-06-19 — 首个统一科学大模型 LOGOS 正式开源 首个统一科学大模型 LOGOS 正式开源 — 点击查看完整日报

  9. AI HOT 日报 · 2026-06-18 — MolmoMotion:语言引导的 3D 运动预测模型 MolmoMotion:语言引导的 3D 运动预测模型 — 点击查看完整日报

  10. AI HOT 日报 · 2026-06-17 — Cartesia 发布 Sonic 3.5 与 Ink 2 实时语音模型 Cartesia 发布 Sonic 3.5 与 Ink 2 实时语音模型 — 点击查看完整日报

  11. AI HOT 日报 · 2026-06-16 — MiniMax 开源 M3 模型权重及 MSA 技术论文 MiniMax 开源 M3 模型权重及 MSA 技术论文 — 点击查看完整日报

  12. AI HOT 日报 · 2026-06-15 — Anthropic 暂停新模型访问,印度辩论 AI 未来 Anthropic 暂停新模型访问,印度辩论 AI 未来 — 点击查看完整日报

  13. AI HOT 日报 · 2026-06-14 — 智谱 GLM-5.2 全量开放,支持 1M 上下文且下周开源 智谱 GLM-5.2 全量开放,支持 1M 上下文且下周开源 — 点击查看完整日报

  14. AI HOT 日报 · 2026-06-13 — MiniMax M3 开源权重模型发布,已上架 HuggingFace MiniMax M3 开源权重模型发布,已上架 HuggingFace — 点击查看完整日报

  15. AI HOT 日报 · 2026-06-12 — Gemini Omni Flash 视频任务达 SOTA Gemini Omni Flash 视频任务达 SOTA — 点击查看完整日报

  16. AI HOT 日报 · 2026-06-11 — DiffusionGemma:文本生成速度提升 4 倍的开源扩散模型 DiffusionGemma:文本生成速度提升 4 倍的开源扩散模型 — 点击查看完整日报

  17. AI HOT 日报 · 2026-06-10 — Claude Fable 5 和 Claude Mythos 5 Claude Fable 5 和 Claude Mythos 5 — 点击查看完整日报

  18. AI HOT 日报 · 2026-06-09 — 小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型 小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型 — 点击查看完整日报

  19. AI HOT 日报 · 2026-06-08 — Harness-1:基于强化学习训练的有状态搜索 20B 检索子智能体 Harness-1:基于强化学习训练的有状态搜索 20B 检索子智能体 — 点击查看完整日报

  20. AI HOT 日报 · 2026-06-07 — GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码 GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码 — 点击查看完整日报

  21. AI HOT 日报 · 2026-06-06 — Riverflow 2.5:可控制评分标准的图像模型 Riverflow 2.5:可控制评分标准的图像模型 — 点击查看完整日报

  22. AI HOT 日报 · 2026-06-05 — Nemotron 3.5 Content Safety:面向全球企业 AI 的可定制多模态安全 Nemotron 3.5 Content Safety:面向全球企业 AI 的可定制多模态安全 — 点击查看完整日报

  23. AI HOT 日报 · 2026-06-04 — Grok Imagine 1.5 预览版发布 Grok Imagine 1.5 预览版发布 — 点击查看完整日报

  24. AI HOT 日报 · 2026-06-03 — 微软首款高级推理 AI 模型 MAI-Thinking-1 发布 微软首款高级推理 AI 模型 MAI-Thinking-1 发布 — 点击查看完整日报

  25. AI HOT 日报 · 2026-06-02 — MiniMax M3:前沿编码、100 万 token 上下文与原生多模态一体模型 MiniMax M3:前沿编码、100 万 token 上下文与原生多模态一体模型 — 点击查看完整日报

  26. AI HOT 日报 · 2026-06-01 — OpenAI 发布生物防御 AI 工具 Rosalind OpenAI 发布生物防御 AI 工具 Rosalind — 点击查看完整日报

  27. AI HOT 日报 · 2026-05-31 — Nano Banana Pro 与 Nano Banana 2 正式发布 Nano Banana Pro 与 Nano Banana 2 正式发布 — 点击查看完整日报

  28. AI HOT 日报 · 2026-05-30 — OpenAI 推出实时翻译模型,支持 70+语言输入 OpenAI 推出实时翻译模型,支持 70+语言输入 — 点击查看完整日报

  29. AI HOT 日报 · 2026-05-29 — Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级 Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级 — 点击查看完整日报

  30. AI HOT 日报 · 2026-05-28 — Runway 推出 Model Context Protocol 服务器 Runway 推出 Model Context Protocol 服务器 — 点击查看完整日报