YLF News Daily: 2026-06-24 (ZH)

从 110 条内容中筛选出 17 条重要资讯

OpenAI 推出与博通合作的自研 Jalapeno AI 芯片 ⭐️ 9.0/10
Qwen-AgentWorld 开源：让 Agent 学会”先预测，再行动” ⭐️ 9.0/10
大型研究发现 AI 招聘工具歧视黑人和亚裔申请者 ⭐️ 9.0/10
Confucius4-TTS：开源 14 语种无口音语音克隆模型 ⭐️ 9.0/10
智谱发布 GLM-5.2，支持 1M 上下文，下周开源 ⭐️ 9.0/10
OpenAI 发布生物防御 AI 工具 Rosalind ⭐️ 9.0/10
AlphaProof Nexus 攻克 56 年数学难题 ⭐️ 9.0/10
RubyLLM: 全 AI 提供商统一 Ruby 框架 ⭐️ 8.0/10
Bunny DNS 免费：无查询费，支持最多 500 个域名 ⭐️ 8.0/10
卡马克反思早期对 id Software 施压过大的失误 ⭐️ 8.0/10
Gemini 3.5 Flash 获得计算机使用能力 ⭐️ 8.0/10
Introducing the FFASR Leaderboard: Benchmarking ASR in the Real World ⭐️ 8.0/10
NSA 失去 Anthropic Mythos 系统访问权 ⭐️ 8.0/10
思考即回忆：推理如何解锁 LLM 中的参数化知识 ⭐️ 8.0/10
NeMo AutoModel：一行代码加速 MoE 微调 3.4 倍 ⭐️ 8.0/10
DFlash：块扩散草稿模型实现 15 倍吞吐量提升 ⭐️ 8.0/10
ChatGPT 推出双向语音模型 Bidi 1 ⭐️ 8.0/10

OpenAI 推出与博通合作的自研 Jalapeno AI 芯片 ⭐️ 9.0/10

OpenAI 宣布了其首款自研 AI 推理芯片 Jalapeno，与博通合作开发，并由台积电制造。这标志着 OpenAI 进入定制芯片领域，可能减少对英伟达 GPU 进行推理的依赖。该芯片使用 OpenAI 自己的模型在九个月内设计完成，并针对大型语言模型推理进行了优化。

hackernews · TechCrunch · Jun 24, 17:47 · 社区讨论T2 社区与开源

背景: 推理芯片专门用于运行已训练好的模型，与训练芯片不同。OpenAI 的定制芯片旨在提高其 ChatGPT 等服务的效率。

参考链接

社区讨论: 一些评论者对 AI 加速芯片设计的说法表示怀疑，而另一些人则赞扬了台积电的作用，并讨论了潜在的效率提升。

标签: #AI chips, #OpenAI, #Broadcom, #hardware, #inference

Qwen-AgentWorld 开源：让 Agent 学会”先预测，再行动” ⭐️ 9.0/10

Tongyi Qianwen open-sources Qwen-AgentWorld, a state-of-the-art native language world model for agents that outperforms GPT-5.4 and Claude Opus 4.8.

rss · AIHOT 精选 · Jun 24, 03:32AIHOT 精选

标签: #AI, #language models, #agents, #reinforcement learning, #open-source

大型研究发现 AI 招聘工具歧视黑人和亚裔申请者 ⭐️ 9.0/10

斯坦福一项覆盖 340 万申请者的研究发现，AI 招聘工具系统性拒绝了 26%的黑人和 15%的亚裔候选人，相比之下白人申请者被拒率更低。这种广泛存在的偏见影响了数百万求职者，破坏了招聘的公平性，并呼吁对算法工具进行独立监管。该研究分析了 150 家雇主使用同一第三方供应商算法的 400 万份申请，形成了算法单一文化。

rss · AIHOT 精选 · Jun 23, 21:48AIHOT 精选

背景: 算法单一文化指许多雇主依赖同一算法供应商，导致相关拒信和系统性排斥某些群体。

参考链接

Algorithmic Monocultures in Hiring - Stanford Digital Economy Lab

标签: #AI bias, #algorithmic fairness, #hiring, #ethics, #research

Confucius4-TTS：开源 14 语种无口音语音克隆模型 ⭐️ 9.0/10

开源 Confucius4-TTS 实现跨语种无口音语音克隆，仅需 3 秒音频，支持 14 种语言。这一突破大幅降低了实现逼真多语种语音克隆的门槛。相似度超过 85%，任务准确率达 97%，并支持音频提示情感克隆。

rss · AIHOT 精选 · Jun 23, 11:00AIHOT 精选

背景: Flow Matching 是一种生成建模范式，结合了连续规范化流和扩散模型的特性。ECAPA-TDNN 是一种说话人嵌入网络，可提取鲁棒的说话人特征。

参考链接

标签: #TTS, #voice cloning, #open-source, #AI, #multilingual

智谱发布 GLM-5.2，支持 1M 上下文，下周开源 ⭐️ 9.0/10

智谱 AI 全量发布 GLM-5.2 模型，支持 100 万 token 上下文窗口，并宣布将于下周开源。这是开源大语言模型的一个重要里程碑，超长上下文窗口使得处理整个代码库或长文档成为可能。该模型预计将采用宽松的开源许可证发布，延续智谱 AI 的开源传统。

rss · AIHOT 日报 · Jun 14, 00:00AIHOT 日报

背景: GLM（通用语言模型）是智谱 AI（一家中国人工智能公司）开发的一系列大语言模型。100 万 token 的上下文窗口使得模型能够处理极长序列，例如整本书籍或大量的对话历史。

参考链接

标签: #AI, #LLM, #open source, #GLM, #context window

OpenAI 发布生物防御 AI 工具 Rosalind ⭐️ 9.0/10

OpenAI 发布了 Rosalind 生物防御计划，向可信开发者提供 GPT-Rosalind 模型，用于构建生物防御应用。这标志着将前沿 AI 应用于公共健康安全的重要一步，可能加速大流行防范。 GPT-Rosalind 是一个针对生命科学领域的受限推理模型，仅向经过审查的开发者及联邦机构开放。

rss · AIHOT 日报 · Jun 1, 17:58AIHOT 日报

参考链接

标签: #OpenAI, #biodefense, #AI, #healthcare, #security

AlphaProof Nexus 攻克 56 年数学难题 ⭐️ 9.0/10

谷歌 DeepMind 的 AlphaProof Nexus 自主解决了两个悬置 56 年的 Erdős 问题以及其他七个问题，每个证明成本仅几百美元。这标志着 AI 首次以极低成本解决数十年的开放问题，预示着自动定理证明的范式转变。 AlphaProof Nexus 使用 Lean 编译器自动验证每个证明步骤，在 353 个尝试问题中成功率为 2.5%。

rss · AIHOT 日报 · May 27, 00:00AIHOT 日报

背景: Erdős 问题是数学家保罗·埃尔德什编制的组合数学与数论难题集。AlphaProof 是 DeepMind 的强化学习框架，能生成由 Lean 证明助手验证的形式化证明。

参考链接

标签: #AI, #Google, #Mathematics, #Breakthrough, #AlphaProof

RubyLLM: 全 AI 提供商统一 Ruby 框架 ⭐️ 8.0/10

RubyLLM 是一个开源 Ruby gem，为 OpenAI、Anthropic、Gemini 等多个 AI 提供商提供统一接口。它为 Ruby 开发者简化了 AI 集成，减少样板代码，支持快速开发 AI 应用。该 gem 仅依赖 Faraday、Zeitwerk 和 Marcel 三个库，非常轻量。

hackernews · doener · Jun 24, 14:41 · 社区讨论T2 社区与开源

背景: Ruby 开发者此前缺乏统一的 AI API 框架，需要为每个提供商使用单独的 SDK。RubyLLM 通过一致的接口填补了这一空白。

参考链接

社区讨论: 用户称赞其易用性，但指出缓存问题及早期版本缺少原生响应 API 支持。

标签: #Ruby, #AI, #LLM, #framework, #open-source

Bunny DNS 免费：无查询费，支持最多 500 个域名 ⭐️ 8.0/10

Bunny DNS 取消了所有查询费用，现在为每个账户免费提供最多 500 个域名的 DNS 托管服务。这使 Bunny DNS 成为一个有竞争力的欧盟 DNS 提供商，特别是对于注重隐私的用户来说，可以作为 Cloudflare 的替代方案。免费层包括智能记录和健康监控，无查询限制或功能限制。

hackernews · dabinat · Jun 24, 08:50 · 社区讨论T2 社区与开源

背景: 许多 DNS 提供商按查询量收费（例如每百万次查询 0.10 美元）。Bunny DNS 之前也有此类费用，现已完全取消。

参考链接

社区讨论: 用户称赞 Bunny DNS 是欧盟所需的美国提供商（如 Cloudflare）的替代品，但也有人担心 Bunny 其他产品可能产生意外账单。

标签: #DNS, #free hosting, #Cloudflare alternative, #EU tech, #Bunny DNS

卡马克反思早期对 id Software 施压过大的失误 ⭐️ 8.0/10

约翰·卡马克承认在 id Software 早期对团队施压过大，未能随着公司成熟调整工作强度。来自传奇开发者的罕见领导力反思，对创业文化和可持续工程有启示意义。卡马克特别指出“成熟的公司需要更多松弛”，创业强度会耗尽员工精力。

hackernews · shadowtree · Jun 24, 15:56 · 社区讨论T2 社区与开源

社区讨论: 评论者争论 Quake 时期的高强度是否值得，称赞游戏但同时指出了对团队的消耗。

标签: #John Carmack, #game development, #startup culture, #leadership, #software engineering

Gemini 3.5 Flash 获得计算机使用能力 ⭐️ 8.0/10

DeepMind 宣布 Gemini 3.5 Flash 现在可以交互图形用户界面，自动执行点击和打字等任务。这使 AI 代理能够直接控制软件，可能改变各行业的自动化方式。该模型利用视觉和推理来理解屏幕内容并相应执行操作。

rss · DeepMind Blog · Jun 24, 16:30T1 官方实验室

背景: 计算机使用能力允许 AI 像人类一样交互 GUI，类似于 OpenAI 的 Computer-Using Agent。这从文本扩展到了视觉界面。

参考链接

标签: #AI, #Gemini, #DeepMind, #computer use, #LLM

Introducing the FFASR Leaderboard: Benchmarking ASR in the Real World ⭐️ 8.0/10

Hugging Face launches the FFASR Leaderboard to benchmark automatic speech recognition systems under realistic, noisy conditions.

rss · Hugging Face Blog · Jun 24, 00:00T1 官方实验室

标签: #ASR, #benchmark, #leaderboard, #speech recognition, #Hugging Face

NSA 失去 Anthropic Mythos 系统访问权 ⭐️ 8.0/10

NSA 因纠纷失去对 Anthropic 神话系统的访问权限。凸显 AI 发展与国家安全之间的紧张关系。

rss · AIHOT 精选 · Jun 24, 19:08AIHOT 精选

背景: Mythos 是 Anthropic 开发的专有 AI 安全评估系统，曾被 NSA 用于国家安全目的。

标签: #AI, #Anthropic, #NSA, #national security, #dispute

思考即回忆：推理如何解锁 LLM 中的参数化知识 ⭐️ 8.0/10

Google 研究发现，思维链推理能通过将推理令牌作为计算缓冲并利用事实启动效应，帮助大语言模型回忆起简单事实。这一发现揭示了推理提升事实检索的新机制，表明 LLM 在推理过程中能更好地访问内部知识。 Pass@k 指标证实正确事实存在于输出分布中，即使模型最初无法直接回答。

rss · AIHOT 精选 · Jun 24, 17:05AIHOT 精选

背景: 参数化知识指存储在模型权重中的事实。思维链推理生成中间步骤。论文解释了两种机制：计算缓冲允许隐藏状态操作，事实启动激活相关知识。

标签: #LLM, #reasoning, #parametric knowledge, #chain-of-thought, #Google Research

NeMo AutoModel：一行代码加速 MoE 微调 3.4 倍 ⭐️ 8.0/10

NVIDIA NeMo AutoModel 通过一行代码将 MoE 微调速度提升 3.4 倍，内存减少 32%。使以前因内存不足而崩溃的大型 MoE 模型微调成为可能。在 128 张 H100 GPU 上实现，专家并行度 64，用于 Nemotron 3 Ultra 550B 模型。

rss · AIHOT 精选 · Jun 24, 16:00AIHOT 精选

标签: #NVIDIA, #MoE, #fine-tuning, #expert parallelism, #Transformer

DFlash：块扩散草稿模型实现 15 倍吞吐量提升 ⭐️ 8.0/10

加州大学圣地亚哥分校的 DFlash 通过一次前向推理生成整块 token，在 NVIDIA Blackwell 上实现最高 15 倍吞吐量提升。这一突破显著加速了大语言模型推理，使大型模型更适用于实时应用。 DFlash 将目标模型多层隐藏特征注入草稿模型每一层的 Key-Value 投影中。

rss · AIHOT 精选 · Jun 24, 07:21AIHOT 精选

背景: 投机解码使用小型草稿模型生成 token，再由目标模型并行验证。DFlash 将其扩展为一次生成整块 token。

标签: #speculative decoding, #LLM inference, #NVIDIA Blackwell, #block diffusion, #model acceleration

ChatGPT 推出双向语音模型 Bidi 1 ⭐️ 8.0/10

OpenAI 开始测试 Bidi 1，这是一款双向语音模型，允许用户在对话中打断并发出新指令。此升级使语音交互更自然高效，支持实时打断和指令切换。 Bidi 1 位于模型选择器中，与标准语音和高级语音并列，目前处于有限测试阶段。

rss · AIHOT 精选 · Jun 24, 04:34AIHOT 精选

背景: 双向语音意味着模型可以同时说话和倾听，允许用户在对话中途打断并更改指令，而以往的语音系统需要等待停顿。

标签: #OpenAI, #ChatGPT, #voice AI, #bidirectional model, #Bidi

附录

以下内容来自 AIHOT 日报，每天 08:00 北京时间发布

AI HOT 日报 · 2026-06-24 — FastWan-QAD：单卡 5090 上 1.8 秒生成 5 秒视频 FastWan-QAD：单卡 5090 上 1.8 秒生成 5 秒视频 — 点击查看完整日报
AI HOT 日报 · 2026-06-23 — PP-OCRv6 on Hugging Face：50 语言 OCR，参数规模 1.5M 至 34.5M PP-OCRv6 on Hugging Face：50 语言 OCR，参数规模 1.5M 至 34.5M — 点击查看完整日报
AI HOT 日报 · 2026-06-22 — 美团 tabbit 国际版免费接入 GPT-5.5/Claude Opus 4.8 等旗舰模型美团 tabbit 国际版免费接入 GPT-5.5/Claude Opus 4.8 等旗舰模型 — 点击查看完整日报
AI HOT 日报 · 2026-06-21 — 微软双向转售 GPT 与 DeepSeek 成全球最大 AI 中间商微软双向转售 GPT 与 DeepSeek 成全球最大 AI 中间商 — 点击查看完整日报
AI HOT 日报 · 2026-06-20 — 阿里开源向量数据库 Zvec，UCSD 黄碧薇教授提出因果 AI 第四代范式阿里开源向量数据库 Zvec，UCSD 黄碧薇教授提出因果 AI 第四代范式 — 点击查看完整日报
AI HOT 日报 · 2026-06-19 — 首个统一科学大模型 LOGOS 正式开源首个统一科学大模型 LOGOS 正式开源 — 点击查看完整日报
AI HOT 日报 · 2026-06-18 — MolmoMotion：语言引导的 3D 运动预测模型 MolmoMotion：语言引导的 3D 运动预测模型 — 点击查看完整日报
AI HOT 日报 · 2026-06-17 — Cartesia 发布 Sonic 3.5 与 Ink 2 实时语音模型 Cartesia 发布 Sonic 3.5 与 Ink 2 实时语音模型 — 点击查看完整日报
AI HOT 日报 · 2026-06-16 — MiniMax 开源 M3 模型权重及 MSA 技术论文 MiniMax 开源 M3 模型权重及 MSA 技术论文 — 点击查看完整日报
AI HOT 日报 · 2026-06-15 — Anthropic 暂停新模型访问，印度辩论 AI 未来 Anthropic 暂停新模型访问，印度辩论 AI 未来 — 点击查看完整日报
AI HOT 日报 · 2026-06-14 — 智谱 GLM-5.2 全量开放，支持 1M 上下文且下周开源智谱 GLM-5.2 全量开放，支持 1M 上下文且下周开源 — 点击查看完整日报
AI HOT 日报 · 2026-06-13 — MiniMax M3 开源权重模型发布，已上架 HuggingFace MiniMax M3 开源权重模型发布，已上架 HuggingFace — 点击查看完整日报
AI HOT 日报 · 2026-06-12 — Gemini Omni Flash 视频任务达 SOTA Gemini Omni Flash 视频任务达 SOTA — 点击查看完整日报
AI HOT 日报 · 2026-06-11 — DiffusionGemma：文本生成速度提升 4 倍的开源扩散模型 DiffusionGemma：文本生成速度提升 4 倍的开源扩散模型 — 点击查看完整日报
AI HOT 日报 · 2026-06-10 — Claude Fable 5 和 Claude Mythos 5 Claude Fable 5 和 Claude Mythos 5 — 点击查看完整日报
AI HOT 日报 · 2026-06-09 — 小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s，单台 8-GPGPU 节点运行 1T MoE 模型小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s，单台 8-GPGPU 节点运行 1T MoE 模型 — 点击查看完整日报
AI HOT 日报 · 2026-06-08 — Harness-1：基于强化学习训练的有状态搜索 20B 检索子智能体 Harness-1：基于强化学习训练的有状态搜索 20B 检索子智能体 — 点击查看完整日报
AI HOT 日报 · 2026-06-07 — GitHub 开源 Spec Kit 工具包，用产品规范引导 AI 编码 GitHub 开源 Spec Kit 工具包，用产品规范引导 AI 编码 — 点击查看完整日报
AI HOT 日报 · 2026-06-06 — Riverflow 2.5：可控制评分标准的图像模型 Riverflow 2.5：可控制评分标准的图像模型 — 点击查看完整日报
AI HOT 日报 · 2026-06-05 — Nemotron 3.5 Content Safety：面向全球企业 AI 的可定制多模态安全 Nemotron 3.5 Content Safety：面向全球企业 AI 的可定制多模态安全 — 点击查看完整日报
AI HOT 日报 · 2026-06-04 — Grok Imagine 1.5 预览版发布 Grok Imagine 1.5 预览版发布 — 点击查看完整日报
AI HOT 日报 · 2026-06-03 — 微软首款高级推理 AI 模型 MAI-Thinking-1 发布微软首款高级推理 AI 模型 MAI-Thinking-1 发布 — 点击查看完整日报
AI HOT 日报 · 2026-06-02 — MiniMax M3：前沿编码、100 万 token 上下文与原生多模态一体模型 MiniMax M3：前沿编码、100 万 token 上下文与原生多模态一体模型 — 点击查看完整日报
AI HOT 日报 · 2026-06-01 — OpenAI 发布生物防御 AI 工具 Rosalind OpenAI 发布生物防御 AI 工具 Rosalind — 点击查看完整日报
AI HOT 日报 · 2026-05-31 — Nano Banana Pro 与 Nano Banana 2 正式发布 Nano Banana Pro 与 Nano Banana 2 正式发布 — 点击查看完整日报
AI HOT 日报 · 2026-05-30 — OpenAI 推出实时翻译模型，支持 70+语言输入 OpenAI 推出实时翻译模型，支持 70+语言输入 — 点击查看完整日报
AI HOT 日报 · 2026-05-29 — Claude Opus 4.8 发布：在编码、智能体技能与推理方面实现全面升级 Claude Opus 4.8 发布：在编码、智能体技能与推理方面实现全面升级 — 点击查看完整日报
AI HOT 日报 · 2026-05-28 — Runway 推出 Model Context Protocol 服务器 Runway 推出 Model Context Protocol 服务器 — 点击查看完整日报
AI HOT 日报 · 2026-05-27 — 谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题 — 点击查看完整日报
AI HOT 日报 · 2026-05-26 — 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN — 点击查看完整日报

OpenAI 推出与博通合作的自研 Jalapeno AI 芯片 ⭐️ 9.0/10

Qwen-AgentWorld 开源：让 Agent 学会”先预测，再行动” ⭐️ 9.0/10

大型研究发现 AI 招聘工具歧视黑人和亚裔申请者 ⭐️ 9.0/10

Confucius4-TTS：开源 14 语种无口音语音克隆模型 ⭐️ 9.0/10

智谱发布 GLM-5.2，支持 1M 上下文，下周开源 ⭐️ 9.0/10

OpenAI 发布生物防御 AI 工具 Rosalind ⭐️ 9.0/10

AlphaProof Nexus 攻克 56 年数学难题 ⭐️ 9.0/10

RubyLLM: 全 AI 提供商统一 Ruby 框架 ⭐️ 8.0/10

Bunny DNS 免费：无查询费，支持最多 500 个域名 ⭐️ 8.0/10

卡马克反思早期对 id Software 施压过大的失误 ⭐️ 8.0/10

Gemini 3.5 Flash 获得计算机使用能力 ⭐️ 8.0/10

Introducing the FFASR Leaderboard: Benchmarking ASR in the Real World ⭐️ 8.0/10

NSA 失去 Anthropic Mythos 系统访问权 ⭐️ 8.0/10

思考即回忆：推理如何解锁 LLM 中的参数化知识 ⭐️ 8.0/10

NeMo AutoModel：一行代码加速 MoE 微调 3.4 倍 ⭐️ 8.0/10

DFlash：块扩散草稿模型实现 15 倍吞吐量提升 ⭐️ 8.0/10

ChatGPT 推出双向语音模型 Bidi 1 ⭐️ 8.0/10

附录

选择日期

选择分类