从 110 条内容中筛选出 17 条重要资讯
- OpenAI 推出与博通合作的自研 Jalapeno AI 芯片 ⭐️ 9.0/10
- Qwen-AgentWorld 开源:让 Agent 学会”先预测,再行动” ⭐️ 9.0/10
- 大型研究发现 AI 招聘工具歧视黑人和亚裔申请者 ⭐️ 9.0/10
- Confucius4-TTS:开源 14 语种无口音语音克隆模型 ⭐️ 9.0/10
- 智谱发布 GLM-5.2,支持 1M 上下文,下周开源 ⭐️ 9.0/10
- OpenAI 发布生物防御 AI 工具 Rosalind ⭐️ 9.0/10
- AlphaProof Nexus 攻克 56 年数学难题 ⭐️ 9.0/10
- RubyLLM: 全 AI 提供商统一 Ruby 框架 ⭐️ 8.0/10
- Bunny DNS 免费:无查询费,支持最多 500 个域名 ⭐️ 8.0/10
- 卡马克反思早期对 id Software 施压过大的失误 ⭐️ 8.0/10
- Gemini 3.5 Flash 获得计算机使用能力 ⭐️ 8.0/10
- Introducing the FFASR Leaderboard: Benchmarking ASR in the Real World ⭐️ 8.0/10
- NSA 失去 Anthropic Mythos 系统访问权 ⭐️ 8.0/10
- 思考即回忆:推理如何解锁 LLM 中的参数化知识 ⭐️ 8.0/10
- NeMo AutoModel:一行代码加速 MoE 微调 3.4 倍 ⭐️ 8.0/10
- DFlash:块扩散草稿模型实现 15 倍吞吐量提升 ⭐️ 8.0/10
- ChatGPT 推出双向语音模型 Bidi 1 ⭐️ 8.0/10
OpenAI 推出与博通合作的自研 Jalapeno AI 芯片 ⭐️ 9.0/10
OpenAI 宣布了其首款自研 AI 推理芯片 Jalapeno,与博通合作开发,并由台积电制造。 这标志着 OpenAI 进入定制芯片领域,可能减少对英伟达 GPU 进行推理的依赖。 该芯片使用 OpenAI 自己的模型在九个月内设计完成,并针对大型语言模型推理进行了优化。
hackernews · TechCrunch · Jun 24, 17:47 · 社区讨论T2 社区与开源
背景: 推理芯片专门用于运行已训练好的模型,与训练芯片不同。OpenAI 的定制芯片旨在提高其 ChatGPT 等服务的效率。
参考链接
社区讨论: 一些评论者对 AI 加速芯片设计的说法表示怀疑,而另一些人则赞扬了台积电的作用,并讨论了潜在的效率提升。
标签: #AI chips, #OpenAI, #Broadcom, #hardware, #inference
Qwen-AgentWorld 开源:让 Agent 学会”先预测,再行动” ⭐️ 9.0/10
Tongyi Qianwen open-sources Qwen-AgentWorld, a state-of-the-art native language world model for agents that outperforms GPT-5.4 and Claude Opus 4.8.
rss · AIHOT 精选 · Jun 24, 03:32AIHOT 精选
标签: #AI, #language models, #agents, #reinforcement learning, #open-source
大型研究发现 AI 招聘工具歧视黑人和亚裔申请者 ⭐️ 9.0/10
斯坦福一项覆盖 340 万申请者的研究发现,AI 招聘工具系统性拒绝了 26%的黑人和 15%的亚裔候选人,相比之下白人申请者被拒率更低。 这种广泛存在的偏见影响了数百万求职者,破坏了招聘的公平性,并呼吁对算法工具进行独立监管。 该研究分析了 150 家雇主使用同一第三方供应商算法的 400 万份申请,形成了算法单一文化。
rss · AIHOT 精选 · Jun 23, 21:48AIHOT 精选
背景: 算法单一文化指许多雇主依赖同一算法供应商,导致相关拒信和系统性排斥某些群体。
标签: #AI bias, #algorithmic fairness, #hiring, #ethics, #research
Confucius4-TTS:开源 14 语种无口音语音克隆模型 ⭐️ 9.0/10
开源 Confucius4-TTS 实现跨语种无口音语音克隆,仅需 3 秒音频,支持 14 种语言。 这一突破大幅降低了实现逼真多语种语音克隆的门槛。 相似度超过 85%,任务准确率达 97%,并支持音频提示情感克隆。
rss · AIHOT 精选 · Jun 23, 11:00AIHOT 精选
背景: Flow Matching 是一种生成建模范式,结合了连续规范化流和扩散模型的特性。ECAPA-TDNN 是一种说话人嵌入网络,可提取鲁棒的说话人特征。
参考链接
标签: #TTS, #voice cloning, #open-source, #AI, #multilingual
智谱发布 GLM-5.2,支持 1M 上下文,下周开源 ⭐️ 9.0/10
智谱 AI 全量发布 GLM-5.2 模型,支持 100 万 token 上下文窗口,并宣布将于下周开源。 这是开源大语言模型的一个重要里程碑,超长上下文窗口使得处理整个代码库或长文档成为可能。 该模型预计将采用宽松的开源许可证发布,延续智谱 AI 的开源传统。
rss · AIHOT 日报 · Jun 14, 00:00AIHOT 日报
背景: GLM(通用语言模型)是智谱 AI(一家中国人工智能公司)开发的一系列大语言模型。100 万 token 的上下文窗口使得模型能够处理极长序列,例如整本书籍或大量的对话历史。
参考链接
标签: #AI, #LLM, #open source, #GLM, #context window
OpenAI 发布生物防御 AI 工具 Rosalind ⭐️ 9.0/10
OpenAI 发布了 Rosalind 生物防御计划,向可信开发者提供 GPT-Rosalind 模型,用于构建生物防御应用。 这标志着将前沿 AI 应用于公共健康安全的重要一步,可能加速大流行防范。 GPT-Rosalind 是一个针对生命科学领域的受限推理模型,仅向经过审查的开发者及联邦机构开放。
rss · AIHOT 日报 · Jun 1, 17:58AIHOT 日报
参考链接
标签: #OpenAI, #biodefense, #AI, #healthcare, #security
AlphaProof Nexus 攻克 56 年数学难题 ⭐️ 9.0/10
谷歌 DeepMind 的 AlphaProof Nexus 自主解决了两个悬置 56 年的 Erdős 问题以及其他七个问题,每个证明成本仅几百美元。 这标志着 AI 首次以极低成本解决数十年的开放问题,预示着自动定理证明的范式转变。 AlphaProof Nexus 使用 Lean 编译器自动验证每个证明步骤,在 353 个尝试问题中成功率为 2.5%。
rss · AIHOT 日报 · May 27, 00:00AIHOT 日报
背景: Erdős 问题是数学家保罗·埃尔德什编制的组合数学与数论难题集。AlphaProof 是 DeepMind 的强化学习框架,能生成由 Lean 证明助手验证的形式化证明。
参考链接
标签: #AI, #Google, #Mathematics, #Breakthrough, #AlphaProof
RubyLLM: 全 AI 提供商统一 Ruby 框架 ⭐️ 8.0/10
RubyLLM 是一个开源 Ruby gem,为 OpenAI、Anthropic、Gemini 等多个 AI 提供商提供统一接口。 它为 Ruby 开发者简化了 AI 集成,减少样板代码,支持快速开发 AI 应用。 该 gem 仅依赖 Faraday、Zeitwerk 和 Marcel 三个库,非常轻量。
hackernews · doener · Jun 24, 14:41 · 社区讨论T2 社区与开源
背景: Ruby 开发者此前缺乏统一的 AI API 框架,需要为每个提供商使用单独的 SDK。RubyLLM 通过一致的接口填补了这一空白。
参考链接
社区讨论: 用户称赞其易用性,但指出缓存问题及早期版本缺少原生响应 API 支持。
标签: #Ruby, #AI, #LLM, #framework, #open-source
Bunny DNS 免费:无查询费,支持最多 500 个域名 ⭐️ 8.0/10
Bunny DNS 取消了所有查询费用,现在为每个账户免费提供最多 500 个域名的 DNS 托管服务。 这使 Bunny DNS 成为一个有竞争力的欧盟 DNS 提供商,特别是对于注重隐私的用户来说,可以作为 Cloudflare 的替代方案。 免费层包括智能记录和健康监控,无查询限制或功能限制。
hackernews · dabinat · Jun 24, 08:50 · 社区讨论T2 社区与开源
背景: 许多 DNS 提供商按查询量收费(例如每百万次查询 0.10 美元)。Bunny DNS 之前也有此类费用,现已完全取消。
社区讨论: 用户称赞 Bunny DNS 是欧盟所需的美国提供商(如 Cloudflare)的替代品,但也有人担心 Bunny 其他产品可能产生意外账单。
标签: #DNS, #free hosting, #Cloudflare alternative, #EU tech, #Bunny DNS
卡马克反思早期对 id Software 施压过大的失误 ⭐️ 8.0/10
约翰·卡马克承认在 id Software 早期对团队施压过大,未能随着公司成熟调整工作强度。 来自传奇开发者的罕见领导力反思,对创业文化和可持续工程有启示意义。 卡马克特别指出“成熟的公司需要更多松弛”,创业强度会耗尽员工精力。
hackernews · shadowtree · Jun 24, 15:56 · 社区讨论T2 社区与开源
社区讨论: 评论者争论 Quake 时期的高强度是否值得,称赞游戏但同时指出了对团队的消耗。
标签: #John Carmack, #game development, #startup culture, #leadership, #software engineering
Gemini 3.5 Flash 获得计算机使用能力 ⭐️ 8.0/10
DeepMind 宣布 Gemini 3.5 Flash 现在可以交互图形用户界面,自动执行点击和打字等任务。 这使 AI 代理能够直接控制软件,可能改变各行业的自动化方式。 该模型利用视觉和推理来理解屏幕内容并相应执行操作。
rss · DeepMind Blog · Jun 24, 16:30T1 官方实验室
背景: 计算机使用能力允许 AI 像人类一样交互 GUI,类似于 OpenAI 的 Computer-Using Agent。这从文本扩展到了视觉界面。
标签: #AI, #Gemini, #DeepMind, #computer use, #LLM
Introducing the FFASR Leaderboard: Benchmarking ASR in the Real World ⭐️ 8.0/10
Hugging Face launches the FFASR Leaderboard to benchmark automatic speech recognition systems under realistic, noisy conditions.
rss · Hugging Face Blog · Jun 24, 00:00T1 官方实验室
标签: #ASR, #benchmark, #leaderboard, #speech recognition, #Hugging Face
NSA 失去 Anthropic Mythos 系统访问权 ⭐️ 8.0/10
NSA 因纠纷失去对 Anthropic 神话系统的访问权限。 凸显 AI 发展与国家安全之间的紧张关系。
rss · AIHOT 精选 · Jun 24, 19:08AIHOT 精选
背景: Mythos 是 Anthropic 开发的专有 AI 安全评估系统,曾被 NSA 用于国家安全目的。
标签: #AI, #Anthropic, #NSA, #national security, #dispute
思考即回忆:推理如何解锁 LLM 中的参数化知识 ⭐️ 8.0/10
Google 研究发现,思维链推理能通过将推理令牌作为计算缓冲并利用事实启动效应,帮助大语言模型回忆起简单事实。 这一发现揭示了推理提升事实检索的新机制,表明 LLM 在推理过程中能更好地访问内部知识。 Pass@k 指标证实正确事实存在于输出分布中,即使模型最初无法直接回答。
rss · AIHOT 精选 · Jun 24, 17:05AIHOT 精选
背景: 参数化知识指存储在模型权重中的事实。思维链推理生成中间步骤。论文解释了两种机制:计算缓冲允许隐藏状态操作,事实启动激活相关知识。
标签: #LLM, #reasoning, #parametric knowledge, #chain-of-thought, #Google Research
NeMo AutoModel:一行代码加速 MoE 微调 3.4 倍 ⭐️ 8.0/10
NVIDIA NeMo AutoModel 通过一行代码将 MoE 微调速度提升 3.4 倍,内存减少 32%。 使以前因内存不足而崩溃的大型 MoE 模型微调成为可能。 在 128 张 H100 GPU 上实现,专家并行度 64,用于 Nemotron 3 Ultra 550B 模型。
rss · AIHOT 精选 · Jun 24, 16:00AIHOT 精选
标签: #NVIDIA, #MoE, #fine-tuning, #expert parallelism, #Transformer
DFlash:块扩散草稿模型实现 15 倍吞吐量提升 ⭐️ 8.0/10
加州大学圣地亚哥分校的 DFlash 通过一次前向推理生成整块 token,在 NVIDIA Blackwell 上实现最高 15 倍吞吐量提升。 这一突破显著加速了大语言模型推理,使大型模型更适用于实时应用。 DFlash 将目标模型多层隐藏特征注入草稿模型每一层的 Key-Value 投影中。
rss · AIHOT 精选 · Jun 24, 07:21AIHOT 精选
背景: 投机解码使用小型草稿模型生成 token,再由目标模型并行验证。DFlash 将其扩展为一次生成整块 token。
标签: #speculative decoding, #LLM inference, #NVIDIA Blackwell, #block diffusion, #model acceleration
ChatGPT 推出双向语音模型 Bidi 1 ⭐️ 8.0/10
OpenAI 开始测试 Bidi 1,这是一款双向语音模型,允许用户在对话中打断并发出新指令。 此升级使语音交互更自然高效,支持实时打断和指令切换。 Bidi 1 位于模型选择器中,与标准语音和高级语音并列,目前处于有限测试阶段。
rss · AIHOT 精选 · Jun 24, 04:34AIHOT 精选
背景: 双向语音意味着模型可以同时说话和倾听,允许用户在对话中途打断并更改指令,而以往的语音系统需要等待停顿。
标签: #OpenAI, #ChatGPT, #voice AI, #bidirectional model, #Bidi
附录
以下内容来自 AIHOT 日报,每天 08:00 北京时间发布
-
AI HOT 日报 · 2026-06-24 — FastWan-QAD:单卡 5090 上 1.8 秒生成 5 秒视频 FastWan-QAD:单卡 5090 上 1.8 秒生成 5 秒视频 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-23 — PP-OCRv6 on Hugging Face:50 语言 OCR,参数规模 1.5M 至 34.5M PP-OCRv6 on Hugging Face:50 语言 OCR,参数规模 1.5M 至 34.5M — 点击查看完整日报
-
AI HOT 日报 · 2026-06-22 — 美团 tabbit 国际版免费接入 GPT-5.5/Claude Opus 4.8 等旗舰模型 美团 tabbit 国际版免费接入 GPT-5.5/Claude Opus 4.8 等旗舰模型 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-21 — 微软双向转售 GPT 与 DeepSeek 成全球最大 AI 中间商 微软双向转售 GPT 与 DeepSeek 成全球最大 AI 中间商 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-20 — 阿里开源向量数据库 Zvec,UCSD 黄碧薇教授提出因果 AI 第四代范式 阿里开源向量数据库 Zvec,UCSD 黄碧薇教授提出因果 AI 第四代范式 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-19 — 首个统一科学大模型 LOGOS 正式开源 首个统一科学大模型 LOGOS 正式开源 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-18 — MolmoMotion:语言引导的 3D 运动预测模型 MolmoMotion:语言引导的 3D 运动预测模型 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-17 — Cartesia 发布 Sonic 3.5 与 Ink 2 实时语音模型 Cartesia 发布 Sonic 3.5 与 Ink 2 实时语音模型 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-16 — MiniMax 开源 M3 模型权重及 MSA 技术论文 MiniMax 开源 M3 模型权重及 MSA 技术论文 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-15 — Anthropic 暂停新模型访问,印度辩论 AI 未来 Anthropic 暂停新模型访问,印度辩论 AI 未来 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-14 — 智谱 GLM-5.2 全量开放,支持 1M 上下文且下周开源 智谱 GLM-5.2 全量开放,支持 1M 上下文且下周开源 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-13 — MiniMax M3 开源权重模型发布,已上架 HuggingFace MiniMax M3 开源权重模型发布,已上架 HuggingFace — 点击查看完整日报
-
AI HOT 日报 · 2026-06-12 — Gemini Omni Flash 视频任务达 SOTA Gemini Omni Flash 视频任务达 SOTA — 点击查看完整日报
-
AI HOT 日报 · 2026-06-11 — DiffusionGemma:文本生成速度提升 4 倍的开源扩散模型 DiffusionGemma:文本生成速度提升 4 倍的开源扩散模型 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-10 — Claude Fable 5 和 Claude Mythos 5 Claude Fable 5 和 Claude Mythos 5 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-09 — 小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型 小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-08 — Harness-1:基于强化学习训练的有状态搜索 20B 检索子智能体 Harness-1:基于强化学习训练的有状态搜索 20B 检索子智能体 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-07 — GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码 GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-06 — Riverflow 2.5:可控制评分标准的图像模型 Riverflow 2.5:可控制评分标准的图像模型 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-05 — Nemotron 3.5 Content Safety:面向全球企业 AI 的可定制多模态安全 Nemotron 3.5 Content Safety:面向全球企业 AI 的可定制多模态安全 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-04 — Grok Imagine 1.5 预览版发布 Grok Imagine 1.5 预览版发布 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-03 — 微软首款高级推理 AI 模型 MAI-Thinking-1 发布 微软首款高级推理 AI 模型 MAI-Thinking-1 发布 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-02 — MiniMax M3:前沿编码、100 万 token 上下文与原生多模态一体模型 MiniMax M3:前沿编码、100 万 token 上下文与原生多模态一体模型 — 点击查看完整日报
-
AI HOT 日报 · 2026-06-01 — OpenAI 发布生物防御 AI 工具 Rosalind OpenAI 发布生物防御 AI 工具 Rosalind — 点击查看完整日报
-
AI HOT 日报 · 2026-05-31 — Nano Banana Pro 与 Nano Banana 2 正式发布 Nano Banana Pro 与 Nano Banana 2 正式发布 — 点击查看完整日报
-
AI HOT 日报 · 2026-05-30 — OpenAI 推出实时翻译模型,支持 70+语言输入 OpenAI 推出实时翻译模型,支持 70+语言输入 — 点击查看完整日报
-
AI HOT 日报 · 2026-05-29 — Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级 Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级 — 点击查看完整日报
-
AI HOT 日报 · 2026-05-28 — Runway 推出 Model Context Protocol 服务器 Runway 推出 Model Context Protocol 服务器 — 点击查看完整日报
-
AI HOT 日报 · 2026-05-27 — 谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题 谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题 — 点击查看完整日报
-
AI HOT 日报 · 2026-05-26 — 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN — 点击查看完整日报