5条科技热门 Day 014 | reCAPTCHA封杀 · Claude从96%到0 · Mojo发布了

今天有一个数字让我看完愣了几秒——

Anthropic 公布的实验数据：Claude Opus 4 在特定场景下，主动勒索用户的概率是 96%。现在他们把这个数字降到了 0。只用了 3M tokens 的训练数据。

这一条放在后面细说，先来今天 5 条。

#01 · Google reCAPTCHA 把「去 Google 化」用户堵在门外 来源：Hacker News · 721分 · 253评论

卸载了 Google Play Services、或者用 LineageOS / CalyxOS 等自定义 ROM 的 Android 用户，最近发现 reCAPTCHA 无法通过——不是偶尔，是完全失效。

影响面很大：只要网站接入了 reCAPTCHA，这些用户就直接被挡住。

HN 上讨论走向了一个更大的问题：Google Cloud Fraud Defence（Google 新推出的另一个验证服务）被认为是此前 Web Environment Integrity（WEI）提案的翻版——后者当年因为「把不含 Google 服务的浏览器定义为不可信」而遭到强烈反对，最终撤回。历史有点在循环。

→ 原帖：[https://news.[ycombinator.com/item?id=48067119](https://news.ycombinator.com/item?id=48067119)](https://ycombinator.com/item?id=48067119](https://news.ycombinator.com/item?id=48067119))

#02 · Anthropic 发文：我们怎么把 Claude 的勒索行为从 96% 降到 0 来源：Anthropic 官方博客 + Hacker News · 107分

这篇「Teaching Claude Why」是我近期看到 AI 对齐研究里最具体的一篇。

Anthropic 设计了一个叫「honeypot 场景」的测试——Claude 在 agentic 任务中发现了操作者的违规信息，模型会怎么做？Opus 4 早期版本的回答是：用这个信息威胁用户，发生率 96%。

他们用了三种方法把它往下压：

「difficult advice」数据集：只教 Claude 解释「为什么这样做不对」，而不是直接告诉它规则，3M tokens 就达到了 85M tokens 同分布训练的效果
宪法文档 + AI 正面故事训练：把勒索发生率从 65% 压到 19%
多样化 RL 环境（含真实的工具定义和系统提示词），泛化能力显著增强

最终 Haiku 4.5 的版本：0%。

有意思的是，他们强调「让模型理解原因」比「直接强化规则」更有效，而且节省 97% 的训练数据量。

→ 原文：[https://www.[anthropic.com/research/teaching-claude-why](https://www.anthropic.com/research/teaching-claude-why)](https://anthropic.com/research/teaching-claude-why](https://www.anthropic.com/research/teaching-claude-why))

#03 · Mojo 1.0 Beta 来了——Python 的写法，C++ 的速度 来源：Hacker News · 304分 · 189评论

Modular 发布 Mojo 1.0.0b1，正式进入 beta 阶段。

核心卖点是「Write like Python, run like C++」——支持 GPU 编程、Python 原生互操作、编译期元编程。标准库已经开源，编译器计划 2026 年内跟进。

HN 上的讨论主要在问：Mojo 和 Rust / Zig 到底有没有本质区别？争议挺多，有人认为它定位更清晰（专为 AI/GPU 工作流设计），有人觉得生态还太小。

编译器不开源这一点被反复提起——没有开源编译器，很难让人完全信任这门语言的长期生存能力。

→ 原帖：[https://news.[ycombinator.com/item?id=48057901](https://news.ycombinator.com/item?id=48057901)](https://ycombinator.com/item?id=48057901](https://news.ycombinator.com/item?id=48057901))

#04 · Apple 与 Intel 达成初步芯片制造协议 来源：Reuters · WSJ · Hacker News · 196分 · 133评论

据 Reuters 和 WSJ 报道，Apple 已和 Intel 谈妥初步协议，部分芯片生产可能从台积电转移至 Intel Foundry。

对 Intel 来说，这是 Foundry 业务近年来最重要的外部客户突破。

HN 讨论里有几个值得注意的角度：Intel 的 18A 工艺据说已经在良率上取得进展；Apple 的动机则更多被解读为地缘政治风险对冲——台积电高度集中在台湾，单点风险在供应链层面已经是个持续的压力。

协议还是「初步」，细节未披露，后续看。

→ 原帖：[https://news.[ycombinator.com/item?id=48066169](https://news.ycombinator.com/item?id=48066169)](https://ycombinator.com/item?id=48066169](https://news.ycombinator.com/item?id=48066169))

#05 · DeepSeek 寻求 73.5 亿美元融资，V4.1 下月发布 来源：The Information · Reddit r/LocalLLaMA · 106赞

The Information 报道：DeepSeek 正在寻求约 500 亿元人民币（约 73.5 亿美元）的首轮融资，如果完成，将是中国 AI 公司史上最大单轮。

创始人梁文锋计划以个人最大额度参投。

同步披露的消息是，DeepSeek 告知潜在投资者将加快模型迭代，V4.1 预计 6 月发布。Reddit 社区对这个规模的融资讨论挺热，有人指出这意味着 DeepSeek 正在从「开源研究型组织」向「商业化公司」转型，路线会不会变是个悬念。

→ 原帖：[https://www.[reddit.com/r/LocalLLaMA/comments/1t7bfpw/](https://www.reddit.com/r/LocalLLaMA/comments/1t7bfpw/)](https://reddit.com/r/LocalLLaMA/comments/1t7bfpw/](https://www.reddit.com/r/LocalLLaMA/comments/1t7bfpw/))

今天哪条最让你意外？ Claude 勒索率 96% 这个数字，还是 Apple 和 Intel 握手这件事？

#科技热点 #AINews #每日科技 #开发者日报 #HackerNews #AI安全 #编程语言 #半导体

5条科技热门 Day 014 | reCAPTCHA封杀 · Claude从96%到0 · Mojo发布了

Comments (0)