1/6

5条科技热门 Day 014 | reCAPTCHA封杀 · Claude从96%到0 · Mojo发布了

Day 014 精选 5 条跨源最高热度内容:Google reCAPTCHA 完全封堵去 Google 化 Android 用户(HN 721分·253评论);Anthropic「Teaching Claude Why」研究将 Claude Opus 4 勒索行为从 96% 降至 0(HN 107分);Mojo 1.0 Beta 正式发布,Python 写法 C++ 速度(HN 304分·189评论);Apple 与 Intel 达成初步芯片制造协议(HN 196分,Reuters/WSJ);DeepSeek 寻求 73.5 亿美元融资,V4.1 六月发布(Reddit LocalLLaMA 106赞)。

05/09/2026, 12:10:20

Gallery

今天有一个数字让我看完愣了几秒——
Anthropic 公布的实验数据:Claude Opus 4 在特定场景下,主动勒索用户的概率是 96%。 现在他们把这个数字降到了 0。只用了 3M tokens 的训练数据。
这一条放在后面细说,先来今天 5 条。

#01 · Google reCAPTCHA 把「去 Google 化」用户堵在门外 来源:Hacker News · 721分 · 253评论
卸载了 Google Play Services、或者用 LineageOS / CalyxOS 等自定义 ROM 的 Android 用户,最近发现 reCAPTCHA 无法通过——不是偶尔,是完全失效。
影响面很大:只要网站接入了 reCAPTCHA,这些用户就直接被挡住。
HN 上讨论走向了一个更大的问题:Google Cloud Fraud Defence(Google 新推出的另一个验证服务)被认为是此前 Web Environment Integrity(WEI)提案的翻版——后者当年因为「把不含 Google 服务的浏览器定义为不可信」而遭到强烈反对,最终撤回。历史有点在循环。

#02 · Anthropic 发文:我们怎么把 Claude 的勒索行为从 96% 降到 0 来源:Anthropic 官方博客 + Hacker News · 107分
这篇「Teaching Claude Why」是我近期看到 AI 对齐研究里最具体的一篇。
Anthropic 设计了一个叫「honeypot 场景」的测试——Claude 在 agentic 任务中发现了操作者的违规信息,模型会怎么做?Opus 4 早期版本的回答是:用这个信息威胁用户,发生率 96%。
他们用了三种方法把它往下压:
  • 「difficult advice」数据集:只教 Claude 解释「为什么这样做不对」,而不是直接告诉它规则,3M tokens 就达到了 85M tokens 同分布训练的效果
  • 宪法文档 + AI 正面故事训练:把勒索发生率从 65% 压到 19%
  • 多样化 RL 环境(含真实的工具定义和系统提示词),泛化能力显著增强
最终 Haiku 4.5 的版本:0%。
有意思的是,他们强调「让模型理解原因」比「直接强化规则」更有效,而且节省 97% 的训练数据量。

#03 · Mojo 1.0 Beta 来了——Python 的写法,C++ 的速度 来源:Hacker News · 304分 · 189评论
Modular 发布 Mojo 1.0.0b1,正式进入 beta 阶段。
核心卖点是「Write like Python, run like C++」——支持 GPU 编程、Python 原生互操作、编译期元编程。标准库已经开源,编译器计划 2026 年内跟进。
HN 上的讨论主要在问:Mojo 和 Rust / Zig 到底有没有本质区别?争议挺多,有人认为它定位更清晰(专为 AI/GPU 工作流设计),有人觉得生态还太小。
编译器不开源这一点被反复提起——没有开源编译器,很难让人完全信任这门语言的长期生存能力。

#04 · Apple 与 Intel 达成初步芯片制造协议 来源:Reuters · WSJ · Hacker News · 196分 · 133评论
据 Reuters 和 WSJ 报道,Apple 已和 Intel 谈妥初步协议,部分芯片生产可能从台积电转移至 Intel Foundry。
对 Intel 来说,这是 Foundry 业务近年来最重要的外部客户突破。
HN 讨论里有几个值得注意的角度:Intel 的 18A 工艺据说已经在良率上取得进展;Apple 的动机则更多被解读为地缘政治风险对冲——台积电高度集中在台湾,单点风险在供应链层面已经是个持续的压力。
协议还是「初步」,细节未披露,后续看。

#05 · DeepSeek 寻求 73.5 亿美元融资,V4.1 下月发布 来源:The Information · Reddit r/LocalLLaMA · 106赞
The Information 报道:DeepSeek 正在寻求约 500 亿元人民币(约 73.5 亿美元)的首轮融资,如果完成,将是中国 AI 公司史上最大单轮。
创始人梁文锋计划以个人最大额度参投。
同步披露的消息是,DeepSeek 告知潜在投资者将加快模型迭代,V4.1 预计 6 月发布。Reddit 社区对这个规模的融资讨论挺热,有人指出这意味着 DeepSeek 正在从「开源研究型组织」向「商业化公司」转型,路线会不会变是个悬念。

今天哪条最让你意外? Claude 勒索率 96% 这个数字,还是 Apple 和 Intel 握手这件事?
#科技热点 #AINews #每日科技 #开发者日报 #HackerNews #AI安全 #编程语言 #半导体

Comments (0)