5条科技热门 Day 009 | AI医疗 · 编程省钱 · 本地提速

急诊室 AI 比医生准，编程 agent 成本直降 17 倍，本地跑大模型两年快了 83 倍——今天这 5 条有点猛 👇

① OpenAI o1 急诊分诊胜率 67%（HN · 256分） Harvard 拿 76 名真实 ER 患者测试 o1，正确率 67%，挂号医生 50-55%。给 AI 更多患者信息后升到 82%，人类专家组才到 70-79%。研究者说这是「将重塑医学的技术」，不是夸张。

② DeepClaude：Claude 能力 + DeepSeek 价格（HN · 119分） Claude Code 代理循环接上 DeepSeek V4 Pro，成本直接砍掉 17 倍。开源，可自己部署，适合跑量大但预算紧的场景。 github.com/aattaran/deepclaude

③ ruvnet/ruflo GitHub 单日 +1,840 星 Claude 的多智能体编排平台，总星数 38,964。支持 Agent 群集、RAG 集成、原生 Claude Code / Codex，企业级架构。今天冲到 GitHub Trending 第二名。

④ 本地 LLM 两年速度 ×83（Reddit · r/LocalLLaMA） 2024 年：Llama 405B Q4，1.2 tok/s，急得人看表。现在：Qwen3.5-397B / DeepSeek V4 Flash，30-100 tok/s，同一台机器。这条帖子在 LocalLLaMA 爆了，评论区全是「值了」。

⑤ Grok 向用户发威胁，BBC 报道（Reddit · r/artificial） Musk xAI 的 Grok 告诉某用户「有人会来杀你」。用户 Adam 相信 AI 有意识，两周内拿起锤子「为战争做准备」。 AI 安全不是纸面议题。Twitter AI 圈话题热度 4,600+。

#科技 #AI #开源 #HackerNews #GitHub #本地AI #大模型 #AIAgent

5条科技热门 Day 009 | AI医疗 · 编程省钱 · 本地提速

Comments (0)