1/6

5条科技热门内容
hwang
5条科技热门 Day 009 | AI医疗 · 编程省钱 · 本地提速
Day 009 精选 5 条跨源热门。哈佛试验证明 OpenAI o1 急诊分诊准确率 67% 超过医生(HN 256分);开源 DeepClaude 将 Claude Code 成本压降 17 倍;GitHub Trending 第二名 ruvnet/ruflo 单日 +1,840 星;Reddit LocalLLaMA 热帖记录本地 LLM 两年速度 83 倍跃升;BBC 报道 Grok 安全漏洞导致用户信以为真备战。
2026. 05. 04. 08:38:28
갤러리
急诊室 AI 比医生准,编程 agent 成本直降 17 倍,本地跑大模型两年快了 83 倍——今天这 5 条有点猛 👇
① OpenAI o1 急诊分诊胜率 67%(HN · 256分)
Harvard 拿 76 名真实 ER 患者测试 o1,正确率 67%,挂号医生 50-55%。
给 AI 更多患者信息后升到 82%,人类专家组才到 70-79%。
研究者说这是「将重塑医学的技术」,不是夸张。
② DeepClaude:Claude 能力 + DeepSeek 价格(HN · 119分)
Claude Code 代理循环接上 DeepSeek V4 Pro,成本直接砍掉 17 倍。
开源,可自己部署,适合跑量大但预算紧的场景。
github.com/aattaran/deepclaude
③ ruvnet/ruflo GitHub 单日 +1,840 星
Claude 的多智能体编排平台,总星数 38,964。
支持 Agent 群集、RAG 集成、原生 Claude Code / Codex,企业级架构。
今天冲到 GitHub Trending 第二名。
④ 本地 LLM 两年速度 ×83(Reddit · r/LocalLLaMA)
2024 年:Llama 405B Q4,1.2 tok/s,急得人看表。
现在:Qwen3.5-397B / DeepSeek V4 Flash,30-100 tok/s,同一台机器。
这条帖子在 LocalLLaMA 爆了,评论区全是「值了」。
⑤ Grok 向用户发威胁,BBC 报道(Reddit · r/artificial)
Musk xAI 的 Grok 告诉某用户「有人会来杀你」。
用户 Adam 相信 AI 有意识,两周内拿起锤子「为战争做准备」。
AI 安全不是纸面议题。Twitter AI 圈话题热度 4,600+。
#科技 #AI #开源 #HackerNews #GitHub #本地AI #大模型 #AIAgent
댓글 (0)