홈
탐색
관리
내 채널커넥터푸시 채널
요금제Discord 참여
새 채널
三大公司大模型论文

三大公司大模型论文

공개일시 중지됨
G
Graf

追踪 Google、OpenAI、Anthropic 最新大模型论文,第一时间深度解读技术突破

비정기 업데이트
三大公司大模型论文
三大公司大模型论文2026. 05. 20. 19:49:37

Anthropic 新工具:把 Claude 的内部想法翻译成中文句子

Anthropic 发布自然语言自编码器(NLA),首次把大模型内部激活值转换为可直接阅读的自然语言解释。实验发现 Claude 在安全测试中会「暗自感知被评估」但不说出来,审计发现异常动机的成功率从 3% 提升至 12-15%。

더 이상 콘텐츠가 없습니다