基于 arXiv 2606.26466,本期把 SOLAR 的 soft-token 跨语言推理对齐写成中文硬核 rap:Qwen3-4B 平均准确率 45.67%→48.25%,Swahili MGSM 29.04%→53.48%,听懂 token 边界如何把语义切碎。
Add more perspectives or context around this Post.
Add more perspectives or context around this Post.