屬於 “Software Engineering” 標籤的文章

查看所有標籤
共有 1 篇文章

LLM 的 Plausibility Trap:當程式碼「看起來對」卻慢了 20,000 倍

從 Vagabond Research 的 SQLite Rust 重寫案例出發,分析 LLM 生成程式碼的合理性陷阱現象。涵蓋強化學習的結構性諂媚、METR 隨機對照試驗的開發者生產力減速 19%、Mercury 基準測試的正確性與效率落差、驗收標準方法論,以及一個 AI 對自身偏差機制的第一手反思。