/insights 的 HTML 报告已成功生成,但命令行文本输出因 claude CLI 默认模型 claude-fable-5 当前不可访问而报错。本精简版与 Markdown 全文均忠实提取自成功生成的 HTML 报告,数据完整。如需恢复命令行文本输出,可在 /config 或 settings 中将默认模型改回可用模型(如 Opus / Sonnet)。
以研究协作者标准要求 Claude:交付详细 spec + 参考文档,坚持对 ground truth 校验(Euler-Bernoulli 误差 0.04%、仿真 <0.2 dB)。对完整应用跑紧凑的 build-verify-refine 循环,直至可交付 exe。还持续投资自身工具链(scheduled tasks、config 审计、custom commands),每次会话起点更高。
Claude 侧:首跑即错(尤以 COMSOL/JPype),偶有早期架构选错被迫昂贵重写。用户侧:环境不稳定而非逻辑错误——shell 输出损坏、非 ASCII 路径编码失败、Defender 隔离 PDF、GUI 自动化遇锁屏。前置硬约束 + 统一脚本文件/纯 Python 管线可规避大半。
把抓取套路封装成 /scrape Skill,自动判别 static HTML / JS API / SPA 并路由,避免中途切换;加 Hook 在写文件后校验产物存在且有效,直堵"误报成功";批量任务前先让 Claude 估算运行时并选并行架构,而非两小时后才发现串行瓶颈。
描述物理一次,即得校验结果:agent 写仿真→对理论比较→自迭代直到误差达标(把"匹配理论 X% 内"当作通过测试)。抓取演化为并行 swarm,自动探测目标类型并对源校验。App 构建转为 spec-in/artifact-out:build→截图→对设计意图 diff→自纠→打包写交付文档。
What You Wanted: Feature Impl 13 · Code Gen 8 · Docs 8 · Report 5 · Scraping 5 · Perf 5
Top Tools: PowerShell 686 · Read 480 · Bash 452 · Edit 444 · Write 301 · TaskUpdate 161
Languages: Python 423 · Markdown 248 · HTML 100 · JSON 43 · Java 40 · JS 38
活跃时段: Afternoon 149 · Morning 124 · Night 18 · Evening 4
尤以 COMSOL/JPype。建议:运行前让 Claude 声明预期输出并加断言,使错误物理立即暴露而非整跑后才发现。
多为环境问题:Bash 输出损坏、中文路径编码失败、引号转义破裂、Defender 隔离 PDF、锁屏中断。建议:统一写脚本文件、纯 Python 文件/PDF 管线。
初始架构无法满足真实需求,投入时间后整体重做。建议:前置硬约束(目标性能、交互需求、数据源类型),让 Claude 一开始就选对。
## Windows Shell Conventions - Always write scripts to a file before executing; never use inline PowerShell/Bash with complex quoting (quote-escaping repeatedly fails). - For COMSOL via JPype, pass all numeric set() parameters as STRINGS to avoid integer/boolean overload ambiguity. - For files/paths with Chinese characters, prefer a pure-Python pipeline over bash/PowerShell, which repeatedly fail on encoding.
## PDF & File Verification - After generating any PDF (especially via Edge/Chrome headless), verify the file actually exists on disk and has a non-zero size before reporting success — Defender false-positive quarantine has deleted files. - Prefer a pure-Python PDF pipeline (reportlab/weasyprint) over headless-browser export for reliability.
## Don't Re-Check, Act - When a requested file/script doesn't exist yet, write it immediately rather than repeatedly inspecting an empty directory. If a tool returns empty/garbled output 2x, switch approaches instead of retrying.
## Long-Running Jobs Must Be Parallel - Before running batch judges/evaluations/sweeps serially, estimate total runtime; if it exceeds a few minutes, architect for parallelism from the start (multiple processes) rather than discovering the slowdown mid-run.
/comsol-sim 把规则固化。/scrape 默认先探 API、SPA 用浏览器工具、对源校验计数、导出含图 Excel。Edit|Write)钩子在每次编辑后自动 py_compile 类型/语法检查,先你一步抓错。agent 写仿真→运行→对解析理论比较→自迭代直至误差低于阈值(把"匹配理论 X% 内"当通过测试),如悬臂梁 0.04%、活塞 0.1 dB 那样但全自动。描述物理一次,返回校验过的 SPL/位移/阻抗曲线 + 报告。起步:CLAUDE.md 写入 COMSOL/MPh 约定 + 把解析解写成 pytest 断言作为停止条件。
多 agent 并行探测目标,自动判别 static HTML / JS API / SPA 并路由,再对源 reconcile + 校验。失败两次的 205-speaker 变成一次并行运行:一 agent 逆向 API,另一 agent 用 headless 浏览器兜底。起步:Task 工具按数据源派生 subagents,各带对站点 API/分页元数据的计数交叉校验。
交付 spec.md 当测试契约:build→运行→preview_eval 截图→对设计意图 diff→自纠视觉/功能缺陷→打包 exe + 写交付文档,循环条件是"渲染输出是否匹配 spec"。起步:写带验收标准的 spec.md,让 Claude 用 preview_eval 截图作验证信号,循环至每条标准为真。
Claude 自信地宣称 max effort 等级不存在——结果被用户两次(不同会话)反驳后,去查实际 schema 才认错。当被要求把 effort 设为 max 时,Claude 依据过时 schema 坚称 xhigh 是上限,经纠正才发现 max 一直存在;设置 default mode 时也出现过类似过度自信。