042026 · JuneHarness Update

Fable 5 이후 하네스에
생긴 일들 — 이번 주 커밋 전부

Fable 5가 나온 주에 S-Skills 하네스는 22개 커밋이 쌓였습니다. 리뷰어 프롬프트가 망가졌다 고쳐졌고, 설계 스킬은 v3.0에서 v3.2까지 올라갔으며, gstack 영감을 받은 5개 스킬이 한꺼번에 추가됐습니다. 모델이 강해진 주에 하네스가 가장 많이 바뀌었습니다.

5개

gstack 영감 신규 스킬

sj-spec·sj-investigate·sj-cso·sj-ship·sj-retro. 스펙 정밀화부터 보안 감사, 주간 회고까지 — 개발 사이클 전 구간이 커버됩니다.

6a359c2 · Jun 8

3→2.1

sj-design 전면 재설계

v3.0 DNA 거부 프로토콜 → v3.1 URL 스크린샷 → v3.2 3시안 브라우저 선택까지. 3일에 걸쳐 레퍼런스에서 구현까지 단계적 수렴 파이프라인이 완성됐습니다.

bb27fdb → 9f5a6a2 → 00662ec

7→10

에이전트 설계 축 확장

메모리 계층·평가·자기반성·그래프 토폴로지 3개 축이 추가됐습니다. CLAUDE.md 불일치도 동기화했습니다.

29355eb · Jun 10

3종

리뷰어 프롬프트 긴급 수정

Fable 5가 '무조건 비판적' 지시를 문자 그대로 실행해 억지 결함을 생성. '거짓 비판 금지' 탈출구를 추가해 해결했습니다.

6b880e6 · Jun 10

리뷰어가 거짓말을 시작했다

기존 프롬프트는 이랬습니다. '무조건 비판적이다. 문제 없이 끝나는 리뷰는 없다.' Opus 4.6까지는 이 지시가 의도대로 동작했습니다. '너무 가볍게 통과시키지 마라'는 의도로 읽었습니다. Fable 5는 달랐습니다. 문제가 없는 코드에서도 반드시 결함을 찾아냈습니다. 정확히는 만들어냈습니다. 존재하지 않는 보안 리스크, 이미 처리된 엣지 케이스 재지적, 근거 없는 성능 우려.

수정은 단 두 가지였습니다. '무조건'을 '철저히'로 바꾸고, 탈출구를 열었습니다. '철저히 탐색한 후에도 실질적 문제가 없으면 트집을 만들지 말고, 중대한 문제 없음과 잔여 리스크를 정직하게 보고한다.' 이 한 줄이 억지 비판을 막으면서 엄격함은 유지했습니다. sj-dev-si 스킬도 같은 이유로 다음 커밋에서 동기화했습니다(`3da9b12`).

더 강한 모델에는 더 정밀한 지시가 필요합니다. '의도가 있으니 알아서 해줄 것'이라는 가정이 깨집니다. 모델이 강해질수록 프롬프트의 허점이 더 크게 드러납니다. 이전 모델은 허술한 지시를 의도로 메꿨지만, Fable 5는 그 허술함을 그대로 실행합니다.

디자인 스킬: 3일에 v3.0 → v3.2

같은 주에 sj-design은 세 번 버전이 올랐습니다. v3.0에서 DNA 기반 생성과 거부 프로토콜이 들어왔습니다. 레퍼런스를 보면 컬러·폰트·레이아웃 DNA를 먼저 추출하고, 커밋 선언(hex·font·layout 명시)을 코드 작성 전에 출력해야 합니다. 거부된 방향은 design-banned.md에 영구 봉인되고, 같은 방향을 다시 생성하는 것이 구조적으로 금지됩니다.

v3.1에서는 URL을 주면 Playwright로 스크린샷을 찍어 DNA를 추출하는 분기가 생겼습니다. v3.2에서는 3개 시안을 모두 브라우저에 열어 사용자가 선택한 뒤에야 구현으로 넘어가는 흐름이 추가됐습니다. 그 사이 시각적 승인 게이트(`6698a4d`)도 붙었습니다. 목업 HTML을 열고 명시적 승인 없이 구현을 시작하는 것이 금지됩니다. sj-dev-frontend도 V-1~V-3 시각적 검증 섹션을 얻어, 스크린샷 확인 없이 '완성'을 선언할 수 없게 됐습니다.

gstack에서 온 5개 스킬

sj-spec — 모호함 제거

"로그인 만들어줘"처럼 모호한 의도를 why·scope·technical·draft·file 5단계로 정밀 스펙화합니다. 스펙 없이 구현으로 넘어가는 것을 구조적으로 막습니다.

/sj-spec

sj-investigate — 가설 강제 디버깅

버그를 보자마자 수정하는 것을 금지합니다. 가설 → 검증 순서를 강제하고, 조사 없는 수정은 허용하지 않습니다. 근본 원인을 찾기 전까지 코드를 바꿀 수 없습니다.

/sj-investigate

sj-cso + sj-ship + sj-retro

sj-cso는 OWASP Top 10 + STRIDE 보안 감사 (8/10 확신 이상만 보고). sj-ship은 테스트·커버리지·PR 릴리즈 자동화. sj-retro는 커밋·테스트·QA 지표를 읽어 Keep/Improve/Try 주간 회고를 작성합니다.

/sj-cso · /sj-ship · /sj-retro

같은 기간 sj-automation이 sj-ui-auto를 흡수해 v2.0이 됐고(`43eb210`), macOS·Linux·Windows를 자동 감지해 launchd·systemd·Task Scheduler로 분기합니다. sj-outsource가 신설돼(`13a1571`) 막혔을 때 전문가에게 위임하고 메일 초안을 자동으로 작성하는 탈출구가 생겼습니다. sj-company 라우팅도 트리거 오탐 6건을 수정하고 design·agent-dev·pw-loop 직접 트리거를 추가했습니다(`18330a4`).

이번 주 커밋 패턴은 명확합니다. Fable 5 출시 → 실전 사용 → 깨진 부분 발견 → 수정 → 다시 실전. 하네스는 모델 업그레이드와 함께 진화합니다. 설계 축 7개가 10개가 되고, 스킬이 5개 늘고, 프롬프트가 더 정밀해지는 것 — 이것이 하네스가 살아있다는 증거입니다.

S-Skills 하네스는 매주 커밋됩니다. 모델이 바뀔 때마다 프롬프트도 같이 업데이트됩니다.

GitHub에서 보기 →

Fable 5 이후 하네스에생긴 일들 — 이번 주 커밋 전부

리뷰어가 거짓말을 시작했다

디자인 스킬: 3일에 v3.0 → v3.2

gstack에서 온 5개 스킬

Fable 5 이후 하네스에
생긴 일들 — 이번 주 커밋 전부