슈퍼예측 연습: Polymarket의 Target Q1 마켓 풀어보기

forecasting
polymarket
슈퍼예측
retail
직전 4분기 base rate에서 시작해 5년 트렌드, 매크로, peer 시그널까지 — 4개 layer를 거치며 분포가 어떻게 진화했는지의 기록.
Published

2026.05.14

인터뷰 준비 차원에서 슈퍼예측·guesstimation 훈련을 계획했었다. Polymarket 마켓 하나를 잡고 단계별로 분포를 만들어가는 연습을 했다. 결과보다 사고 과정의 진화가 흥미로워서 박제해둔다.

들어가며 — 어느 마켓을 풀까

처음에는 Zoom Q1 online churn rate 마켓을 골랐다. 옵션 5개의 가격이 거의 다 40% 안팎으로 동일했고, 누가 봐도 monotonic 위배(2.7% 이상 확률은 3.1% 이상보다 커야 함)였기에 차익 기회가 있나 싶었다.

분석해보니 거래량 $0, Yes 77¢ + No 95¢ = 1.72달러 spread. 마켓 메이커 봇 호가만 깔린 죽은 시장이었다. “Major Price Slippage” 경고가 뜨면서 첫 번째 lesson을 얻었다:

이론적 mispricing과 실현 가능한 edge는 다른 문제다. Edge를 백테스트로만 봐서는 안 되고, slippage·spread를 차감한 liquidity-adjusted edge가 진짜 신호다.

그래서 거래량 $5,416에 옵션 합이 100.7%로 합리적인 Target Q1 comparable sales growth 마켓으로 갈아탔다.

마켓 구조

  • 대상: Target FY27 Q1 (2026년 2~4월) comparable sales growth
  • 발표 예정: 2026년 5월 20일 (6일 뒤)
  • 옵션과 시장가:
구간 시장 Yes ¢
<-1% 74¢
-1% ~ 1% 23¢
1% ~ 3% 5.7¢
3%+ 1.6¢

시장은 <-1%에 압도적 비중을 두고 있다. 첫 질문이 떠올랐다 — 이게 정당한가?

Step 1 — 직전 4분기 base rate

가장 단순한 출발점은 최근 분기 추세 연장이었다.

분기 Comp
FY25 Q1 -3.8%
FY25 Q2 -1.9%
FY25 Q3 -2.7%
FY25 Q4 -2.5%

직전 4분기 평균 -2.7%, 8분기 중 6분기가 negative. 또한 CEO가 3월 발표에서 “2월 매출은 healthy, positive”라고 언급했고, FY26 가이던스도 “small positive comp”였다. 무엇보다 FY25 Q1이 -3.8%로 매우 부진했기 때문에 easy comp 효과가 강하게 작용할 것으로 봤다.

1차 분포:

구간 추정
<-1% 60%
-1% ~ 1% 28%
1% ~ 3% 9%
3%+ 3%

시장 prior(<-1% 74%)가 약간 over confident하다고 판단했다. -1%~1% 구간이 시장보다 저평가되어 보였다.

Step 2 — 5년 분기별 trend

여기서 두 번째 질문이 떠올랐다: FY21부터 보면 어떨까? 단기 base rate가 함정일 수도 있다.

Q1 Q2 Q3 Q4 연간 시기 맥락
FY21 +22.9 +8.9 +12.7 +8.9 +12.7 코로나 부스트
FY22 +3.3 +2.6 +2.7 +0.7 +2.2 인플레, 재고 misjudgment
FY23 0.0 -5.4 -4.9 -4.4 -3.7 디스크리션 붕괴
FY24 -3.7 +2.0 +0.3 +1.5 +0.1 회복 시도
FY25 -3.8 -1.9 -2.7 -2.5 -2.6 다시 침체

긴 trend에서 보이는 두 가지가 단기에선 안 보였다.

첫째, Q1은 구조적으로 weak. FY23~FY25 3년 연속 Q1이 그 해 최저 또는 두 번째. 단순 stochastic이 아니라 계절성일 가능성.

둘째, Regime change. FY23 이후 Target은 새로운 정상상태(-2%~0%)에 들어갔다. FY21~FY22의 +성장은 코로나 노이즈로 분리해야 한다. 5년 평균(+1.3%)이 아니라 FY23 이후 12분기 평균(-2.3%)이 올바른 reference class다.

Tetlock 슈퍼예측 원칙 중 가장 중요한 한 가지: “What’s the right reference class?” 잘못된 reference class는 분석 전체를 망친다.

시장 <-1% 74%가 처음 봤을 때만큼 over는 아니었다. 분포는 미세하게만 조정했다(<-1% 62%로).

잠깐 — Comp sales가 뭐지

여기서 한 발 멈추고 개념을 정리했다. 슈퍼예측에서 metric의 정의를 정확히 모르면 추정이 흔들린다.

Comparable sales(동일점 매출, same-store sales)는 13개월 이상 운영된 매장만 대상으로 한 매출 증감률이다. 신규 출점 효과를 제외하고 순수한 영업력을 측정한다.

성숙 retailer(Target, Walmart, Costco, Starbucks)에게는 거의 유일한 성장 지표이고, Wall Street이 retail 실적을 평가할 때 1순위로 보는 metric이다. Comp sales -2.5%면 “기존 매장에서 작년 같은 분기 대비 2.5% 덜 팔렸다”는 뜻.

분해하면:

  • Traffic(방문 횟수) × Ticket(평균 객단가)
  • Store-originated vs Digital-originated 채널 구분

이 분해가 중요한 이유 — Target의 직전 분기를 보면 전체 comp -2.5% 안에 매장 -3.9%, 디지털 +1.9%가 숨어 있다. 매장이 진짜 문제이고 디지털은 버티고 있다는 뜻이다. 단순 합계만 보면 진단을 놓친다.

Step 3 — 매크로 변수와 peer 시그널

세 번째 질문은 가장 중요했다. Q1 FY26(Feb-Apr 2026) 기간에 실제로 발표된 매크로 지표가 무엇이고, 그 중 어떤 것이 Target comp sales와 직접 상관이 있나?

먼저 retail comp sales에 영향을 미치는 매크로 변수 매트릭스를 정리했다.

변수 영향 메커니즘 발표 주체
Retail Sales (Census) 동일 산업 총 수요 美 Census Bureau
CPI (BLS) 디스크리션 wallet shift 美 BLS
Consumer Confidence (CB) 중산층 신뢰 Conference Board
Consumer Sentiment (Michigan) 단기 소비 의향 U Michigan
Gasoline price regressive tax EIA
Non-farm payrolls 가처분소득 베이스 BLS
Walmart comp sales peer benchmark Walmart 실적

그리고 실제 발표값을 확인했다.

Q1 매크로 실제 발표값

지표 Target 영향
Retail Sales Q1 YoY +3.7% (4월 stall) 중립
CPI April +3.8% YoY (재가속), 에너지 +17.9% 부정
Michigan Sentiment April 49.8 — 74년 사상 최저 매우 부정
Conference Board CCI April 92.8 (안정) 중립
유가 (Iran 갈등) 3월 gasoline +15.5% MoM 부정

특히 Michigan Sentiment 49.8은 충격적인 수치다. 코로나 록다운(71.8)보다, 2008 금융위기(55.3)보다, 2022년 인플레 panic(50.0)보다도 낮다. 사상 최저.

Walmart peer — 결정적 신호

Walmart의 Q1 FY27(같은 분기) US comp sales 컨센서스는 +3.9%, Morgan Stanley는 4.0~4.5% 기대. 결정적 한 줄이 있다:

“Higher-income households continue to shift toward Walmart for value.”

부유층까지 Walmart로 trade-down하고 있다는 신호. Target의 중상위 코어 고객층이 잠식되고 있다는 뜻이다. Walmart가 +3.9%로 잘하는 것은 단순히 “retail이 좋다”가 아니라 Target에게는 share loss 가속의 의미였다.

Conditional chain

Michigan Sentiment 사상 최저 → 중산층 신뢰 붕괴
                            → 디스크리션 위축
                            → Target 코어 카테고리 부진
                            → Target comp < Walmart comp
                            → 시장 prior 정당화

이 단계에서 분포가 시장 prior와 거의 수렴했다. <-1% 70%, 시장 74%.

Step 4 — Michigan Sentiment 깊이 파기

가장 무거운 무게를 차지한 Michigan Sentiment를 따로 정리해뒀다. 다음 KPI 마켓에서도 계속 쓸 지표라서.

미시간대 Surveys of Consumers가 1946년부터 매월 발표하는 소비자 심리 지표. 1966년 Q1 = 100 기준점. 표본 약 500~600 가구 전화 설문. 5개 질문에 응답률 기반으로 점수 계산한다.

  1. 1년 전보다 재무상태가 좋아졌나?
  2. 1년 후 재무상태가 좋아질 것 같나?
  3. 향후 1년 미국 경기는?
  4. 향후 5년 미국 경기는?
  5. 지금 큰 가구·가전 사기 좋은 때인가?

두 하위 지수가 있다:

  • Current Conditions Index(질문 1, 5): 현재 재무·구매여건
  • Expectations Index(질문 2, 3, 4): 미래 전망 — 미국 정부 공식 Leading Economic Index 구성요소

Michigan vs Conference Board CCI

같은 “소비자 신뢰” 같지만 다른 것을 잡는다.

Michigan Conference Board
초점 가계 재정 (pocketbook) 고용·노동시장
표본 ~500 ~3,000
민감도 유가·인플레·이자 일자리 안정성
Retail 예측력 높음 보통

오늘의 divergence(Michigan 49.8 vs CCI 92.8)는 “일자리는 있지만 가처분소득이 압박받고 있다”는 의미. Target 같은 디스크리션 retailer가 직격받는 환경이다.

한계 — say-do gap

다만 한 가지 caveat이 있다. 2022~2023년에 Michigan은 50대 저점이었지만 실제 retail sales는 견조했다. 응답자가 “비관적”이라고 답하면서도 실제로는 계속 소비하는 패턴이다. 정치 양극화에 따른 응답 편향도 존재한다.

Michigan 사상 최저가 반드시 Target Q1 폭락을 의미하지는 않는다. 다만 확률을 무게 있게 기울이는 신호다.

최종 분포 — 나의 결론

매크로까지 본 후 시장 prior가 충분히 정당화된다고 봤지만, 한 가지 더 가중치를 둘 신호가 있었다.

Michigan 사상 최저 + Walmart trade-down dynamics의 결합. 이 둘이 동시에 작용하는 시기에 Target이 단순 분기 평균(-2.3%)에 머무를 가능성은 낮다. 더 큰 폭의 부진 가능성이 높다고 봤다.

최종 분포:

구간 시장 prior 나의 추정
<-1% 74% 80%
-1% ~ 1% 22% 16%
1% ~ 3% 4% 3%
3%+ 1.2% 1%

시장보다 더 비관적이다.

처음 1차 추정(<-1% 60%)이 시장 prior(<-1% 74%)와 어긋났을 때 “내가 우위다”라고 봤지만, layer를 추가할수록 시장 쪽으로 수렴했고, 마지막에는 시장보다 더 강하게 한쪽에 기우는 결론에 도달했다. 분포 진화의 전체 궤적이 이 한 표에 압축되어 있다.

분석 단계 <-1% 확률
Step 1: 직전 4분기 base rate 60%
Step 2: 5년 분기 trend 62%
Step 3: 매크로 + Walmart peer 70%
Step 4 (최종): Michigan + trade-down 가중 80%
시장 prior 74%

슈퍼예측 메타 lessons

1. Layer를 충분히 쌓기 전에 시장과의 차이를 edge로 해석하지 말 것

1차 분석에서 시장이 over로 보였다. 4차 분석에서는 그 반대였다. 시장 가격은 우리가 모르는 정보를 이미 가격에 박아둔다. Polymarket KPI 마켓 중 거래량 $5K+ 마켓은 효율적이다. 우위를 가지려면 4개 layer(분기 base rate, 5년 trend, 매크로, peer) 중 최소 하나는 시장보다 더 잘 봐야 한다.

2. Confirmation의 함정

첫 분석에서 “easy comp + CEO 발언”이 매력적으로 보였다. 그러나 그 신호를 무겁게 두는 것은 confirmation bias였다. 매크로를 확인하면서 그 가중치를 낮춰야 했다. 내 가설을 지지하는 증거만 찾는 함정이 슈퍼예측의 가장 큰 적이다.

3. Reference class 선택이 답을 결정한다

5년 평균(+1.3%), 최근 12분기(-2.3%), 직전 4분기(-2.7%) — 어느 base rate를 잡느냐가 분포 전체를 바꾼다. Regime detection이 핵심이다. FY21~FY22는 코로나 regime, FY23+는 새로운 regime. 그냥 5년 평균하면 안 된다.

4. Peer 신호의 비대칭

같은 매크로도 회사 포지셔닝에 따라 반대 방향 신호가 된다. Walmart의 +3.9%는 retail이 좋다는 뜻이 아니라 Target의 share loss라는 뜻이었다. Peer를 봐야 매크로의 회사별 미시 함의가 보인다.

5. 메타 자신감 조정

데이터 더 깊이 본 후 결론이 시장 쪽으로 이동했다면 시장에 대한 신뢰도 ↑, 내 edge 자신감 ↓. 본 데이터가 늘었는데도 시장과의 격차가 줄지 않는다면 진짜 edge일 가능성 ↑. 분석 도중에 메타 자신감을 계속 업데이트해야 한다.

사후 검증 계획

5월 20일에 Target FY27 Q1 실적이 발표된다. 분포의 적중도를 Brier score로 계산하면 캘리브레이션 데이터를 한 줄 확보할 수 있다.

또 5월 15일 Walmart 결과가 먼저 나온다. Walmart +3.9% 컨센서스가 충족되면 Target의 share loss 가설이 강화되고, 컨센서스 하회면 매크로 부정 신호 자체가 약해진다 — 그때 분포를 한 번 더 업데이트할 예정이다.

이런 단계별 박제 자체가 슈퍼예측 훈련이다. 결과를 맞추는 것보다 분포가 어떻게 진화했고, 어느 시점에 어떤 신호로 흔들렸는지가 진짜 학습이 된다.