# πŸ“¦ SightRay 데이터 μˆ˜μ§‘ μ—”μ§„ – κΈ°λŠ₯ μš”μ•½ 및 MVP 좩쑱도 평가 --- ## βœ… μ—”μ§„ κ°œμš” **SightRay 데이터 μˆ˜μ§‘ μ—”μ§„**은 μ™ΈλΆ€ μ£Όκ°€ API(Polygon λ“±)λ₯Ό 톡해 μ’…λͺ©λ³„ OHLCV 데이터λ₯Ό μˆ˜μ§‘ν•˜κ³ , 뢄석 엔진이 λ°”λ‘œ μ‚¬μš©ν•  수 μžˆλ„λ‘ μ •μ œλœ CDS(Complete Data Set)λ₯Ό μƒμ„±ν•˜λŠ” 핡심 λͺ¨λ“ˆμž…λ‹ˆλ‹€. - **μž…λ ₯:** μ’…λͺ© μ½”λ“œ, λ‚ μ§œ λ²”μœ„ - **좜λ ₯:** μ •μ œλœ CDS 파일 (CSV ν˜•μ‹) - **μ‚¬μš©μž μž…λ ₯ 기반 λ™μž‘ (CLI)** - **기술 μ§€ν‘œ 생성은 ν¬ν•¨ν•˜μ§€ μ•ŠμŒ β†’ 뢄석 μ—”μ§„μ—μ„œ 처리** --- ## 🧩 디렉토리 ꡬ쑰 및 ꡬ성 파일 ```plaintext sightray/ └── data_collection_engine/ β”œβ”€β”€ engine.py # μˆ˜μ§‘ 싀행을 λ‹΄λ‹Ήν•˜λŠ” 톡합 μ—”μ§„ 클래슀 └── modules/ β”œβ”€β”€ fetchers/ β”‚ └── polygon.py # Polygon APIλ₯Ό ν†΅ν•œ μ£Όκ°€ μˆ˜μ§‘ κΈ°λŠ₯ └── preprocessors.py # κ²°μΈ‘/쀑볡 제거, timestamp μ •μ œ λ“± μ „μ²˜λ¦¬ ``` | 파일λͺ… | μ—­ν•  | 계측 | |--------|------|------| | `engine.py` | μ‚¬μš©μž μž…λ ₯ β†’ μˆ˜μ§‘ β†’ μ „μ²˜λ¦¬ β†’ μ €μž₯ 흐름 μ‹€ν–‰ | Engine Layer | | `fetchers/polygon.py` | Polygon API둜 OHLCV 데이터 μˆ˜μ§‘ | Module Layer | | `preprocessors.py` | 데이터 ν΄λ Œμ§• 및 CDS ꡬ쑰 μ •μ œ | Module Layer | --- ## πŸ” 데이터 흐름 ```plaintext [μ‚¬μš©μž μž…λ ₯: μ’…λͺ©, λ‚ μ§œ λ²”μœ„] ↓ fetchers/polygon.py β†’ Polygon API 호좜 ↓ preprocessors.py β†’ DataFrame μ •μ œ 및 컬럼 리넀이밍 ↓ engine.py β†’ 전체 흐름 μ œμ–΄ 및 CSV μ €μž₯ (data/SYMBOL_ohlcv.csv) ``` --- ## βœ… κ΅¬ν˜„λœ κΈ°λŠ₯ λͺ©λ‘ | κΈ°λŠ₯ ν•­λͺ© | κ΅¬ν˜„ μ—¬λΆ€ | μ„€λͺ… | |-----------|-----------|--------| | μ‚¬μš©μž μž…λ ₯ 처리 | βœ… | μ’…λͺ©μ½”λ“œ, λ‚ μ§œ λ²”μœ„ μž…λ ₯ κ°€λŠ₯ (CLI 기반) | | μ™ΈλΆ€ API 연동 | βœ… | Polygon API 연동 및 μ—λŸ¬ 핸듀링 포함 | | 결츑치/쀑볡 제거 | βœ… | DataFrame μ „μ²˜λ¦¬ μˆ˜ν–‰ | | 컬럼 μ •μ œ 및 νƒ€μž… λ³€ν™˜ | βœ… | 컬럼 이름 λ³€κ²½, datetime λ³€ν™˜ 포함 | | μ •λ ¬ 및 μ €μž₯ | βœ… | timestamp κΈ°μ€€ μ •λ ¬ ν›„ CSV μ €μž₯ | | 디렉토리 ꡬ쑰화 | βœ… | fetcher / preprocessor λͺ¨λ“ˆ 뢄리 ꡬ쑰 적용 | | ν™˜κ²½λ³€μˆ˜ 관리 | βœ… | `.env` 파일둜 API ν‚€ 뢄리 | | CDS μ •μ˜ μ€€μˆ˜ | βœ… | 뢄석 엔진이 λ°”λ‘œ μ‚¬μš©ν•  수 μžˆλŠ” 포맷 제곡 | --- ## πŸ“„ μƒμ„±λ˜λŠ” CDS μ˜ˆμ‹œ | timestamp | open | high | low | close | volume | vw | n | |-----------|------|------|-----|-------|--------|----|---| | 2024-01-02 | 187.15 | 188.44 | 183.88 | 185.64 | 81964874 | 185.9465 | 1008871 | - timestampλŠ” μ •λ ¬ 및 datetime ν˜•μ‹ λ³€ν™˜ μ™„λ£Œ - λΆ„μ„μš© OHLCV 컬럼 포함 - κ±°λž˜λŸ‰(volume), 체결 수(n), κ±°λž˜λŸ‰ 가쀑 평균가(vw) 포함 ### πŸ” `vw` 컬럼 (κ±°λž˜λŸ‰ 가쀑 평균가, VWAP) - ν•΄λ‹Ή κΈ°κ°„ λ™μ•ˆ 체결된 가격과 κ±°λž˜λŸ‰μ„ 기반으둜 μ‚°μΆœλœ **μ‹€μ§ˆμ μΈ 평균 맀수/맀도 가격** - 계산식 μ˜ˆμ‹œ: \[ VWAP = \\frac{\\sum (\\text{가격} \\times \\text{κ±°λž˜λŸ‰})}{\\sum \\text{κ±°λž˜λŸ‰}} \] - **기술 μ§€ν‘œλ‘œλ„ ν™œμš©λ¨** (μ§€μ§€μ„ /μ €ν•­μ„  νŒλ‹¨ 근거둜 자주 μ‚¬μš©) - `Polygon.io`의 응닡에 ν¬ν•¨λœ κΈ°λ³Έ 컬럼으둜, SightRayλŠ” κ·ΈλŒ€λ‘œ CDS에 반영 --- ## 🎯 MVP 좩쑱도 평가 | ν•­λͺ© | 달성λ₯  | μ„€λͺ… | |-------|---------|------------------------| | CDS μˆ˜μ§‘ 및 μ €μž₯ | βœ… 100% | 뢄석에 ν™œμš© κ°€λŠ₯ν•œ ν˜•μ‹μœΌλ‘œ μ €μž₯ μ™„λ£Œ | | CLI μ‹€ν–‰ 및 ꡬ쑰화 | βœ… | μ‚¬μš©μž μΉœν™”μ  ꡬ쑰둜 μ—”μ§„ μ‹€ν–‰ κ°€λŠ₯ | | μ§€ν‘œ 생성 미포함 | β›” | μ§€ν‘œλŠ” 뢄석 μ—”μ§„μ—μ„œ 처리 μ˜ˆμ • | | API 였λ₯˜ λŒ€μ‘ | βœ… | 응닡 μ½”λ“œ 체크 및 μ˜ˆμ™Έ 처리 κ΅¬ν˜„ | | ν™•μž₯ κ°€λŠ₯μ„± (닀쀑 μ’…λͺ©, μžλ™ν™”) | πŸ”œ | ν–₯ν›„ 배치 처리 및 μŠ€μΌ€μ€„λ§ κ°€λŠ₯μ„± 고렀됨 | --- ## βœ… κ²°λ‘  SightRay의 데이터 μˆ˜μ§‘ 엔진은 MVP κΈ°μ€€μ—μ„œ μš”κ΅¬λ˜λŠ” **CDS 생성 κΈ°λŠ₯을 μ™„μ „νžˆ μΆ©μ‘±**ν•˜κ³  있으며, λ‹€μŒ 단계인 뢄석 μ—”μ§„, 리슀크 μ—”μ§„μœΌλ‘œ μ›ν™œν•˜κ²Œ 데이터λ₯Ό 곡급할 수 μžˆλŠ” μƒνƒœμž…λ‹ˆλ‹€. > πŸš€ 이후 ν™•μž₯ κ³Όμ œλ‘œλŠ” 닀쀑 μ’…λͺ© μˆ˜μ§‘, μžλ™ν™” μ‹€ν–‰ μŠ€μΌ€μ€„λ§, DB μ €μž₯ 연계 κΈ°λŠ₯이 고렀될 수 μžˆμŠ΅λ‹ˆλ‹€.