목표: API 키 확인, DB 연결 검증, 테이블 사전 생성 확인
| 구분 | 요소 | 설명 |
|---|---|---|
| 수집용 인증 | Gemini CLI | Google 계정 인증 (1회 로그인) |
| 수집용 인증 | Naver API | CLIENT_ID / CLIENT_SECRET |
| 평가용 인증 | Claude Code CLI | Anthropic 계정 로그인 |
| 평가용 인증 | Gemini CLI | Google 계정 인증 (수집과 동일) |
| 평가용 인증 | OpenAI API | OPENAI_API_KEY (ChatGPT/Codex) |
| 평가용 인증 | xAI API | XAI_API_KEY (Grok) |
| 인프라 | Supabase | SUPABASE_URL, SUPABASE_SERVICE_ROLE_KEY |
| DB | 4개 테이블 | politicians, collected_data_v40, evaluations_v40, ai_final_scores_v40 |
📂 저장 경로:
설계문서_V7.0/V40/instructions/1_politicians/
내용:
⚠️ INTEGER/BIGINT 절대 금지!
✅ TEXT(8자리 hex) 필수
Google Search
⚠️ Gemini CLI Direct
OFFICIAL: 30개
PUBLIC: 20개
카테고리별 50개
총 500개 (최대 600개)
📋 가이드 참조:
GEMINI_CLI_수집_가이드
Naver Search API
✅ 자동 실행
OFFICIAL: 10개
PUBLIC: 40개
카테고리별 50개
총 500개 (최대 600개)
🚀 스크립트:
collect_naver_v40_final.py
| 유형 | Official | Public | 합계 | 버퍼 포함 |
|---|---|---|---|---|
| Negative | 4개 (10%) | 12개 (20%) | 16개 | 20개 |
| Positive | 4개 (10%) | 12개 (20%) | 16개 | 20개 |
| Free | 32개 (80%) | 36개 (60%) | 68개 | 80개 |
| 합계 | 40개 | 60개 | 100개 | 120개 |
⚠️ "rating 없이 수집만!" (수집 ≠ 평가)
⚠️ Official 기간: 4년 | Public 기간: 2년
총 1,000개 (최대 1,200개, 버퍼 20%)
(Gemini 500~600 + Naver 500~600)
각 데이터:
목표: AI별 500-600개, 카테고리별 50-60개/AI
확인 항목:
자동 조정 (최대 4회):
포기 규칙 (4회 후):
명령어:
💡 핵심: 처음부터 버퍼 목표(60개)로 수집 → Phase 2-2 거의 스킵 가능!
7. 4개 AI가 각각 1,000~1,200개 전체 평가 (독립적)
💡 핵심: 수집 시점 ≠ 평가 시점 (세션 분리 = 객관성)
| AI | CLI 방식 | API 키 필요 | 이유 |
|---|---|---|---|
| Claude | Claude Code CLI Direct | ❌ 불필요 | 계정 로그인으로 CLI 직접 사용 |
| Gemini | Gemini CLI Subprocess | ❌ 불필요 | 계정 인증으로 CLI 직접 사용 |
| ChatGPT | Codex CLI Direct | ✅ OPENAI_API_KEY | API 호출 필수 (토큰 비용) |
| Grok | curl CLI Direct (subprocess) | ✅ XAI_API_KEY | API 호출 필수 (API 비용) |
Claude Code CLI Direct
🔓 API키 불필요
Haiku 4.5
1,000~1,200개
(100~120×10)
8등급, X=제외
Codex CLI Direct
🔐 OPENAI_API_KEY 필수
gpt-5.1-codex-mini
1,000~1,200개
(100~120×10)
8등급, X=제외
curl CLI Direct (subprocess)
🔐 XAI_API_KEY 필수
grok-3
1,000~1,200개
(100~120×10)
8등급, X=제외
Gemini CLI Direct
🔓 API키 불필요
2.0 Flash
1,000~1,200개
(100~120×10)
8등급, X=제외
| 비교 항목 | CLI 방식 (✅ 채택) | API 방식 (❌ 폐기) |
|---|---|---|
| 인증 방식 | Account Login / API Key (1회 설정) | API Key (매 요청) |
| 실행 방식 | Subprocess 호출 (단순) | HTTP API 요청 (복잡) |
| 할당량/제한 | Claude/Gemini 무제한 / ChatGPT/Grok 제한 적용 | RPM 분당 제한 (15 req/min) |
| 사용 편의성 | 1회 로그인/설정, 재로그인 불필요 | API 키 관리 필수 (만료/보안) |
| 코드 복잡도 | 단순 (10-20줄, subprocess.run()) | 복잡 (50-100줄, retry) |
| AI | 이전 방식 (API) | 현재 방식 (CLI) | 절감률 |
|---|---|---|---|
| Claude | Anthropic API (claude-3-haiku) $0.75 | Claude Code CLI (Haiku 4.5) $0 | 100% |
| Gemini | Google API (2.0 Flash) $0.19 + 제한 | Gemini CLI Subprocess (2.0 Flash) $0 | 100% |
| ChatGPT | OpenAI API (gpt-4) $45 | Codex CLI (gpt-5.1-codex-mini) $1.125 | 97.5% |
| Grok | Agent Tools API 미공개 | xAI API (grok-3) 미공개 | - |
| 총계 | ~$46/1,000개 | ~$1.13/1,000개 | 97.5% |
✅ 핵심 인사이트: ChatGPT gpt-4 ($45) → gpt-5.1-codex-mini ($1.125) = 40배 저렴
| 최적화 | 적용 AI | 설명 | 효과 |
|---|---|---|---|
| 배치 평가 | 4개 AI 전부 | 25개씩 묶어서 평가 | 속도 10x 향상 |
| Pre-filtering | 4개 AI 전부 | 이미 평가된 데이터 사전 제외 | 중복 평가 0%, 5x 향상 |
| 자동 재시도 | ChatGPT | Foreign key 오류 시 배치 5개 자동 재시도 | 안정성 100% |
| 공통 저장 함수 | 4개 AI 통합 | common_eval_saver.py (통합 저장 로직) | 코드 중복 제거 |
| 등급 | +4 | +3 | +2 | +1 | -1 | -2 | -3 | -4 | X |
|---|---|---|---|---|---|---|---|---|---|
| 판단 | 탁월 | 우수 | 양호 | 보통 | 미흡 | 부족 | 매우부족 | 극히부족 | 제외 |
| 점수 | +8 | +6 | +4 | +2 | -2 | -4 | -6 | -8 | - |
총 4,000~4,800개 평가 (4 AIs × 1,000~1,200개)
💡 collected_data_id로 수집 데이터와 연결!
기준: 95% 이상
계산: (평가 개수 / 기대값) × 100
기대값 = 4 AI × 실제 수집 개수
예: 수집 1,000개 → 기대 4,000개
3,800개 / 4,000 = 95%
⚠️ X(제외)는 평가 불가 항목 → 95% 기준은 X 발생을 허용
각 AI, 각 카테고리:
Step 1: Rating 평균
평균 = Σ(Rating) / 평가 개수 (X 제외)
범위: -4 ~ +4
Step 2: 점수 환산
점수(Score) = Rating 평균 × 2
범위: -8 ~ +8
Step 3: 카테고리 점수 (20~100점)
예: Claude, 전문성
Rating 평균 +2.77 → Score 5.54
→ (5.54 × 0.5 + 6.0) × 10 = 87.7 ≈ 88점
예: Claude
77+76+79+65+71+72+73+74+76+75 = 738점
예: (738 + 881 + 835 + 807) / 4 = 816점
공식 분해:
| 상수 | 값 | 역할 |
|---|---|---|
| PRIOR | 6.0 | 기본 점수 60점 (베이지안 사전확률) |
| COEFFICIENT | 0.5 | 범위 스케일링 |
Prior = 6.0의 의미:
| 상황 | Rating Score | 카테고리 점수 | 의미 |
|---|---|---|---|
| 전부 +4 (최고) | +8 | 8×5+60 = 100점 | 증거가 Prior를 최대로 끌어올림 |
| 긍정/부정 균형 | 0 | 0×5+60 = 60점 | 증거가 Prior를 변경하지 못함 |
| 전부 -4 (최저) | -8 | -8×5+60 = 20점 | 증거가 Prior를 최대로 끌어내림 |
| 등급 | 점수 범위 | 의미 |
|---|---|---|
| M (Mugunghwa) | 920~1000점 | 최우수 |
| D (Diamond) | 840~919점 | 우수 |
| E (Emerald) | 760~839점 | 양호 |
| P (Platinum) | 680~759점 | 보통 상 |
| G (Gold) | 600~679점 | 보통 |
| S (Silver) | 520~599점 | 보통 하 |
| B (Bronze) | 440~519점 | 개선 필요 |
| I (Iron) | 360~439점 | 미흡 |
| Tn (Tin) | 280~359점 | 부족 |
| L (Lead) | 200~279점 | 최하 |
{
"Claude": {"expertise": 77, "leadership": 76, ...},
"ChatGPT": {"expertise": 89, "leadership": 86, ...},
"Grok": {...}, "Gemini": {...}
}
{"Claude": 738, "ChatGPT": 881, "Grok": 835, ...}
각 카테고리:
📄 보고서 구성 (8섹션, ~790줄):
📂 저장 경로:
설계문서_V7.0/V40/보고서/
{정치인명}_{YYYYMMDD}.md
예) 박주민_20260206.md
📄 파일 형식: Markdown (.md)
📊 파일 크기: 약 50~100KB
📊 최종 결과물:
핵심 포인트:
수집 시점 (Gemini/Naver) ≠ 평가 시점 (4 AIs)
→ 타이밍 분리로 독립적 판단 보장
모든 AI가 카테고리당 100개(버퍼 20%, 최대 120개), 전체 1,000개(최대 1,200개) 평가 (독립적, 배치 25개씩)
→ 편향 상쇄, 균형 잡힌 평가
수집 검증 (버퍼 20% 이내, 최대 120%) + 평가 검증 (95% 이상)
→ 품질 보장
수집 테이블 (rating 없음) ≠ 평가 테이블 (rating 있음)
→ collected_data_id로 연결
Rating 평균 → 점수(×2) → 카테고리 점수 → 최종 점수
→ 일관된 계산 방식
politicians + collected_data_v40 + evaluations_v40 + ai_final_scores_v40
→ 완전한 보고서 생성
API ~$46/정치인 → CLI ~$1.13/정치인
| 단계 | 테이블 | 데이터 개수 | rating 필드 |
|---|---|---|---|
| Phase 0 | (준비) | API키/DB확인 | - |
| Phase 1 | politicians | 1개 | ❌ 없음 |
| Phase 2 | collected_data_v40 | 1,000~1,200개 (버퍼 20%) | ❌ 없음 |
| Phase 3 | (검증) | 중복/위반 제거 | - |
| Phase 2-2 | (조정) | AI별 500-600개 균형 | - |
| Phase 3 | evaluations_v40 | 4 AI × 수집 개수 (95% 이상) | ✅ 있음 (8등급, X=제외) |
| Phase 3-1 | (검증) | 95% 완성도 확인 | - |
| Phase 3 | ai_final_scores_v40 | 1개 | ❌ 없음 (점수만) |
| Phase 5 | (보고서) | .md 파일 1개 | - |
Stoker et al. — University of Southampton, 7개 민주주의 국가 유권자 인지구조 분석
3축: Competence (역량) · Integrity (청렴) · Authenticity (진정성)
PoliticianFinder: CBA 3축 → 10개 카테고리로 확장
| 연구/시스템 | 기여 |
|---|---|
| Volden & Wiseman | Center for Effective Lawmaking, 입법 효율성 정량 측정 |
| Transparency International | 부패 측정 방법론, 13개 평가 항목 |
| Jacobson (Stanford) | 언론의 정치인 스캔들/성과 보도 분석 |
| Slough et al. (World Bank) | 개발도상국 책임성/대응성 측정 |
| LEVER | 유럽 지방선거 평가, 대응성/투명성 방법론 |
| UN SDG 16 | 투명성, 책임성, 공정성 |
| OECD | 공공 부문 거버넌스 원칙 |
| # | 카테고리 | CBA 대분류 | 참고 연구 |
|---|---|---|---|
| 1 | 전문성 (Expertise) | Competence | Volden & Wiseman, Stoker et al. |
| 2 | 리더십 (Leadership) | Competence | Volden & Wiseman, LEVER |
| 3 | 비전 (Vision) | Competence | Stoker et al., UN SDG 16 |
| 4 | 청렴성 (Integrity) | Integrity | TI, Jacobson |
| 5 | 윤리성 (Ethics) | Integrity | OECD, Jacobson |
| 6 | 책임감 (Accountability) | Integrity | Slough et al., UN SDG 16 |
| 7 | 투명성 (Transparency) | Integrity | LEVER, UN SDG 16 |
| 8 | 소통능력 (Communication) | Authenticity | Stoker et al., LEVER |
| 9 | 대응성 (Responsiveness) | Authenticity | Slough et al., LEVER |
| 10 | 공익성 (Public Interest) | Authenticity | LEVER, Slough et al. |
정의: 직무 수행에 필요한 지식, 기술, 경험 보유 수준
| # | 평가 항목 | 설명 |
|---|---|---|
| 1-1 | 최종 학력 수준 | 박사/석사/학사/전문대 학위 |
| 1-2 | 직무 관련 자격증 | 변호사, CPA, 교원자격증 등 |
| 1-3 | 관련 분야 경력 연수 | 공직+민간 경력 합산 |
| 1-4 | 직무 교육 이수 | 의회/기관 교육 참여 시간 |
| 1-5 | 전문 분야 기고/저서 | 전문지 기고, 저서 출판 |
| 1-6 | 학술 연구 실적 | 논문, Google Scholar 피인용 |
| 1-7 | 위키피디아 전문성 기술 | 학력/경력 조회수 |
| 1-8 | 전문 분야 평가 기록 | 학술/전문 분야 외부 평가 |
| 1-9 | 위원회 활동 기록 | 자문위원, 심의위원 활동 |
| 1-10 | 전문성 관련 언론 평가 | 전문성 키워드 보도 |
긍정 키워드: 전문가 뉴스, 경력 우수, 법안 발의 성과, 정책 전문
부정 키워드: 학력 위조, 경력 논란, 무능, 전문성 부족
자유 키워드: 학력 성명서, 경력 발표, 이력 기자회견, 프로필
정의: 조직과 사람을 효과적으로 이끌어 목표 달성 능력
| # | 평가 항목 | 설명 |
|---|---|---|
| 2-1 | 법안 발의 건수 | 대표발의 법안 수 |
| 2-2 | 법안 통과율 | 발의 대비 통과 비율 |
| 2-3 | 위원회 위원장 경험 | 상임위/특위 위원장 |
| 2-4 | 당직 경력 | 당대표, 원내대표, 최고위원 |
| 2-5 | 조직 확대 실적 | 당원 증가, 지지율 상승 |
| 2-6 | 위기 대응 사례 | 재난/사건 대응 리더십 |
| 2-7 | 정책 추진력 | 주요 정책 관철 사례 |
| 2-8 | 리더십 관련 언론 평가 | 리더십 키워드 보도 |
| 2-9 | 의회 협력 활동 기록 | 여야 협상, 연대 활동 |
| 2-10 | 리더십 관련 평가 기록 | 리더십 외부 평가 |
긍정 키워드: 리더십 뉴스, 추진력, 법안 통과, 위기 대응 성공
부정 키워드: 리더십 부재, 조직 분열, 법안 무산, 당내 갈등
자유 키워드: 위원회 활동 성명서, 당직 발표, 의정활동 기자회견
정의: 미래를 예측하고 장기적 목표 제시 능력
| # | 평가 항목 | 설명 |
|---|---|---|
| 3-1 | 중장기 발전 계획 | 4년 이상 계획 수립 여부 |
| 3-2 | 미래 투자 예산 | R&D, 교육, 신산업 예산 비율 |
| 3-3 | 사회 발전 관련 예산 | 환경, 기후, 복지 예산 |
| 3-4 | 기술 발전 관련 정책 | AI, 스마트시티 예산/사업 |
| 3-5 | 미래 정책 제안 | 혁신, 미래 키워드 정책 |
| 3-6 | 청년층 정책 | 청년 대상 정책 발의/추진 |
| 3-7 | 해외 사례 벤치마킹 | 해외 정책 도입 사례 |
| 3-8 | 미래 키워드 보도 | 혁신, 미래, 디지털 보도 |
| 3-9 | 장기 공약 제시 | 임기 후에도 지속되는 공약 |
| 3-10 | 비전 관련 연설/기고 | 미래 비전 연설, 기고문 |
긍정 키워드: 혁신 뉴스, 미래지향, 비전 제시
부정 키워드: 구태, 비전 부재, 안일
자유 키워드: 정책 방향 성명서, 비전 기자회견
정의: 금전적/물질적 부패 저지르지 않는 자질
| # | 평가 항목 | 설명 |
|---|---|---|
| 4-1 | 금전 관련 형사 판결 내용 | 뇌물, 횡령, 배임 관련 판결 |
| 4-2 | 재산 신고 변동 현황 | 재산 증감 내역 |
| 4-3 | 공직자윤리법 관련 기록 | 공직자윤리위 심의 내용 |
| 4-4 | 정치자금법 관련 기록 | 선관위 관련 처분 내용 |
| 4-5 | 선거법 관련 기록 | 선거 관련 위반 내용 |
| 4-6 | 금전 관련 언론 보도 | 금전/재산 키워드 보도 |
| 4-7 | 한국투명성기구 평가 | TI Korea 청렴도 등급 |
| 4-8 | 시민단체 청렴 평가 | 참여연대 등 청렴 평가 |
| 4-9 | 정치자금 관련 보도 | 정치자금 키워드 보도 |
| 4-10 | 청렴 관련 평가 기록 | 청렴 외부 평가 |
긍정 키워드: 청렴 뉴스, 깨끗한 정치, 청렴도 1위
부정 키워드: 비리 의혹, 뇌물, 횡령, 정치자금 위반
자유 키워드: 재산 신고 성명서, 감사원 발표
정의: 사회적 규범과 도덕적 품위 유지 자질
| # | 평가 항목 | 설명 |
|---|---|---|
| 5-1 | 형사 판결 기록 | 비부패 형사범죄 판결 내용 |
| 5-2 | 성문제 관련 판결 내용 | 성범죄 관련 판결 |
| 5-3 | 윤리위원회 심의 내용 | 의회 윤리위 심의 |
| 5-4 | 국가인권위 시정권고 | 인권위 권고/결정 |
| 5-5 | 저작 관련 검증 기록 | 논문, 저서 검증 내용 |
| 5-6 | 공개 발언 태도 관련 보도 | 발언 태도 키워드 보도 |
| 5-7 | 사회 배려 문제 발언 관련 보도 | 성별, 지역, 세대 발언 보도 |
| 5-8 | 품위유지 관련 보도 | 품위 키워드 보도 |
| 5-9 | 시민단체 윤리 평가 | 윤리성 평가 점수 |
| 5-10 | 가족문제 관련 보도 | 가족 관련 보도 |
긍정 키워드: 도덕적 뉴스, 모범, 품위
부정 키워드: 논란, 막말, 표절, 가족 논란
자유 키워드: 인사청문회 성명서, 검증 기자회견
정의: 맡은 직무와 약속에 끝까지 책임지는 자세
| # | 평가 항목 | 설명 |
|---|---|---|
| 6-1 | 공약 이행률 | (완료 공약/총 공약) × 100 |
| 6-2 | 회의 출석률 | 본회의, 위원회 출석률 |
| 6-3 | 예산 집행률 | (집행액/확정 예산) × 100 |
| 6-4 | 감사 지적 개선 | 감사 지적 개선 완료율 |
| 6-5 | 매니페스토 평가 등급 | 공약 이행 평가 등급 |
| 6-6 | 의정 활동 보고 빈도 | 정기적 활동 보고 |
| 6-7 | 시민단체 의정 감시 평가 | 참여연대 등 평가 점수 |
| 6-8 | 직무 수행 관련 보도 | 직무 수행 키워드 보도 |
| 6-9 | 책임 이행 관련 보도 | 책임 이행 키워드 보도 |
| 6-10 | 사후 책임 이행 | 실패 인정, 개선 약속 이행 |
긍정 키워드: 공약 이행 뉴스, 책임 완수, 성실
부정 키워드: 공약 불이행, 직무 태만, 책임 회피
자유 키워드: 공약 성명서, 의정활동 기자회견, 출석
정의: 정보를 투명하게 공개하고 숨기지 않는 자세
| # | 평가 항목 | 설명 |
|---|---|---|
| 7-1 | 정보공개 청구 응답률 | 정보공개포털 응답률 |
| 7-2 | 회의록 공개율 | 회의록 완전 공개 비율 |
| 7-3 | 재산 공개 성실도 | 재산 상세 기재 여부 |
| 7-4 | 예산 집행 상세 공개 | 세목 공개 수준 |
| 7-5 | 자료 제출 성실성 관련 보도 | 청문회 등 자료 제출 관련 |
| 7-6 | 정보공개센터 평가 | 정보공개 우수 사례 등재 |
| 7-7 | 투명성 관련 보도 | 투명, 공개 키워드 보도 |
| 7-8 | 정보공개 관련 보도 | 비공개 결정 관련 보도 |
| 7-9 | 언론 대응 투명성 | 기자회견, 질의응답 참여 |
| 7-10 | 일정 공개 수준 | 공식 일정 사전 공개 |
긍정 키워드: 투명 공개 뉴스, 정보공개 우수, 공개 행정
부정 키워드: 자료 제출 거부, 비공개, 은폐
자유 키워드: 정보공개 성명서, 재산 신고 기자회견, 회의록
정의: 국민과 효과적으로 대화하고 의견 교환 능력
| # | 평가 항목 | 설명 |
|---|---|---|
| 8-1 | 시민 간담회 개최 | 연간 간담회 건수 |
| 8-2 | 공청회/토론회 개최 | 연간 공청회/토론회 건수 |
| 8-3 | 공식 소통 채널 운영 | 홈페이지, SNS 운영 개수 |
| 8-4 | 시민 제안 수용 | 제안 수용 건수/비율 |
| 8-5 | SNS 소통 활동 | 팔로워 × 참여율 |
| 8-6 | SNS 댓글 응답 | 댓글 응답 건수/비율 |
| 8-7 | 토론 참여 평가 | 토론 능력 언론 평가 |
| 8-8 | 소통 적극성 관련 보도 | 소통 키워드 보도 |
| 8-9 | 경청 자세 평가 | 경청, 공감 관련 평가 |
| 8-10 | 소통 관련 평가 기록 | 소통 외부 평가 |
긍정 키워드: 소통 뉴스, 친근, 소통왕
부정 키워드: 불통, 소통 부재, 권위적
자유 키워드: 인터뷰 성명서, SNS 발표
정의: 민원/요구/피드백에 신속하고 적절하게 대응 능력
| # | 평가 항목 | 설명 |
|---|---|---|
| 9-1 | 주민참여예산 규모 | 참여예산 금액 |
| 9-2 | 정보공개 처리 기간 | 평균 처리 일수 |
| 9-3 | 주민 제안 반영 | 반영 건수/비율 |
| 9-4 | 지역 현안 대응 | 현장 점검, 대책 발표 건수 |
| 9-5 | 재난 대응 실적 | 재난 현장 대응 평가 |
| 9-6 | 위기 대응 보도 | 위기 대응, 재난 대응 보도 |
| 9-7 | 현장 방문 보도 | 현장 방문 키워드 보도 |
| 9-8 | 민원 처리 만족도 | 민원 처리 만족도 조사 |
| 9-9 | 대응 속도 관련 보도 | 대응 속도 키워드 보도 |
| 9-10 | 현장 대응 관련 보도 | 재난 시 현장 대응 보도 |
긍정 키워드: 민원 해결 뉴스, 신속 대응, 국민 목소리 경청
부정 키워드: 민원 무시, 대응 부재, 국민 외면
자유 키워드: 민원 처리 성명서, 요구사항 기자회견, 청원 답변
정의: 공익을 우선시하고 사회에 기여하는 자세
| # | 평가 항목 | 설명 |
|---|---|---|
| 10-1 | 사회복지 예산 비율 | (복지 예산/전체 예산) × 100 |
| 10-2 | 취약계층 지원 프로그램 | 장애/노인/아동 지원 사업 |
| 10-3 | 환경/기후 예산 | 환경 예산 비율/증가율 |
| 10-4 | 지역 균형 발전 예산 | 낙후 지역 투자 비율 |
| 10-5 | 공익 활동 보도 | 봉사, 취약계층 보도 |
| 10-6 | 사회공헌 SNS 게시 | 공익 게시물 비중 |
| 10-7 | 공익 법안 발의 | 공익 목적 법안 발의 실적 |
| 10-8 | 이익 상충 관련 보도 | 이익 상충 키워드 보도 |
| 10-9 | 지역 균형 관련 보도 | 지역 균형 키워드 보도 |
| 10-10 | 공익 관련 평가 기록 | 공익 외부 평가 |
긍정 키워드: 공익 활동 뉴스, 사회 공헌, 약자 보호
부정 키워드: 특혜, 특정 이익, 공익 외면
자유 키워드: 복지 정책 성명서, 사회 활동 기자회견, 공익 사업
| 기호 | 이름 | 의미 |
|---|---|---|
| P(H) | Prior (사전 확률) | 데이터를 보기 전의 믿음 |
| P(D|H) | Likelihood (우도) | 가설이 참일 때 이 데이터가 나올 확률 |
| P(H|D) | Posterior (사후 확률) | 데이터를 본 후 갱신된 믿음 |
| P(D) | Evidence (증거) | 정규화 상수 |
핵심 구조: 사후 믿음 = 사전 믿음 × 관측 데이터의 영향
Prior만으로 결정 안 됨, 데이터만으로도 결정 안 됨 → 둘의 결합 = 베이지안 기본 원리
정통 베이지안: 데이터 축적 시 Prior 감소, 최종적으로 데이터가 결론 지배
V40 설계: Prior는 고정 (데이터 10개든 10,000개든 Prior 기여분 항상 60점)
이유 1: 정치인이라는 존재의 전제
이유 2: 신인의 지속적 유입
| 베이지안 이론 요소 | 적용 여부 | 근거 |
|---|---|---|
| 사전 믿음(Prior) 존재 | ✅ 적용 | 선출직의 민주적 기본 신뢰 |
| Prior + Data = Posterior 결합 | ✅ 적용 | 60 + Rating Score × 5 = 점수 |
| 증거 부재 ≠ 부재의 증거 | ✅ 적용 | 데이터 없는 정치인 ≠ 0점 |
| 데이터 축적 시 Prior 감소 | ❌ 미적용 | 민주적 신뢰 불소멸 + 신인 유입 통일 필요 |
한 문장 요약: V40은 베이지안에서 "합리적 사전 믿음을 명시하고 데이터와 결합"하는 핵심 원리를 적용하되, Prior의 동적 감소는 정치 도메인 본질(선출직의 기본 신뢰, 신인의 지속적 유입)에 맞지 않으므로 고정 기준선으로 운용.
| 연구 | 대상 | 발견 |
|---|---|---|
| Garthwaite & Moore (2013) | 2008 Obama 경선 | 종합 평가 → 약 100만 표 증가 |
| Schuster (2023) | 1960-1980 대통령 선거 | 신문사 종합 평가 → 2,000만 표 이동 |
| DeLuca / Harvard (2022) | 1950-2020 전체 선거 | 종합 평가 → 3.8-8.6%p 득표율 증가 |
| Volden & Wiseman (2014) | "가장 효과적인 의원 TOP 10" | 전원 재선 성공 |
| LCV (2012-2024) | 환경 평가 | 낮은 의원 → 70-84% 패배율 |
종합 평가가 단일 지표보다 강력함 | 대통령/의회/지방선거 모두 검증됨