Locale București 2025 - o prognoză electorală și ce am învățat că nu știm

Locale București 2025 - o prognoză electorală și ce am învățat că nu știm

Salut, salut!

Anul trecut am publicat pe Facebook o prognoză pentru alegerile prezidențiale. A fost un eșec răsunător. Am ratat colosal atât eu, cât și casele de sondaje de la care am luat datele. M-am simțit prost? Not really. Dar m-am gândit serios să renunț la toată treaba asta de forecasting, pentru că este evident că sondajele nu mai sunt ce au fost și social media ne sabotează cifrele.

OK, am zis: "Hai să înțeleg ce-am greșit." Așa că, în următoarele luni, am continuat să experimentez — dar de data asta în privat, fără să mai public nimic. Am făcut modele pentru alegerile prezidențiale din România 2025, dar și pentru parlamentarele din Moldova 2025. Nu mi-a ieșit chiar 100%, dar am început să găsesc întrerupătorul pe întuneric din ce în ce mai eficient. Din fiecare model aproape corect am învățat câte ceva.

După luni de experimente și iterații, cred că am un model mai bun. M-am sfătuit și cu prietenii mei imaginari și am ajuns toți la o concluzie comună. Versiunea asta de model nu e perfectă, deloc perfectă, dar e mai bună. Și de data asta, vreau să fiu transparent: să vă arăt ce face modelul, cum funcționează, ce ipoteze are, și cât de nesigure sunt predicțiile.

Ce mi se pare cel mai important este onestitatea despre incertitudine. Câteodată mi se pare mai importantă decât încrederea falsă în predicții. Cred că suntem toți sătui de "clarvăzătorii" vedete care își împing teoriile cu aceeași încredere inclusiv când e clar că le scot din neant.

Disclaimer-ul de rigoare: Nu știu cine câștigă. Modelul poate greși din nou. Dar cel puțin de data asta, vă spun exact cât de mult poate greși.

Buckle up, că e lung. Let's do this!

Ce am învățat din modelele din trecut?

Câștigătorul este subestimat sistematic

În București 2024, Nicușor Dan a fost subestimat de sondaje cu +8 puncte procentuale (prezis la ~40%, a luat 47,9%). În experimentele pe alte alegeri, am văzut pattern-uri similare: liderul e subestimat cu 5-15 puncte. De ce?

  • Pentru că poate apărea mobilizare masivă în ultima săptămână
  • "Votul util": Că le place sau nu, o mare parte din electorat votează cu cine are șanse nu neapărat emoțional. Unele decizii se iau chiar în cabina de vot.
  • Votanții de ultimul moment tind să meargă spre câștigător
  • Efectul de "bandwagon" toată lumea vrea să fie în tabăra câștigătoare

Partidele mici sunt supraevaluate în sondaje

Candidații cu mai puțin de 10% în sondaje tind să ia mai puțin decât arătau cifrele. Oamenii spun că votează cu X, dar în cabina de vot zic: "Stai, ăsta are vreo șansă?" și trec la candidați mari - vezi votul util de mai sus. În experimentele mele, partidele/candidații mici au fost supraevaluați cu 2-3 puncte procentuale fiecare. Nu pare mult, dar când le aduni, acele puncte se duc direct la câștigător.

De asta modelul aplică un "discount" de 10% pentru toți candidații sub 10%. Nu pentru că ar fi mai slabi, ci pentru că așa se comportă votanții.

Incertitudinea e mare... foarte mare

Modelele anterioare foloseau incertitudine de +/-3%, preluată în general. Dar în realitate, evoluția din ultima lună poate fi de 10-15% în plus sau în minus. Drept urmare, intervalele de încredere trebuiau să fie muuuuult mai largi. Practic, modelele erau mult prea încrezătoare în predicții. Classic overconfidence.

Poll herding

Când toate casele de sondaje arată cifre similare, e un semn de "herding" — se copiază unii pe alții sau își ajustează rezultatele ca să nu iasă outlieri și să nu fie "cel care a greșit". Da, da, știu "noi nu facem așa ceva!"...

Când se întâmplă asta, incertitudinea reală e mult mai mare decât par să indice datele. Dar modelele nu știau asta.

Modelul - București 2025 versiunea... nici nu mai știu a câta

Am integrat tot ce am învățat într-un model nou pentru alegerile locale din București (7 decembrie 2025). În teorie modelul este simplu: adunăm toate datele la un loc, aplicăm corecții pentru încrederea și ajustări, ponderi pentru fiecare componentă, aplicăm coeficienți pentru incertitudine, rulăm modelul de 50.000 de ori și ta-daaa! Avem prognoză!

Ei bine, da și nu... Ce am învățat eu și ce am inclus în model:

Ponderea sondajelor pe bază de calitate

În 2024, la locale în București, am avut mai multe case de sondaje. Doar că nu toate au estimat la fel de bine. Am comparat fiecare casă de sondaje cu rezultatele reale din iunie 2024 și am calculat Mean Absolute Error (MAE) — adică cât au greșit în medie. În loc să transform MAE-ul într-o formulă matematică prea sensibilă, am preferat gruparea în 3 categorii clare. De ce? Pentru că diferențele dintre firmele de sondaje nu sunt suficient de mari încât să justifice variații la zecimală. Prefer un sistem clar și stabil, care să reducă influența sondajelor care au avut probleme repetate și să creștem puțin ponderea celor care în trecut au fost mai aproape de realitate.

Casa de sondaje Eroare medie 2024 (MAE) Pondere 2025
AtlasIntel 2,0% 1,0
IPSOS 4,5% 1,0
INSCOP 5,0% 1,0
Sociopol 5,1% 0,85
ARA 5,9% 0,85
IRSOP 5,9% 0,85
Avangarde 6,3% 0,85
CURS 8,5% 0,70

AtlasIntel a fost cel mai aproape de adevăr, CURS... mai puțin. Așa că le-am dat ponderi diferite în media sondajelor. Astfel nu mai băgăm aceleași "kilograme" de sondaj în sacoșă, ca la piață.

Peste pondere dată de eroare, am aplicat și o pondere dată de recența sondajelor. Sondajele mai vechi primesc ponderi mai mici, cu un "half-life" de 14 zile (adică: un sondaj de acum 14 zile primește jumătate din ponderea unuia de azi).

"Discount" pentru partide mici

În aproape toate alegerile pe care le-am analizat, candidații mici au fost supraevaluați în sondaje, ~2–3 puncte procentuale. Când intră “votul util” în joc aceștia pierd substanțial din puținul pe care îl au.

În model am ales să folosesc o corecție proporțională: reduc scorul lor din sondaje cu 10% din valoarea lor raportată. Dacă un candidat are 8%, scade la 7,2%. Dacă are 4%, scade la 3,6%. De ce? Pentru că votanții abandonează candidații mici în aceeași proporție. E întrebarea aia reflex "oare are vreo șansă"? Și a naibii dacă nu te lovește fix în cabina de vot.

Ajustarea e moderată, nu transformă clasamentul, dar îndepărtează din model optimismul artificial din sondaje.

Incertitudine mărită... multișor

Modelele anterioare erau mult prea încrezătoare. Intervalele de încredere erau prea strânse. Realitatea a fost în repetate rânduri mult mai volatilă decât estimările.

Noul model are următoarele componente de incertitudine:

Componentă Valoare Ce înseamnă
Eroare de bază 2,5% Eroarea medie a sondajelor în București 2024
Mișcare târzie 2% Cât se pot schimba lucrurile în ultima săptămână
Leader surge 1,5% Bonus de incertitudine pentru lider (poate să "explodeze")
Variabilitate sondaje ~1,5% Cât de mult diferă sondajele între ele
House effects ~0,5% Bias-urile specifice ale fiecărei case de sondaje
Total ~4-5% Toate combinate (teorema lui Pitagora)

De ce nu le aduni direct?

Dacă ai aduna simplu: 2.5 + 2 + 1.5 + 1.5 + 0.5 = 8%. Dar asta ar presupune că toate erorile se întâmplă simultan în aceeași direcție. Asta nu prea se întâmplă în viața reală. Erorile sunt independente — unele merg într-o direcție, altele în alta. Câteodată se anulează reciproc. De-asta folosim teorema lui Pitagora:

√(2.5² + 2² + 1.5² + 1.5² + 0.5²) ≈ 4%.

Mai simplu spus, e exact ca atunci când calculezi ipotenuza unui triunghi: dacă mergi 3 metri Nord și 4 metri Est, nu ai parcurs 7 metri în linie dreaptă, ci 5 metri (√(3² + 4²) = 5).

"Herding" much?

Dacă ultimele 5 sondaje arată toate un candidat între 24-26% (variație sub 2%), modelul automat mărește incertitudinea cu 20-30%. Pentru că, statistic, e imposibil ca rezultatele a 5 case de sondaje independente să ducă la rezultate atât de similare. Unii se uită la alții. Doar zic, nu dau cu paru'!

Integrare cu pieței Polymarket

Am zis să mă dau deștept așa că am zis să îi luăm și pe oamenii ăștia în considerate. Păi de ce? Că i-am interzis în România. Well, da și nu... Polymarket nu e un sondaj. E un barometru de percepție unde oamenii riscă bani reali. Uneori prinde schimbările de direcție mai repede și mai exact decât sondajele, alteori se pierde în hype-ul crypto și se duce după cumpărători.. Problema majoră este: cât de mult să le luăm în serios?

Ca să nu las niciuna dintre surse să domine, am făcut un sistem de amestec bazat pe cât de bine se aliniază piața cu sondajele. Folosesc corelația ca indicator: când piețele și sondajele arată aceeași poveste, cresc ponderea pieței; când o iau în direcții diferite, reduc. Am creat reguli simple, subiective sau obiective... Who knows?!

  • Dacă corelația > 0,9 → 40% ponderea pieței
  • Dacă corelația 0,8-0,9 → 30% ponderea pieței
  • Dacă corelația 0,7-0,8 → 20% ponderea pieței
  • Dacă corelația < 0,7 → 10% ponderea pieței

Pragurile (40%, 30%, 20%, 10%) nu sunt legi. Sunt un cadru simplu care mi-au permis să folosesc piața doar atunci când oferă un semnal util și să o ignor când pare zgomot.

La corelația actuală de 0.853, piața e destul de aliniată cu sondajele, deci primește 30% din pondere. Suficient încât să conteze, insuficient încât să răstoarne modelul singură.

Distribuția Dirichlet sau cum să faci matematică și să nu trișezi

Aici devine tehnic, dar e important: când generezi simulări, nu e ok să faci pur și simplu 7 variabile aleatorii independente și să le normalizezi la 100%. De ce? Pentru că voturile sunt corelate — dacă Băluță crește, altcineva trebuie să scadă.

M-am sfătuit cu geniile internetului și am ajuns la o distribuție Dirichlet, care asigură că:

  • Voturile se adună întotdeauna la 100%
  • Sunt corect corelate (când unul urcă, alții scad)
  • Incertitudinea e realistă, nu artificială

Sună complicat? Este. Dar e mai corect așa.

Ce arată modelul pentru București 2025? (La data de 17 noiembrie)

ATENȚIE! Cifrele de mai jos NU sunt predicții. Sunt estimări bazate pe sondaje și piața de pariuri, ajustate conform descrierii de mai sus. Realitatea poate fi complet diferită. Serios.

Prognoza principală (mediană din 50.000 de simulări):

Candidat Prognoză Interval 95% CI Probabilitate câștig
Ciprian Ciucu (PNL) 28.4% 21% - 36% 59.5%
Daniel Băluță (PSD) 26.3% 19% - 34% 34.0%
Cătălin Drulă (USR) 21.7% 15% - 29% 6.5%
Anca Alexandrescu (AUR) 15.0% 10% - 21% <1%
Ana Ciceală (SENS) 3.4% 1% - 6% <1%
Vlad Gheorghe (DREPT) 2.5% 1% - 5% <1%
Virgil Zidaru (PACE) 2.8% 1% - 5% <1%

Ce înseamnă numerele astea?!

De ce e Ciucu e pe primul loc în model (28.4%) când în sondaje Băluță e pe primul loc (23.2% vs 20.7%)?

Păi, lucrurile stau cam așa. Modelul nu e doar o medie de sondaje. Modelul aplică mai multe ajustări:

  1. pondere bazată pe calitate: AtlasIntel (care dă îi dă lui Ciucu un scor mai bun) primește pondere 1.0, pentru că a fost mai precis în 2024 față de CURS (care îi dă lui Băluță un scor mai bun), care primește doar 0.70
  2. Integrare cu Polymarket: Piața de pariuri îi dă lui Ciucu șanse mult mai mari. Modelul folosește 30% pondere pentru piață (corelație 0.853 = aliniere relativ bună între sondaje și piață).
  3. "Discount" pentru partide mici: Alexandrescu, Ciceală, Gheorghe, Zidaru primesc toți un discount de 10%, pentru că, istoric, candidații mici sunt supraestimați. Acele procente se redistribuie către candidații mari.
  4. Indeciși: 9,7% indecişi (din sondajul AtlasIntel) se distribuie, cu un bonus de 10% pentru lider.

Deci, Ciucu urcă de la 20.7% (medie brută) la 28.4% (după toate ajustările). Băluță urcă de la 23.2% la 26.3%.

DAR!!!

Ciucu e favorit... dar nu câștigător sigur!

Probabilitate de 59.5% înseamnă că Ciprian Ciucu e mai probabil să câștige decât să piardă. Dar asta nu este o garanție. Practic, dacă am repeta alegerile de 100 de ori cu aceleași condiții, Ciucu ar câștiga în ~60 de cazuri. În restul de 40, câștigă altcineva.

Băluță și Drulă nu sunt atât de aproape cum arată sondajele

Diferența dintre Băluță (26.3%) și Drulă (21.7%) pare să fie stabilă. Dar atenție! Băluță are 34% șanse să câștige, în timp ce Drulă doar 6.5%.

De ce diferența mare în probabilități? Pentru că în majoritatea simulărilor, Băluță iese fie pe locul 1, fie pe locul 2. Drulă tinde să rămână pe 3. Scenariile în care ajunge pe primul loc sunt mult mai puține.

Intervalele de încredere sunt URIAȘE

Ciucu poate lua între 21% și 35%. Asta e o diferență de 14 puncte procentuale! Nu e "plus-minus un pic", e diferența dintre "câștigător detașat" și "abia locul 2-3". Dar din păcate cu datele pe care le avem cam asta putem spune acum. Poate revenim.

Alexandrescu are șanse aproape zero să câștige

La 15% în sondaje și practic 0% probabilitate de câștig, Alexandrescu poate lua aproape sigur locul 4, dar fără șanse reale să urce pe podium. "Mulțumim de participare, dar nu."

Candidații mici (<5%) au șanse aproape zero

Nu pentru că n-ar fi buni, ci pentru că votanții abandonează candidații fără șanse în ultimele zile.

Scenarită acută: Ce se poate întâmpla?

Dar lucrurile nu merg niciodată așa cum plănuim. Așa că am testat câteva scenarii cheie. Or mai fi și altele, bineînțeles. Dar am zis să nu citiți articolul ăsta până vă ia somnul.........

Scenariul de bază (Probabilitate câștig: Ciucu 59,5%)

  • Ciucu: 28,4%
  • Băluță: 26,3%
  • Drulă: 21,7%

Acesta e scenariul central, cel mai probabil pe baza datelor. Ciucu în frunte cu 2%, dar diferența e fragilă.

Scenariul "Prezență mare" (Favorabil Drulă)

  • Ciucu: 27,9% (-0,5%)
  • Drulă: 22,9% (+1,2%)
  • Băluță: 25,6% (-0,7%)

Ce se întâmplă: Prezență 52-55%, tinerii ies la vot, mobilizare urbană. Drulă câștigă teren, dar nu suficient. Ciucu rămâne în frunte cu o marjă mai mică față de scenariul de bază

Scenariul "Prezență mică" (Favorabil Ciucu)

  • Ciucu: 29,1% (+0,7%)
  • Băluță: 26,7% (+0,4%)
  • Drulă: 20,6% (-1,1%)

Ce se întâmplă: Prezență 42-45%, electorat stabil mobilizat, tinerii stau acasă. Ciucu își consolidează avantajul. PSD și PNL au mașinării bune de mobilizare, USR depinde de entuziasmul spontan.

Scenariul "Sondajele subestimează liderul" (Ciucu +3%)

  • Ciucu: 30,8% (+2,4%)
  • Băluță: 25,9% (-0,4%)
  • Drulă: 20,8% (-0,9%)
  • Probabilitate câștig Ciucu: ~77%

Ce se întâmplă: Patternul din București 2024 se repetă (Nicușor Dan +8% față de sondaje). Ciucu primește un impuls de creștere în ultima săptămână, "vot util", mobilizare masivă PNL. În București 2024, liderul a fost subestimat. Dacă se întâmplă din nou, Ciucu câștigă detașat.

Scenariul "Sondajele supraestimează liderul" (Băluță favorit)

  • Băluță: 27,7% (+1,4%)
  • Ciucu: 26,2% (-2,2%)
  • Drulă: 22,2% (+0,5%)
  • Probabilitate câștig Băluță: ~54%

Ce se întâmplă: Sondajele greșesc dar invers. Ciucu e supraestimat, Băluță subestimat. PSD mobilizează mai bine decât arată datele. Nu toate alegerile urmează același pattern. Totul e posibil.

Scenariul "Impuls Ciucu (+5%)"

  • Ciucu: 33,4% (+5,0%)
  • Băluță: 25,5% (-0,8%)
  • Drulă: 20,9% (-0,8%)

Ce se întâmplă: Eveniment major în ultima săptămână — endorsement puternic, gafă majoră a adversarilor, campanie virală, mobilizare explozivă. Ciucu câștigă lejer. Game over.

Scenariul "Impuls Băluță (+5%)"

  • Băluță: 31,3% (+5,0%)
  • Ciucu: 27,5% (-0,9%)
  • Drulă: 20,9% (-0,8%)
  • Probabilitate câștig Băluță: ~71%

Ce se întâmplă: PSD activează mașinăria locală la maxim, Băluță primește un boost neașteptat, sau Ciucu face o gafă majoră. Băluță câștigă clar.

Scenariul "Impuls Drulă (+5%)"

  • Drulă: 26,7% (+5.0%)
  • Ciucu: 27,5% (-0.9%)
  • Băluță: 25,5% (-0.8%)
  • Probabilitate câștig Drulă: ~34%

Ce se întâmplă: Scandal major PSD+PNL, val de indignare, mobilizare masivă tineret, Drulă devine "candidatul schimbării". Dar chiar și cu +5%, Drulă nu devine favorit clar, doar face cursa extrem de strânsă. Ar avea nevoie de 7-8% ca să fie favorit.

Ce nu știm

Prezența la vot

Dacă prezența e scăzută (~42-45%), Ciucu poate lua 29,1% din voturi (cu probabilitate câștig de 63%), Băluță 26,7% (probabilitate de câștig 33%), Drulă 20.6% (probabilitate câștig 3%). Prezența scăzută îi favorizează pe Ciucu și Băluță (electorat stabil, PSD/PNL, organizație bună la mobilizare).

Dacă prezența e ridicată (~52-55%), Ciucu poate lua 27,9% (cu probabilitate câștig de 58%), Drulă 22,9% (probabilitate câștig 12%), iar Băluță: 25,6% (probabilitate câștig: 30%). Prezența mare îl favorizează pe Drulă (tineri mobilizați, vot anti-sistem). Diferența nu e uriașă, dar e vizibilă. Iar șansele lui Drulă se dublează.

Nu știm ce va fi. Prezența la locale în București variază istoric între 40% și 55%.

Cum se împart votanții indecişi

Modelul alocă indecișii proporțional, cu un bonus de 10% pentru lider. Dar în realitate pot merge 80% la câștigător ("vot util"), sau uniform la toți, sau la candidații anti-sistem (protest).

Nu știm ce vor face.

Campania ultimei săptămâni

O gafă, un scandal, o declarație proastă, un sprijin neașteptat, orice bec pe care calcă poate schimba 3-5% în 48 de ore. Experimentele m-au învățat că ultima săptămână contează enorm. Dar nu putem modela ce nu s-a întâmplat încă.

Cât de mult greșesc sondajele de data asta

Poate sondajele au dreptate. Poate subestimează liderul cu 5-10% (ca în alte alegeri pe care le-am analizat). Poate îl supraestimează. Poate greșesc din cu totul alte motive. Habar nu am!

Și acum?

Voi încerca actualizarea modelului până la alegeri (7 decembrie 2025 - mai sunt 23 de zile). Pe măsură ce apar sondaje noi, cifrele se vor schimba.

IMPORTANT: Dacă citești asta după 17 noiembrie, cifrele pot fi deja diferite! Verfică dacă este versiunea cea mai recentă.

După alegeri, voi face (din nou) un post-mortem complet: cât am greșit, de ce am greșit, ce am învățat. Pentru că, cel mai probabil, voi greși din nou. Dar sper că mai puțin decât în trecut.

Nu uitați: Cifrele astea nu sunt "adevărul". Sunt cea mai bună estimare pe care o pot face cu datele disponibile acum. Realitatea va fi alta. Întotdeauna e.

Ne auzim la următoare analiză. Fir întins!

Alex

P.S. Dacă sunteți de la o casă de sondaje și v-am jignit, îmi pare rău. Dar datele sunt date, iar eu ăsta sunt. 🤷‍♂️

Subscribe to DIN DATE ADUNATE

Don’t miss out on the latest issues. Sign up now to get access to the library of members-only issues.
jamie@example.com
Subscribe