Notinhas — endpoint de utilidade

Modelo base: BAAI/bge-m3 (embedding, 1.024 dims, mean pooling, 568M params).
Adaptação: LoRA treinado com alvo label_binary_strict (recorte A do projeto).
Fold servido: fold_04 (melhor fold segundo o manifesto do pipeline).
Cabeça: nn.Linear(1024, 1) → sigmoid.
Calibração: Platt scaling pós-treino — P_calib = sigmoid(CALIB_A × logit(P_raw) + CALIB_B) . Com os defaults CALIB_A=1.0, CALIB_B=0.0 equivale a identidade; ajuste em config.py com base num conjunto de validação.
Prompt de instrução: nenhum — texto cru (bge-m3 não usa prefix de instrução).
max_length: 256 tokens.
Dispositivo atual: cpu .

Classificador de utilidade para community notes em português, baseado em bge-m3 (568M params) + LoRA + cabeça linear (calibrado via Platt scaling).