Épica: E5 — Núcleo NLP: backend local, incoherencia y explicabilidad
Orden de ejecución: 5/5 — mejora opcional.
Objetivo
Ajustar (fine-tuning) un modelo pequeño (DistilBERT / BERT-base) sobre un dataset de clickbait como alternativa/mejora al zero-shot actual.
Por qué
Un modelo entrenado sobre clickbait suele superar al zero-shot genérico, y da un detector propio bajo control (alineado con E5-01, backend local), sin depender de que HF sirva uno.
Criterios de aceptación
Viabilidad de cómputo (equipo actual)
- Local: viable en la GTX 1650 SUPER (4 GB) con DistilBERT + titulares cortos + mixed precision.
- Alternativa: entrenar en Google Colab (T4 gratis), descargar pesos, inferir en local.
Trazabilidad
Requisito R3.2 (mejora del detector de clickbait).
Dependencias
Opcional. Tras E5-01 (para servir local). Se beneficia de cómputo del tutor, pero no lo necesita (Colab cubre).
Épica: E5 — Núcleo NLP: backend local, incoherencia y explicabilidad
Orden de ejecución: 5/5 — mejora opcional.
Objetivo
Ajustar (fine-tuning) un modelo pequeño (DistilBERT / BERT-base) sobre un dataset de clickbait como alternativa/mejora al zero-shot actual.
Por qué
Un modelo entrenado sobre clickbait suele superar al zero-shot genérico, y da un detector propio bajo control (alineado con E5-01, backend local), sin depender de que HF sirva uno.
Criterios de aceptación
max_len~64,fp16).Viabilidad de cómputo (equipo actual)
Trazabilidad
Requisito R3.2 (mejora del detector de clickbait).
Dependencias
Opcional. Tras E5-01 (para servir local). Se beneficia de cómputo del tutor, pero no lo necesita (Colab cubre).