# HANDOFF — Avatar HeyGen para Short "Equipo híbrido" (flagship)

**De:** Claude Code (pipeline de composición)
**Para:** Roberto (generación del avatar en HeyGen)
**Proyecto:** `ai4m-fear-shorts-prod` · Short vertical 9:16 · ~40s · voz Roberto
**Fecha:** 2026-06-04

---

## TL;DR — qué necesito de vos

Un MP4 del digital twin de Roberto leyendo el VO completo (abajo), **vertical 9:16**, **fondo limpio oscuro o green screen**, **audio de voz LIMPIO** (sin música, sin SFX), y **SIN subtítulos quemados**. Lo dejás en:

```
/home/clawd/playgrounds/ai4m-fear-shorts-prod/avatar/roberto-flagship.mp4
```

…o me lo pasás por Telegram y yo lo muevo ahí. Yo me encargo del resto: B-roll cutaways, carteles, captions karaoke, CTA y composición final.

---

## 1. Especificación EXACTA del archivo HeyGen

Esto es lo que mi pipeline de composición espera. Cualquier desvío me obliga a reprocesar o me rompe el render.

### Formato
- **Contenedor/codec:** MP4 H.264 (AVC). Audio AAC.
- **Orientación:** vertical 9:16.
- **Resolución:** **1080×1920 ideal** (mínimo aceptable 720×1280). NO horizontal, NO cuadrado.
- **FPS:** 25 o 30 fps (cualquiera de los dos sirve; evitá VFR/variable framerate).
- **Duración:** ~40s, la del VO completo. Si HeyGen agrega cola de silencio al final, no pasa nada — yo recorto.

### Avatar
- **Digital twin de Roberto en retrato** (ejemplo de look: **"Roberto Aguirre — 120"** o el look retrato equivalente más reciente).
- **Encuadre:** cara centrada, **con headroom** (aire arriba de la cabeza), **sin cortar** ni la frente ni el mentón. Plano medio/medio-corto, vertical.
- Mirada a cámara. Gestualidad natural; no hace falta que mueva mucho las manos.
- **NO** poses laterales agresivas ni encuadres donde la cara quede pegada a un borde (necesito margen para los carteles que van encima).

### Fondo
- **Limpio y sólido oscuro** (gris carbón / negro / azul muy oscuro). Sin texturas, sin oficinas, sin gradientes cargados, sin logos.
- **Alternativa válida:** **green screen** (croma verde) si preferís que yo inserte el fondo en composición. Si elegís croma, que sea verde parejo y bien iluminado, sin sombras duras sobre el avatar.
- **PROHIBIDO:** fondos cargados, escenas decoradas, bokeh recargado, oficinas con movimiento. Cualquier cosa que compita con los carteles y el B-roll.

### Audio
- **Pista de VO LIMPIA:** solo la voz de Roberto leyendo el guion.
- **SIN música.** **SIN efectos de sonido (SFX).** **SIN intro/outro sonoro.**
- Nivel de voz consistente (HeyGen normaliza ok; no agregues compresión rara).
- El VO debe matchear **palabra por palabra** el texto del bloque 3 — mis captions karaoke se alinean a ese guion. Si cambiás una palabra, avisame para reajustar captions.

### Captions / subtítulos
- **HeyGen NO debe quemar subtítulos** en el video. Cero texto sobre el avatar.
- Los captions karaoke los genero yo en composición, sincronizados al VO y ubicados en safe zone. Si HeyGen quema subs, el archivo no me sirve.

### Entrega
- **Opción A (preferida):** dejar el archivo en
  `/home/clawd/playgrounds/ai4m-fear-shorts-prod/avatar/roberto-flagship.mp4`
- **Opción B:** pasarlo por **Telegram** y yo lo muevo a esa ruta.
- **Un solo clip con el VO completo (~40s)** es lo ideal.
- **Per-beat también sirve** (un MP4 por beat). Si vas por per-beat, nombralos en orden:
  `roberto-beat-01.mp4`, `roberto-beat-02.mp4`, … en `/avatar/`, y avisame los cortes de texto por beat.

---

## 2. VO COMPLETO a usar (LATAM neutro, cero voseo)

> Copiá/pegá este texto EXACTO en el TTS de HeyGen (o leelo tal cual si grabás voz real). Mis captions se alinean a estas palabras.

```
Tu reemplazo dirige a tres personas. Y a doce agentes. Entrega lo mismo que tú entregas con quince, y le cuesta a la empresa una fracción. Yo era Manager Senior en una consultora europea: coordinaba personas, proyectos, proveedores. Hace 18 meses empecé a dirigir equipos donde conviven personas y agentes. Y vi algo que todavía no se dice en voz alta: el cargo cambió de unidad. Antes tu valor era cuánta gente coordinabas. Ahora es cuánto produces con un equipo híbrido que cuesta mucho menos. El día que tu director compare tu área de quince con una de tres personas y doce agentes que entrega lo mismo, el tamaño de tu equipo deja de ser tu fuerza. Se vuelve tu costo. El enemigo no es la IA. Es seguir midiendo tu cargo por cuánta gente tienes debajo. Orquestar personas y agentes se aprende: es una habilidad, no un título. Yo decidí aprender a dirigir el equipo híbrido antes de competir contra uno.
```

**Notas de locución (LATAM neutro):**
- "tú entregas", "tienes", "produces" → tuteo neutro. **Cero voseo** (nada de "entregás", "tenés", "vos").
- Ritmo conversacional, tono firme/seguro (es un tema de carrera, no alarmista).
- Pausas naturales en los puntos y en los dos puntos. No corras las frases.

---

## 3. Timeline de beats (referencia — NO va en el archivo del avatar)

Esto es para que entiendas dónde aterriza tu clip. El avatar va **debajo** de todo; los carteles y el B-roll los pongo yo encima en composición. **Vos solo entregás el avatar + VO.**

| Beat | Tiempo (nominal) | Cartel (lo pongo yo) | B-roll cutaway (lo pongo yo) |
|------|------------------|----------------------|-------------------------------|
| HOOK | 0–3s | "Y A DOCE AGENTES." | organigrama mínimo: 3 íconos persona + 12 íconos agente encendiéndose (~1.8–3s) |
| 2 | 3–10s | "MISMO RESULTADO. UN TERCIO DEL EQUIPO." | split: sala de 15 escritorios (izq, apagada) vs mesa de 3 + pantallas con agentes (der, iluminada) |
| 3 | 10–17s | "EX-MANAGER SENIOR → DIRIGE EQUIPOS HÍBRIDOS" | dashboard con nombres de personas y agentes conviviendo |
| 4 | 17–25s | "ANTES: ¿CUÁNTA GENTE? AHORA: ¿CUÁNTO PRODUCES?" | balanza visual: muchas siluetas de un lado / poca gente + agentes del otro entregando más |
| 5 | 25–33s | "EL TAMAÑO DE TU EQUIPO YA NO ES TU FUERZA. ES TU COSTO." | CFO mirando dos columnas (output igual / costo distinto); columna del equipo grande en rojo (rust) |
| 6 | 33–41s | "ORQUESTAR PERSONAS + AGENTES SE APRENDE" | mano dirigiendo una interfaz con personas y agentes a la vez |

CTA final → comunidad Skool. Captions karaoke del VO en safe zone. LATAM neutro, cero voseo.

> Los tiempos son nominales. El corte real lo ajusto yo a las marcas de palabra del VO que entregue HeyGen. No te preocupes por clavar segundos exactos — entregá el VO completo y corrido.

---

## 4. Checklist antes de mandarme el archivo

- [ ] MP4 H.264, vertical 9:16, 1080×1920 (o mínimo 720×1280)
- [ ] Avatar retrato de Roberto, cara centrada, con headroom, sin cortes
- [ ] Fondo limpio oscuro **o** green screen parejo
- [ ] Audio: solo voz, sin música, sin SFX
- [ ] VO matchea palabra por palabra el texto del bloque 2
- [ ] **SIN subtítulos quemados**
- [ ] Archivo en `/avatar/roberto-flagship.mp4` o enviado por Telegram

Cualquier duda, me decís. Una vez que tenga el avatar, la composición final (B-roll + carteles + captions + CTA) la cierro yo.