Notas de Engenharia da Naly: Drizzle ORM, Neon Postgres e Estado de Publicação Tipado

Resumo

Essa stack dá à Naly um plano de controle de publicação tipado: o Drizzle ORM captura registros de artigo, predição, fonte, postagem social, recompensa e cron como entidades relacionais no Neon Postgres, em vez de estado de runtime espalhado. Como cada etapa do fluxo é armazenada como linhas explícitas e estados enum, a Naly pode reexecutar pipelines de cron com segurança, recuperar falhas parciais e manter os dados da UI voltada ao editor alinhados com o estado visível pela API. Em 26 de junho de 2026, este é o contrato operacionalmente durável do projeto para publicação de previsões.

Onde fica na Naly

No stack atual, o comportamento de publicação é compartilhado por vários caminhos do app Next.js e jobs cron, todos resolvendo para o mesmo contrato de banco de dados. O conjunto de pacotes já em uso—next@16.0.7, react@19.2.1, drizzle-orm@^0.44.7, @neondatabase/serverless@^1.0.2, tsx@^4.21.0, typescript@^5.9.3—corresponde a uma camada ORM de perfil serverful rodando dentro de rotas/ações server-side e workers agendados.

A Naly armazena esses domínios como tabelas de primeira classe:

registros de artigos e previsões
URLs de fonte e snapshots de procedência
postagens sociais + metadados de distribuição
pontuações de recompensa, metadados de calibração e campos de auditoria
metadados de execução de cron e checkpoints de publicação

O valor não é apenas persistência; é semântica compartilhada. Todo renderer, worker e ação de API lê o mesmo modelo de estado de publicação e consegue coordenar sem flags ocultas entre processos.

Mecanismo técnico

Drizzle oferece um caminho schema-first para esse tipo de semântica compartilhada. Os guias do Drizzle mostram o fluxo canônico: definir schema em TypeScript, configurar um Neon's DATABASE_URL, inicializar drizzle, e usar tipos de query gerados para inserts/reads/updates (documentação geral do Drizzle, tutorial do Neon).

Um padrão mínimo de inicialização de driver no estilo Naly é o seguinte:

import { drizzle } from 'drizzle-orm/neon-http';
import { pgTable, text, timestamp, pgEnum, integer } from 'drizzle-orm/pg-core';

export const publicationState = pgEnum('publication_state', [
  'queued', 'draft_ready', 'published', 'failed',
]);

export const publications = pgTable('publications', {
  id: text('id').primaryKey(),
  slug: text('slug').notNull().unique(),
  state: publicationState('state').notNull(),
  stateVersion: integer('state_version').notNull().default(1),
  stateChangedAt: timestamp('state_changed_at').notNull().defaultNow(),
});

const db = drizzle(process.env.DATABASE_URL!);

Isso espelha a documentação do Drizzle que suporta drizzle-orm/neon-http e drizzle-orm/neon-serverless como opções de transporte para o Neon, com HTTP para cargas one-shot e comportamento de sessão semelhante a WebSocket para trabalho transacional interativo quando necessário. As pg-core definições do Drizzle também habilitam inferência tipada ($inferInsert, $inferSelect) para que cargas úteis de publicação sejam validadas pelo TypeScript em tempo de compilação, preservando JSON flexível para metadados não críticos.

Para a Naly, o padrão arquitetônico crucial é este:

definir transições de estado (queued -> drafted -> approved -> published -> archived) como linhas explícitas,
manter a lógica de transição em um único módulo server-only,
registrar cada mutação com chaves de idempotência (job id + state hash),
executar transições críticas dentro de transações no banco de dados onde a atomicidade importa,
gerar artefatos imutáveis (por exemplo, URLs de blob, copy social, snapshots de schema) apenas após o estado ter sido avançado.

O efeito é semelhante a uma pequena máquina de estados finita persistida no Postgres com contratos de schema estritos, em vez de comportamento implícito dentro de workers de cron.

O que diz a literatura

A documentação principal enquadra isso como uma escolha de design prática para sistemas serverless:

O Drizzle se apresenta como SQL-like por design e pronto para serverless, reduzindo a sobrecarga de abstração do ORM para equipes que querem semântica SQL direta sem abrir mão da segurança de tipos (Visão geral do Drizzle).
Os tutoriais do Drizzle/Neon explicitamente suportam combinações nativas de driver Neon HTTP/WebSocket e modelagem schema-first tipada, incluindo @neondatabase/serverless integração e exemplos de inferência de tipos (Drizzle com Neon, Getting Started with Drizzle + Neon).
A matriz de conexão do Drizzle mostra separação explícita do runtime-driver, para que times consigam combinar modo de execução com workload e restrições de runtime (Documentação de conexão com banco de dados).
A própria documentação de driver da Neon e as diretrizes de edge destacam que o acesso serverless/postgres é frequentemente alcançado via HTTP ou proxy com websocket, o que explica por que decisões de execução em edge devem ser explícitas por workload (Driver serverless da Neon, How to use Postgres at the Edge).

No lado de schema, pesquisas sobre evolução de schema mostram por que migrações explícitas e modelos de estado importam. A Tesseract argumenta que a evolução de schema pode ser tratada como operação transacional de primeira classe e que sistemas robustos devem minimizar downtime por design (evolução de schema online). A EvoSchema mostra que mudanças de schema — especialmente perturbações no nível de tabela — podem desestabilizar comportamento downstream, o que é um alerta forte contra adições casuais e ad-hoc em tabelas de publicação/estado (EvoSchema).

Trade-offs de projeto

A escolha da Naly é, na prática, um trade-off entre rigor e atrito. Esquemas fortemente tipados e enums de estado explícitos melhoram observabilidade e confiabilidade, mas também aumentam o custo de modelagem inicial e exigem disciplina de migração. A curva de trade-off é favorável quando a lógica de publicação se torna compartilhada entre workers cron, pipelines de IA e renderizadores de páginas públicas.

Escolha de driver: neon-http é mais simples e frequentemente mais rápido para operações one-shot; neon-serverless é melhor quando sessões interativas são necessárias.
Design orientado por schema-first: a segurança em compile-time reduz erros em runtime, mas mudanças de schema exigem planejamento de migração e podem aparecer como deploys bloqueados se os testes não cobrirem transições de estado.
Portabilidade de runtime: o modelo de driver orientado a edge da Neon expande opções de implantação, mas o modo de transporte afeta comportamento de sessão, perfil de latência e caminho de autenticação/TLS.
Fidelidade de tipo versus conveniência operacional: enums explícitos evitam estados inválidos, mas podem atrasar hotfixes noturnos se os scripts de migração não estiverem pré-aprovados.

Modos de falha

Driver incorreto para o workload: usar consultas HTTP one-shot para transições de estado multi-step pode perder garantias atômicas e produzir estados de publicação parciais.
Drift de schema entre workers e deploys: se publication_state os valores mudarem sem migrações coordenadas, código cron antigo pode gravar estados inválidos.
Retentativas não idempotentes: reinícios de cron podem duplicar escritas sociais, a menos que checkpoints sejam idempotentes e únicos por run-id.
Atraso de migração: jobs agendados executando contra snapshots de schema obsoletos podem falhar, especialmente durante deploys em rolling.
Overhead de cold-start + auth no edge: em tiers edge restritos, configurações repetidas de conexão podem aumentar latência e gerar false timeouts, a menos que orçamentos de timeout e fanout de jobs sejam ajustados.

Para este tema, a análise de falhas deve tratar o estado de publicação como artefato de correção, e não detalhe de implementação. Toda transição de estado deve ser segura para replay.

Notas de implementação

Mantenha arquivos de schema centralizados e versionados; regenere artefatos de migração a partir de uma única fonte da verdade.
Separe tabelas de domínio mutável de tabelas de artefatos imutáveis.
Modele transições de publicação como uma fronteira de transação e imponha invariantes (por exemplo, sem queued -> published salto direto).
Armazene metadados do scheduler (last_run, next_run_at, error_count) em sua própria tabela para alertas e auditoria.
Prefira módulos somente de servidor para inicialização de BD (DATABASE_URL em .env.local ambientes de cron/runtime).
Use consultas estruturadas em vez de SQL bruto para a maioria das operações e reserve SQL bruto para seeds de migração ou relatórios.
Trate stateVersion tabelas legadas e logs de eventos como pontes de compatibilidade quando o schema evolui.