Naly 工程说明：Drizzle ORM、Neon Postgres 与类型化发布状态

摘要

该技术栈为 Naly 提供了一个类型化的发布控制面：Drizzle ORM 将文章、预测、来源、社交发布、奖励和 cron 记录作为关系型实体存储在 Neon Postgres 中，而非分散在运行时状态。由于每个工作流步骤都以显式行和枚举状态存储，Naly 可以安全地重新运行 cron 流水线、从部分失败中恢复，并保持面向编辑器的 UI 数据与 API 可见状态一致。截至 2026 年 6 月 26 日，这就是该项目用于预测发布的运行时持久化约定。

在 Naly 中的位置

在当前栈中，发布行为在多个 Next.js 应用路径和 cron 作业之间共享，所有这些都归约到同一数据库约定。当前使用的包集合——next@16.0.7, react@19.2.1, drizzle-orm@^0.44.7, @neondatabase/serverless@^1.0.2, tsx@^4.21.0, typescript@^5.9.3——与在服务器端路由/动作和计划任务中运行的偏 serverful ORM 层相匹配。

Naly 将这些领域建模为一等表：

文章与预测记录
来源 URL 与溯源快照
社交发布 + 分发元数据
奖励分数、校准元数据与审计字段
cron 运行元数据与发布检查点

价值不仅在于持久化；更在于共享语义。每个渲染器、工作器与 API 操作都读取同一发布状态模型，因此可在没有隐藏跨进程标记的情况下协同工作。

技术机制

Drizzle 为这种共享语义提供了 schema-first 路径。Drizzle 指南展示了标准流程：在 TypeScript 中定义 schema，配置 Neon 的 DATABASE_URL，初始化 drizzle，并使用生成的查询类型进行插入/读取/更新（概览文档, Neon 教程）。

一个最小化的 Naly 风格驱动初始化模式如下：

import { drizzle } from 'drizzle-orm/neon-http';
import { pgTable, text, timestamp, pgEnum, integer } from 'drizzle-orm/pg-core';

export const publicationState = pgEnum('publication_state', [
  'queued', 'draft_ready', 'published', 'failed',
]);

export const publications = pgTable('publications', {
  id: text('id').primaryKey(),
  slug: text('slug').notNull().unique(),
  state: publicationState('state').notNull(),
  stateVersion: integer('state_version').notNull().default(1),
  stateChangedAt: timestamp('state_changed_at').notNull().defaultNow(),
});

const db = drizzle(process.env.DATABASE_URL!);

这与 Drizzle 文档中支持的 drizzle-orm/neon-http 和 drizzle-orm/neon-serverless 作为 Neon 的传输选项一致：一类用于一次性工作负载，另一类在需要交互式事务时提供类似 WebSocket 的会话行为。Drizzle 的 pg-core 定义也支持类型推断（$inferInsert, $inferSelect），从而在编译期用 TypeScript 校验发布 payload，同时对非关键元数据保留灵活 JSON。

对 Naly 来说，关键的架构模式是：

将状态转换（queued -> drafted -> approved -> published -> archived）定义为显式行，
将转换逻辑集中在一个 server-only 模块中，
用幂等键（job id + state hash）记录每次变更，
在需要原子性的地方将关键转换放入数据库事务执行，
仅在状态推进后生成不可变产物（如 blob URLs、社媒文案、schema 快照）。

其效果类似于一个在 Postgres 中持久化的微型有限状态机：以严格的 schema 约定代替 cron 工作器中的隐式行为。

文献观点

主要文档将其框定为无服务器系统中的实用设计选择：

Drizzle 自称具备类 SQL 特性并为 serverless 准备好，降低了希望保留直接 SQL 语义又要保持类型安全的团队的 ORM 抽象开销（Drizzle 概览）。
Drizzle/Neon 教程明确支持原生 Neon HTTP/WebSocket 驱动组合与类型化 schema-first 建模，包括 @neondatabase/serverless 集成和类型推断示例（Drizzle 与 Neon, Get Started with Drizzle + Neon）。
Drizzle 的连接矩阵显示了明确的运行时驱动隔离，因此团队可以根据工作负载与运行时约束匹配执行模式（数据库连接文档）。
Neon 的官方驱动文档和边缘指南强调，serverless/Postgres 访问通常通过 HTTP 或基于 websocket 的代理实现，这正是为什么边缘执行决策必须按工作负载显式确定（Neon serverless driver, How to use Postgres at the Edge）。

在 schema 层面，关于 schema 演进的研究表明了显式迁移与状态模型的重要性。Tesseract 认为 schema 演进可视为一类一等事务操作，并且健壮系统应设计上将停机时间最小化（在线 schema 演进）。EvoSchema 表明模式变更，尤其是表级扰动，可能会使下游行为不稳定，这对随意向发布/状态表进行临时添加是强烈警示（EvoSchema）。

设计取舍

Naly 的选择本质上是在严格性与摩擦之间的权衡。强类型 schema 和显式状态枚举提高了可观测性与可靠性，但也增加了前置建模成本，并要求严格的迁移纪律。当发布逻辑在 cron 工作器、AI 管道和公共页面渲染器之间共享时，这种取舍是有利的。

驱动选择: neon-http 在一次性操作场景通常更简单且更快； neon-serverless 在需要交互式会话时更合适。
Schema-first 设计：编译期安全降低了运行时错误，但 schema 变更需要迁移规划，若测试未覆盖状态转换，可能表现为部署阻塞。
运行时可移植性：Neon 的边缘友好驱动模型扩展了部署选项，但传输模式会影响会话行为、延迟特征以及身份认证/TLS 路径。
类型保真度与运维便捷性：显式枚举防止无效状态，但若迁移脚本未预先批准，可能会拖慢深夜热修复。

故障模式

工作负载选择了错误驱动：将一次性 HTTP 查询用于多步骤状态转换会丢失原子性保证并产生部分发布状态。
工作器与部署之间的 schema 漂移：如果 publication_state 值在未协调迁移的情况下发生变化，旧的 cron 代码可能写入无效状态。
非幂等重试：cron 重启可能重复写入社交内容，除非检查点以 run-id 为幂等且唯一。
迁移滞后：定时任务在陈旧 schema 快照上运行时可能失败，尤其在滚动部署期间。
边缘冷启动 + 身份认证开销：在受限边缘层级中，反复建立连接会推高延迟，并可能产生假超时，除非调整超时预算和任务扇出。

对于该主题，故障分析应将发布状态视作正确性工件，而非实现细节。每个状态转换都必须具备可重放安全性。

实施说明

保持 schema 文件集中且有版本控制；从单一事实源重新生成迁移产物。
将可变域表与不可变制品表分离。
将发布转换建模为事务边界，并强制不变式（例如禁止直接 queued -> published 跳转）。
将调度元数据（last_run, next_run_at, error_count）保存在独立表中用于告警与审计。
为数据库初始化优先使用 server-only 模块（DATABASE_URL 在 cron/runtime 环境中 .env.local ）。
大多数操作使用结构化查询而非原始 SQL，保留原始 SQL 仅用于迁移种子或报表。
将快照 stateVersion 与事件日志在 schema 演进时作为兼容桥梁。