构建基于 Rails SSE 与 SSR 的实时日志流并使用 Buildah 实现多阶段容器化部署

后端架构

文章字数: 3.2k

阅读时长: 14 分

在生产环境中，实时、无延迟地观测分布式服务的日志流是一项刚需。传统的日志聚合系统（如ELK Stack）虽然强大，但在问题排查的即时性上，往往存在数秒到数分钟的延迟。我们需要一个轻量级、低延迟的方案，能够将日志直接推送到开发者的浏览器。这个方案必须满足几个严苛的条件：快速的首屏加载、与现有基础设施（特别是反向代理）的良好兼容性，以及一个安全、最小化的容器化部署实体。

我们最终的技术栈选型为 Ruby on Rails 结合 Server-Sent Events (SSE) 和轻量级 Server-Side Rendering (SSR)，并采用 Buildah 构建一个精简、安全的生产镜像。这个组合看起来有些非主流，但它精准地解决了我们面临的每一个痛点。

核心挑战：穿透代理缓冲的实时SSE流

Server-Sent Events 是一个看似简单的技术，但在真实的反向代理环境下，它的实现充满了陷阱。最大的敌人就是代理服务器的响应缓冲（Response Buffering）。Nginx、HAProxy 等默认会缓冲来自上游应用服务器的响应，直到缓冲区满或响应结束，再一次性发给客户端。这对于SSE这种长连接、流式响应的场景是致命的，它会导致客户端在很长一段时间内收不到任何数据。

我们的第一步就是构建一个能稳定工作的SSE端点。在Rails中，这需要借助 ActionController::Live。

# app/controllers/log_stream_controller.rb

class LogStreamController < ApplicationController
  # 引入 ActionController::Live 模块以启用流式响应
  include ActionController::Live

  # 强制关闭 Rack 的 ETag 生成，它与流式响应不兼容
  before_action -> { self.class.etag = false }
  before_action :set_stream_headers

  def stream
    # 模拟从某个消息队列或日志源（如 Redis Pub/Sub）获取日志
    # 在真实项目中，这里会订阅一个消息总线
    log_source = MockLogSource.new

    # response.stream 是核心，它是一个可写的 IO 对象
    # 确保在 stream 关闭时，我们的日志源也能被正确清理
    sse = SSE.new(response.stream, event: 'log-message', retry: 300)

    # 启动一个心跳线程，防止代理或浏览器因超时而断开连接
    # 这是一个生产环境中至关重要的细节
    heartbeat_thread = start_heartbeat_thread(sse)

    log_source.subscribe do |log_entry|
      # 将结构化的日志数据转换为 JSON 字符串并发送
      sse.write(log_entry.to_json)
    end

  rescue ActionController::Live::ClientDisconnected
    # 客户端断开连接是正常行为，记录日志即可，无需视为错误
    Rails.logger.info("Log stream client disconnected.")
  ensure
    # 确保所有资源被正确关闭
    heartbeat_thread&.kill
    log_source.close
    sse.close
  end

  private

  def set_stream_headers
    # 设置 SSE 必需的 HTTP Headers
    response.headers['Content-Type'] = 'text/event-stream'
    response.headers['Cache-Control'] = 'no-cache'
    response.headers['X-Accel-Buffering'] = 'no' # 关键！显式要求 Nginx 关闭缓冲
    response.headers['Last-Modified'] = Time.now.httpdate # 避免某些中间件的缓存
  end

  def start_heartbeat_thread(sse)
    Thread.new do
      loop do
        sleep 5.seconds
        # SSE 规范建议使用注释行作为心跳
        # 这不会在客户端触发 message 事件，但能保持 TCP 连接活跃
        sse.write(nil, event: 'heartbeat')
      end
    end
  end
end

# 模拟一个日志源，实际应替换为 Redis, Kafka 等
class MockLogSource
  def subscribe
    100.times do |i|
      sleep rand(0.1..1.5)
      log_data = {
        timestamp: Time.now.iso8601,
        level: ['INFO', 'WARN', 'ERROR'].sample,
        service: "service-#{('a'..'c').to_a.sample}",
        message: "Processing request ##{i + 1}..."
      }
      yield log_data
    end
  end

  def close
    Rails.logger.info("MockLogSource closed.")
  end
end

这段代码有几个关键点：

X-Accel-Buffering: no: 这是直接与 Nginx 对话的 Header。它命令 Nginx 对这个响应禁用代理缓冲。没有它，所有努力都将白费。
心跳机制: 许多网络中间件会在连接空闲一段时间后主动断开。通过一个独立的线程，我们每5秒发送一个注释类型的SSE事件。这既符合规范，又能有效维持连接的活性。
异常处理: ActionController::Live::ClientDisconnected 异常必须被捕获。当用户关闭浏览器标签页时，这个异常会被抛出。我们应该优雅地处理它，并清理所有相关资源（比如停止心跳线程，关闭日志源连接）。

为了让这一切工作，Nginx的配置同样关键：

# /etc/nginx/sites-available/default

location /log_stream {
    proxy_pass http://your_rails_app_upstream;
    proxy_set_header Host $http_host;
    proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
    proxy_set_header X-Real-IP $remote_addr;
    proxy_set_header Connection '';
    proxy_http_version 1.1;
    chunked_transfer_encoding off;

    # 核心配置：关闭代理缓冲
    proxy_buffering off;
    proxy_cache off;
    proxy_read_timeout 86400s; # 设置一个非常长的超时时间
    proxy_send_timeout 86400s;
}

这个架构的整体数据流如下：

sequenceDiagram
    participant Browser
    participant Nginx
    participant RailsApp as Puma/Rails
    participant LogSource as Redis Pub/Sub

    Browser->>Nginx: GET /log_stream
    Nginx->>RailsApp: GET /log_stream (Headers: X-Accel-Buffering: no)
    RailsApp->>LogSource: SUBSCRIBE to log channel
    LogSource-->>RailsApp: New Log Entry
    RailsApp-->>Nginx: SSE Chunk 1 (data: {...})
    Note right of Nginx: proxy_buffering is off, forwards immediately
    Nginx-->>Browser: SSE Chunk 1
    LogSource-->>RailsApp: New Log Entry
    RailsApp-->>Nginx: SSE Chunk 2 (data: {...})
    Nginx-->>Browser: SSE Chunk 2
    loop Heartbeat
        RailsApp-->>Nginx: SSE Heartbeat (:heartbeat)
        Nginx-->>Browser: SSE Heartbeat
    end
    Browser->>Nginx: Closes Connection
    Nginx->>RailsApp: Closes Connection
    RailsApp->>RailsApp: Catches ClientDisconnected
    RailsApp->>LogSource: UNSUBSCRIBE

性能考量：轻量级SSR与前端集成

有了稳定的数据流，我们需要一个高效的前端来展示它。一个完整的单页应用（SPA）框架，如React或Vue，对于这个场景来说太重了。它会带来更长的首次加载时间，并且需要复杂的构建流程。我们的目标是：用户访问页面时，能立即看到一个包含近期历史日志的界面（SSR），然后SSE连接建立，新的日志无缝地追加到列表顶部。

我们选择了一种极简的SSR方案，直接在Rails控制器中完成。

# app/controllers/logs_controller.rb

class LogsController < ApplicationController
  def show
    # 1. 获取最近的 100 条历史日志
    @initial_logs = fetch_recent_logs(100)

    # 2. 将这些日志数据预渲染到一个 HTML 模板中
    # 这里我们没有使用 Node.js 环境，而是直接在 ERB 中渲染
    # 这对于简单的结构化数据展示来说，性能足够且依赖极少
    render :show
  end

  private

  def fetch_recent_logs(count)
    # 这是一个模拟实现，真实场景下会从 Elasticsearch 或数据库中查询
    (1..count).map do |i|
      {
        timestamp: (Time.now - (count - i).seconds).iso8601,
        level: ['INFO', 'WARN'].sample,
        service: "service-#{('d'..'f').to_a.sample}",
        message: "Historical log entry ##{i}"
      }
    end.reverse
  end
end

前端的JavaScript代码同样保持简洁，直接使用原生的EventSource API。

// app/javascript/controllers/log_viewer_controller.js
import { Controller } from "@hotwired/stimulus"

export default class extends Controller {
  static targets = ["logContainer"]
  static values = {
    streamUrl: String
  }

  connect() {
    this.logContainerTarget.scrollTop = this.logContainerTarget.scrollHeight;
    this.connectEventSource();
  }

  disconnect() {
    if (this.eventSource) {
      this.eventSource.close();
    }
  }

  connectEventSource() {
    this.eventSource = new EventSource(this.streamUrlValue);

    this.eventSource.addEventListener('log-message', (event) => {
      const logEntry = JSON.parse(event.data);
      this.appendLog(logEntry);
    });

    this.eventSource.addEventListener('error', (event) => {
      console.error("EventSource failed:", event);
      // EventSource 会自动尝试重连，这里可以添加一些UI提示
    });
  }

  appendLog(log) {
    const logElement = this.buildLogElement(log);
    this.logContainerTarget.insertAdjacentHTML('beforeend', logElement);
    
    // 自动滚动到底部，以便查看最新日志
    // 这是一个常见的UX优化
    this.logContainerTarget.scrollTop = this.logContainerTarget.scrollHeight;
  }
  
  // 根据日志级别返回不同的CSS class
  logLevelClass(level) {
    switch(level.toLowerCase()) {
      case 'error': return 'text-red-400';
      case 'warn': return 'text-yellow-400';
      default: return 'text-gray-400';
    }
  }

  buildLogElement(log) {
    const timestamp = new Date(log.timestamp).toLocaleTimeString();
    const levelClass = this.logLevelClass(log.level);
    
    // 使用 pre 标签和模板字符串构建HTML，以保持格式
    // 注意：在真实项目中，应该对 log.message 进行HTML转义以防止XSS
    return `
      <div class="log-entry font-mono text-sm flex">
        <span class="timestamp text-gray-500 mr-4">${timestamp}</span>
        <span class="service text-blue-400 mr-4">[${log.service}]</span>
        <span class="level ${levelClass} font-bold w-12 text-right mr-4">${log.level}</span>
        <pre class="message flex-1 whitespace-pre-wrap">${this.escapeHTML(log.message)}</pre>
      </div>
    `;
  }
  
  escapeHTML(str) {
      const p = document.createElement("p");
      p.appendChild(document.createTextNode(str));
      return p.innerHTML;
  }
}

这种方法的优势在于：

极快的TTFB (Time to First Byte): 浏览器收到的第一个HTML响应已经包含了可看的内容。
依赖最小化: 不需要Node.js运行时来做SSR，整个应用依然是纯粹的Ruby环境，这大大简化了后续的容器化过程。
关注点分离: Rails负责数据准备和初始渲染，StimulusJS负责客户端的动态行为，职责清晰。

容器化：使用Buildah构建精简、安全的生产镜像

现在应用已经开发完毕，我们需要将其打包成一个高效、安全的容器镜像。使用传统的 Dockerfile 当然可以，但 Buildah 提供了更灵活、更适合在CI/CD脚本中使用的无守护进程（daemonless）构建方式。

我们的目标是：

多阶段构建: 构建阶段安装所有编译依赖，最终的生产镜像只包含运行应用所必需的文件。
非Root用户: 容器内的应用绝不能以root用户身份运行，这是安全基石。
最小化依赖: 生产镜像中不应包含Node.js、Yarn或任何构建工具。

下面是一个使用Buildah命令编写的构建脚本 build.sh：

#!/usr/bin/env bash
set -eo pipefail

IMAGE_NAME="registry.example.com/log-streamer:latest"
RUBY_VERSION="3.2.2"
BASE_IMAGE="ruby:${RUBY_VERSION}-slim-bookworm"

# -- Step 1: Builder Container --
# 创建一个临时的构建容器
echo "--> Creating builder container..."
builder=$(buildah from ${BASE_IMAGE})

# 挂载当前目录到容器中
buildah mount $builder | xargs -I % sudo chown -R 1001:1001 %/srv/app
buildah copy $builder . /srv/app
buildah config --workingdir /srv/app $builder

# 安装构建依赖。在生产镜像中我们不需要这些。
echo "--> Installing build dependencies..."
buildah run $builder -- bash -c " \
  apt-get update -qq && \
  apt-get install -y --no-install-recommends build-essential libpq-dev nodejs npm && \
  rm -rf /var/lib/apt/lists/*"

# 安装 Bundler 并打包 gems
# BUNDLE_WITHOUT 去除了开发和测试相关的 gem
# BUNDLE_DEPLOYMENT 将 gem 安装在 vendor/bundle 目录
echo "--> Installing Ruby gems..."
buildah run $builder -- gem install bundler
buildah run $builder -- bundle config set --local without 'development:test'
buildah run $builder -- bundle install --jobs $(nproc) --deployment

# 编译前端资源
echo "--> Compiling assets..."
buildah run $builder -- ./bin/rails assets:precompile

# -- Step 2: Final Image --
# 创建最终的生产镜像，基于同样的基础镜像
echo "--> Creating final image container..."
final_container=$(buildah from ${BASE_IMAGE})
buildah config --workingdir /app $final_container

# 安装生产环境必要的运行时依赖（例如，如果使用PostgreSQL）
echo "--> Installing runtime dependencies..."
buildah run $final_container -- bash -c " \
  apt-get update -qq && \
  apt-get install -y --no-install-recommends libpq5 && \
  rm -rf /var/lib/apt/lists/*"

# 创建非 root 用户
echo "--> Setting up non-root user..."
buildah run $final_container -- groupadd -g 1001 appuser
buildah run $final_container -- useradd -u 1001 -g appuser -m -s /bin/bash appuser

# 从 builder 容器中复制必要的产物
echo "--> Copying artifacts from builder..."
# 复制应用代码
buildah copy --from $builder $final_container /srv/app /app
# 复制打包好的 gems
buildah copy --from $builder $final_container /srv/app/vendor/bundle /app/vendor/bundle
# 复制编译好的静态资源
buildah copy --from $builder $final_container /srv/app/public/assets /app/public/assets

# 设置目录权限
buildah run $final_container -- chown -R appuser:appuser /app

# 配置镜像元数据
echo "--> Configuring final image metadata..."
buildah config --user appuser $final_container
buildah config --port 3000/tcp $final_container
buildah config --env RAILS_ENV=production $final_container
buildah config --env RAILS_LOG_TO_STDOUT=true $final_container
buildah config --env RAILS_SERVE_STATIC_FILES=true $final_container

# 设置启动命令
buildah config --cmd '["bundle", "exec", "puma", "-C", "config/puma.rb"]' $final_container

# -- Step 3: Commit and Cleanup --
echo "--> Committing final image..."
buildah commit $final_container $IMAGE_NAME

echo "--> Cleaning up containers..."
buildah rm $builder
buildah rm $final_container

echo "--> Build complete: ${IMAGE_NAME}"

这个脚本的构建流程可以被可视化为：

graph TD
    A[Base Image: ruby-slim] --> B(Builder Container);
    C[Source Code] --> B;
    D[Build Tools: build-essential, nodejs] --> B;
    B -- bundle install --> E[Vendorized Gems];
    B -- assets:precompile --> F[Compiled Assets];

    subgraph Final Image
        G[Base Image: ruby-slim] --> H(Production Container);
        I[Runtime Libs: libpq5] --> H;
        J[Non-root User] --> H;
        C --> H;
        E --> H;
        F --> H;
    end
    
    H --> K{Final Image Pushed to Registry};

这种方法的优势显而易见：

安全性: 最终镜像是以非root用户运行的，且不包含任何编译器或包管理器，大大减小了攻击面。
镜像体积: 通过多阶段构建，最终镜像的体积远小于包含所有构建工具的单一镜像。
可重复性: 脚本化的构建过程保证了每次构建都是一致的，非常适合集成到 Jenkins, GitLab CI 或 GitHub Actions 等自动化流水线中。

局限性与未来迭代路径

此方案并非万能。当前的前端实现，通过不断向DOM追加元素，在日志速率极高（如每秒数百条）的情况下，可能会导致浏览器性能下降。一个可行的优化路径是引入虚拟滚动（Virtual Scrolling）技术，只渲染视口内可见的日志条目。

其次，我们的轻量级SSR方案适用于简单的数据展示。如果未来页面需要更复杂的交互和组件状态管理，将这部分功能拆分为一个独立的、由Node.js驱动的前端服务（例如使用Next.js），并通过API与Rails后端通信，可能是更具扩展性的架构选择。Rails则可以更纯粹地聚焦于提供数据API和SSE端点。

最后，可观测性方面尚有欠缺。我们需要为SSE连接添加更精细的监控，比如记录活跃连接数、连接时长、错误率等指标到Prometheus，以便进行容量规划和故障预警。

Ruby on Rails Server-Sent Events (SSE) SSR Buildah

结合Istio故障注入实现BentoML异步服务韧性架构的设计与验证

2023-10-27 MLOps

BentoML Istio Tornado API 设计韧性工程

构建一个解耦的异步可视化服务 Rails通过Sidekiq驱动Matplotlib

2023-10-27 架构与设计

Ruby on Rails Matplotlib Recoil Sidekiq React