m3u8players
本站致力于IT相关技术的分享
基于Rust Rocket与SQL Server构建可观测的生成式AI RAG管道 基于Rust Rocket与SQL Server构建可观测的生成式AI RAG管道
业务部门最近对生成式AI的热情空前高涨,一个明确的需求摆在了我们面前:利用内部积累了近十年的SQL Server知识库,构建一个智能问答服务。Python技术栈的同事快速用LangChain和Flask搭了个原型,效果不错,但很快就暴露了生
2023-11-15
集成BentoML与Scala服务应对读写分离延迟和跨语言可观测性挑战 集成BentoML与Scala服务应对读写分离延迟和跨语言可观测性挑战
一个典型的机器学习模型服务化场景摆在面前:我们需要将一个基于 Python 的模型部署为在线推理服务,它需要根据请求实时查询特征数据,并在推理后记录结果。随着业务增长,特征数据读请求QPS预计达到数万级别,而写请求相对低频。数据库层面采用读
2023-11-15
构建基于 Rails SSE 与 SSR 的实时日志流并使用 Buildah 实现多阶段容器化部署 构建基于 Rails SSE 与 SSR 的实时日志流并使用 Buildah 实现多阶段容器化部署
在生产环境中,实时、无延迟地观测分布式服务的日志流是一项刚需。传统的日志聚合系统(如ELK Stack)虽然强大,但在问题排查的即时性上,往往存在数秒到数分钟的延迟。我们需要一个轻量级、低延迟的方案,能够将日志直接推送到开发者的浏览器。这个
2023-10-27