克雷西 发自 凹非寺
量子位 | 公众号 QbitAI
30周年之际,Ruby语言带着全新的4.0版本,给开发者送上了年终大礼。
增隔离命名空间新的JIT编译器,还有重设计的Ractor API,这款开源语言迎来一系列更新。
Ruby是一种开源的面向对象脚本语言,在20世纪90年代由日本人松本行弘开发,遵守GPL协议和Ruby License。
其主要特性就是简单快捷,变量没有类型、任何东西都有值,不需要注释就可以读懂。
对于这次更新,网友们给予了高度评价,表示要是没有Ruby更新,连圣诞节都不完整了。
那么,30岁的Ruby,这次都迎来了哪些更新呢?
Ruby 4.0中,Rails at Scale团队正式推出了名为ZJIT的全新即时编译器(Just-In-Time Compiler)。
这是一种一种传统的方法级编译器,核心架构采用了静态单赋值(SSA,Static Single Assignment)形式的中间表示,旨在突破现有YJIT编译器的性能上限。
传统的Ruby解释器是逐行执行代码,效率较低,而JIT编译器则是将热点代码转换成机器码。
其中,YJIT的设计理念聚焦于局部,它将编译视域限制在微小的基本块(Basic Block)中。
这种策略虽然能快速生成机器码并降低内存占用,但由于缺乏对代码整体结构的认知,难以进行跨越整个方法的全局优化。
相对而言,ZJIT引入了SSA中间表示技术。在这种架构下,编译器会分析完整的方法体并构建全局数据流图,确保每个变量在逻辑上仅被赋值一次。
这种全局分析能力赋予了ZJIT执行常量折叠(在编译期直接计算固定结果)和死代码消除(移除无效计算步骤)等深度优化的潜力,这些都是YJIT受限于架构而难以高效实现的。
在处理Ruby的动态类型特性时,两者也采用了截然不同的路径。
YJIT倾向于通过版本化机制保留多条代码路径以适应不同的变量类型。
ZJIT则采用了侧向退出(Side-exits)机制。
它会基于当前类型稳定的假设生成单一且激进优化的机器码,一旦运行时检测到变量类型不再符合预期(例如整数变为字符串),程序会立即触发侧向退出,终止当前优化代码的执行并安全回退到解释器。
这种机制允许编译器在假设成立的前提下剥离大量冗余检查。
尽管ZJIT目前的综合性能尚未完全超越成熟的YJIT,但其基于SSA的严谨架构可以突破局部优化带来的瓶颈,为Ruby在未来实现更复杂的代码分析和更高的峰值性能奠定了基础。
Ruby::Box是一个专门用于隔离代码执行环境的容器类,目的是解决长期困扰Ruby开发者的“全局污染”问题,并为构建更安全、模块化的应用提供原生支持。
这涉及到Ruby的一个核心特性——开放类(Open Class)。
在传统的Ruby环境中,任何代码都可以随时修改系统内置的类(例如给String类添加新方法),这种行为被称为“猴子补丁”(Monkey Patching)。
虽然这种特性赋予了语言极大的灵活性,但在大型项目中,如果不同的第三方库同时修改了同一个类,就会引发严重的命名冲突。
Ruby::Box通过彻底的命名空间隔离(Namespace Isolation)解决了这一难题。
当代码在某个Box中运行时,它对内置类的修改、定义的全局变量或顶层常量,都被严格限制在当前Box的内部作用域中,完全不会“泄漏”到外部环境或其他Box中。
从架构设计的角度来看,Ruby::Box被定义为Module的子类,这意味着它本质上也是一种模块。
在Ruby4.0的运行模型中,所有的用户主程序默认运行在名为“main”的Box中。而当开发者通过Ruby::Box.new创建新的隔离环境时,系统会基于包含最原始、纯净Ruby环境的“root”Box进行复制。
为了确保高性能,这一过程采用了写时复制(Copy-on-Write)技术,这使得创建新Box的内存开销极低,同时保证了各个环境之间的独立性。
此外,Ruby::Box还提供了文件级的作用域控制能力。通常情况下,一个.rb文件的加载和执行可以被限定在一个单一的Box中,这意味着该文件内的所有方法定义和常量解析都在该Box的上下文中完成。
这对于开发插件系统、多租户应用或者需要运行不可信代码(沙箱环境)的场景具有革命性意义。它允许开发者在保留Ruby动态特性的前提下,构建出更加健壮、安全且易于维护的系统架构。
在Ruby4.0的更新中,为了解决Ruby3.x时代Ractor通信中存在的“多路通信混乱”和“消息窃取”等诸多痛点,Ractor API也迎来了一次重大的重构。
其核心在于引入了Ractor::Port机制,让并行编程变得更加直观和安全。
在早期版本中,Ractor主要依赖“推”(Push)和“拉”(Pull)两种模式。当多个Ractor向同一个目标发送消息时,接收方往往难以分辨消息的来源,就像所有信件都被塞进了一个没有标签的公共邮箱。
而在新版设计中,Ractor::Port充当了专用信道的角色,任何人都可以向这个端口发送消息,但只有端口的创建者才有权从里面取出消息。这种“多对一”的单向通道设计,完美契合了Actor模型的语义。
具体的改进主要体现在三个方面:
首先是消息的定向投递与安全性。通过Ractor::Port,消息不再是广播式的混乱投递,而是精准地发送到指定的端口。这彻底杜绝了“消息窃取”现象,即A模块发送的消息意外被B模块的接收函数截获。
其次是摒弃了复杂的同步原语。新版本废弃了Ractor.yield和Ractor#take等容易引发死锁和竞争条件的旧方法,转而使用更清晰的Ractor#send配合端口机制。
同时,为了处理Ractor的生命周期,引入了与线程类似的Ractor#join(等待结束)和Ractor#value(获取返回值)方法。
特别是Ractor#value,它设计为只能被一个Ractor调用一次,这种限制允许系统在不复制对象的情况下安全地传递返回值,极大地提升了效率。
最后是高效的多路复用。新的Ractor.select方法经过重写,现在支持同时监听多个Ractor::Port。
当任何一个端口收到消息时,select会立即返回该端口和对应的消息。这比传统的轮询机制要高效得多,并且解决了过去在复杂并发场景下难以协调多个数据源的问题。
总的来说,Ractor::Port的引入通过更轻量级的实现和更严谨的通信契约,为Ruby开发者提供了一套既符合直觉又具备高性能的并发工具箱。
除了上面三个比较大的方面,这次Ruby 4.0还有一系列其他更新:
那么,你觉得更新后的Ruby,有没有更好用呢?
[1]https://www.ruby-lang.org/en/news/2025/12/25/ruby-4-0-0-released/
[2]https://docs.ruby-lang.org/en/master/Ruby/Box.html
[3]https://railsatscale.com/2025-12-24-launch-zjit/
[4]https://dev.to/ko1/ractorport-revamping-the-ractor-api-98



































