【JavaScript Weekly #399】JavaScript 引擎基础 (上):形态和内联缓存

🥳 欢迎有兴趣的小伙伴,一起做点有意义的事!本文译者:

https://github.com/daodaolee

我发起了一个周刊翻译计划,仓库地址:

https://github.com/FEDarling

,访问地址:

https://fedarling.github.io/fe-translate-weekly/

现在还很缺志同道合的小伙伴,纯属个人兴趣,当然对于提升英语和前端技能也会有帮助,要求:英语不要差的离谱、github熟练使用、有恒心、谦虚、对自己做的事负责。

想参与的小伙伴,可以

https://cdn.jsdelivr.net/gh/daodaolee/photobed/img/202111162148554.jpg

联系我,也可以给仓库发issue留言,我博客也有具体的个人联系方式:

https://daodaolee.cn/

本文描述 JavaScript 引擎中通用的一些关键的基础知识——不仅仅是

https://twitter.com/v8js

。作为一名 JavaScript 开发人员,对 JavaScript 引擎的工作原理深入了解一下有助于你更好的编写代码。

JavaScript 引擎管道

JavaScript 代码在运行时候, JavaScript 引擎会解析源代码并将其转换为抽象语法树 (AST)。基于该 AST,解释器会执行自己的任务并生成字节码。WOW!引擎这时候实际上正在执行着你写的 JavaScript 代码。

为了使其运行得更快,可以将字节码与数据分析一起发送到优化编译器。优化编译器根据这些数据做出判断,然后生成高度优化的机器代码。

如果在执行过程期间某个执行错误了,优化编译器会取消优化并返回到解释器。

JavaScript 引擎中的解释器/编译器管道

现在,让我们看下这个管道中实际运行 JavaScript 代码的部分,也就是代码被解释和优化的地方。

一般来说,会有一个包含解释器和优化编译器的管道。解释器快速生成未优化的字节码,然后优化编译器通过耗时稍长的逻辑来生成最终高度优化的机器码。

这个管道基本上就是 V8(Chrome 和 Node.js 中使用的 JavaScript 引擎)的工作原理:

V8 中的解释器的名字叫 引燃(Ignition),负责生成和执行字节码。在运行字节码时,它会收集分析数据,这些数据可用于稍后加快执行速度。当一个函数运行时,生成的字节码和分析数据被传递给我们的优化编译器 涡轮风扇(TurboFan),从而根据分析数据生成高度优化的机器代码。

SpiderMonkey 是 Mozilla 在 Firefox 和 SpiderNode 中使用的 JavaScript 引擎,它的做法略有不同。他们不是一个,而是两个优化编译器:基准编译器(Baseline compiler)离子猴编译器(IonMonkey compiler)。解释器优化到基准编译器时,会输出一些优化的代码。结合运行代码时收集的分析数据,离子猴编译器可以生成高度优化的代码。如果中途优化失败,离子猴编译器会退回到基准代码。

Chakra 是 Microsoft 在 Edge 和

https://github.com/nodejs/node-chakracore

中使用的 JavaScript 引擎,也带有两个优化编译器:简易编译器(SimpleJIT)完全体编译器(FullJIT)。解释器优化为 简易编译器 — 其中 JIT 代表 Just-In-Time 编译器,该编译器会产生一些优化的代码。然后结合分析数据,完全体编译器可以生成更加优化的代码。

JavaScriptCore(JSC) 是 Apple 在 Safari 和 React Native 中使用的 JavaScript 引擎,它通过三种不同的优化编译器将其发挥到了极致:低级解释器( LLInt,low-level-Interprete),优化到 基准编译器(Baseline compiler),然后优化到 数据流图形编译器(DFG,Data Flow Graph),而 DFG 编译器又可以优化到 超光速编译器(FTL,Faster Than Light)

那为什么有些厂商的引擎比其他的优化编译器的个数要多呢?当然这些都是权衡之后的。解释器可以快速生成字节码,但字节码通常效率不高。另一方面,优化编译器的执行需要更长的时间,但最终会产生更高效的机器代码。一些引擎会选择添加具有不同时间/效率的多个优化编译器,以牺牲更多的复杂性为代价来增加更细粒度的控制权。除此之外,内存也是一个权衡引擎个数和工作流程要考虑的原因,相关文章请见 另一篇

到现在为止,我们介绍了每个 JavaScript 引擎的解释器和优化编译器管道的区别。除了这些差异之外,在高层次上,所有 JavaScript 引擎都具有相同的架构:有一个解析器和某种解释器/编译器管道

JavaScript 对象模型

通过放大代码的内部结构来看看 JavaScript 引擎还有哪些共同点。比如这个问题,JavaScript 引擎是如何实现 JavaScript 对象模型的,它们使用哪些技巧来加速访问 JavaScript 对象的属性?

ECMAScript 规范本质上将所有对象定义为字典:字符串key 映射到

https://tc39.es/ecma262/#sec-property-attributes

除了 [[Value]] 本身之外,规范还定义了以下属性:

  • [[Writable]] 属性表示是否可以重写
  • [[Enumerable]] 属性表示是否可以枚举
  • [[Configurable]] 表示是否可以删除该属性

[[xx]] 这个双括号写法看起来很时髦,但这确实是规范,表示不直接暴露给 JavaScript 的属性的方式。你可以使用 Object.getOwnPropertyDescriptor 这个 API 来获取 JavaScript 中任何给定对象和属性的这些值:

const object = { foo: 42 };
Object.getOwnPropertyDescriptor(object, 'foo');
// → { value: 42, writable: true, enumerable: true, configurable: true }

OK!这就是 JavaScript 定义对象的方式,那,数组呢?

你可以将数组视为对象的一种特殊情况。

其中有一个区别就是数组对数组索引有着特殊的处理。这里所说的数组索引是 ECMAScript 规范中的一个特殊术语。数组的长度 JavaScript 中被限制为 2³²−1 。数组的索引是该限制内的任何有效索引,即从 0 到 2³²−2 的任意整数。

另一个区别是数组有一个 length 属性:

const array = ['a', 'b'];
array.length; // → 2
array[2] = 'c';
array.length; // → 3

在此示例中,数组在创建时的长度为 2。然后我们将另一个元素分配给索引 2,长度便会自动更新。

JavaScript 定义数组的方式与对象类似。例如,包括数组索引在内的所有键都明确表示为字符串。数组中的第一个元素存储在键“0”下。

length 属性只是一个碰巧不可枚举且不可配置的属性。

将元素添加到数组后,JavaScript 会自动更新 length 属性的 [[Value]]

优化属性访问

到此为止我们知道了对象是如何在 JavaScript 中定义的,现在让我们深入了解 JavaScript 引擎是如何有效地处理对象的。

纵观 JavaScript 程序,访问属性是最常见的操作,所以让 JavaScript 引擎快速访问属性至关重要。

const object = {
	foo: 'bar',
	baz: 'qux',
};

// Here, we’re accessing the property `foo` on `object`:
doSomething(object.foo);
//          ^^^^^^^^^^

形态(Shape)

在 JavaScript 程序中,多个对象具有相同的属性键是很常见的,这些对象具有相同的形态:

const object1 = { x: 1, y: 2 };
const object2 = { x: 3, y: 4 };
// `object1` 和 `object2` 长的一样.

在具有相同形态的对象上访问相同的属性也很常见:

function logX(object) {
	console.log(object.x);
	//          ^^^^^^^^
}

const object1 = { x: 1, y: 2 };
const object2 = { x: 3, y: 4 };

logX(object1);
logX(object2);

从这里可以看出,JavaScript 引擎可以根据对象的形态优化对象属性访问,这也是它的工作原理。

假设我们有一个具有属性 xy 的对象,它使用我们之前讨论过的字典数据结构:包含作为字符串的键,并且这些键指向它们各自的属性:

如果你想访问一个属性,例如 object.y,JavaScript 引擎会在 JSObject 中查找键 'y',然后加载相应的属性,最后返回 [[Value]]

但是这些属性存储在内存中的什么位置呢?我们应该将它们存储为 JSObject 的一部分吗?如果我们以后经常看到这种结构的对象,那么这种完整的字典格式存储在 JSObject 上是很浪费的,因为属性名称对于具有相同形态的所有对象都是重复的!这样会导致很多重复和不必要的内存使用。此时有一个优化方案:引擎单独存储对象的形态。

该引擎包含了除了它们的 [[Value]]之外所有属性名称和属性值。形态(Shape) 里包含 JSObject 内部值的offset,以便 JavaScript 引擎知道在哪里可以找到这些值。每个具有相同形状的 JSObject 都指向这个 Shape 实例。现在每个 JSObject 只需要存储该对象唯一的值即可。

当我们有多个对象时,这种方法就显得很好。不管有多少对象,只要它们的形态相同,我们只需要存储一次Shape和属性信息!

所有 JavaScript 引擎都使用 Shape 作为优化,但它们并不都称它们为形态:

  • 学术论文称它们为隐藏类(混淆 w.r.t. JavaScript 类)
  • V8 称它们为 Maps(混淆 w.r.t. JavaScript Maps)
  • Chakra 称它们为类型(混淆 w.r.t. JavaScript 的动态类型和 typeof)
  • JavaScriptCore 称它们为结构
  • SpiderMonkey 称它们为形态

在该篇文章中,我们将继续使用术语 — 形态。

转换链和树(Transition chains and trees)

如果你有一个具有特定形态的对象,随后向它添加了一个属性,会发生什么? JavaScript 引擎如何找到新的形态?

const object = {};
object.x = 5;
object.y = 6;

这些形态在 JavaScript 引擎中形成所谓的转换链,看下面这个例子:

该对象最开始没有任何属性,因此它指向了空 Shape。下面一条语句将值为 5 的属性 “x” 添加到此对象,因此 JavaScript 引擎转换为包含属性 “x” 的 Shape,并且在第一个offset 0 处将值 5 添加到 JSObject。接着,下一行添加了一个属性 “y”,引擎会转换到另一个包含 “x”“y” 的 Shape,并将值 6 附加到 JSObject(offset 1)上。

注意:添加属性的顺序会影响形态。例如,{ x: 4, y: 5 } 会产生与 { y: 5, x: 4 } 不同的形态。

我们不需要为每个 Shape 存储完整的属性表。相反,每个 Shape 只需要知道它引入的新属性即可。例如,在这种情况下,我们不必将关于 “x” 的信息存储在最后一个 Shape 中,因为它可以在链的头部位置找到。为了正确解析,每个 Shape 都链接回其先前的形状:

如果你在 JavaScript 代码中编写o.x,则 JavaScript 引擎会通过遍历转换链来查找属性 “x”,直到找到引入属性 “x”Shape

那,如果无法创建转换链会怎样?例如,如果你有两个空对象,并且为每个对象添加不同的属性怎么办?

const object1 = {};
object1.x = 5;
const object2 = {};
object2.y = 6;

在这种情况下,我们得利用分支,而不是链,最终可以得到一个转换树:

如上图,我们创建一个空对象 a,然后为其添加一个属性 “x”。我们最终得到一个包含 单个值 和 两个 Shape 的 JSObject:空Shape 和 只有属性 x 的 Shape。

第二个示例也以空对象 b 开头,随后添加了不同的属性 “y”。我们最终得到两个 Shape 链,总共有三个Shape。

那是不是说我们一定要从空的 Shape 开始执行呢?不是的。引擎对已经包含属性的对象应用了一些优化。看下面这个例子,从空对象字面量开始添加 x 和 拥有一个已经包含 x 的对象字面量:

const object1 = {};
object1.x = 5;
const object2 = { x: 6 };

在 object1 中,我们从空 Shape 开始并执行转换到包含 x 的Shape,在 object2 中,直接生成了一个从一开始就已经有 x 的对象。

包含属性 “x” 的对象字面量从包含 “x” 的 Shape 开始执行,直接跳过了 空Shape!这就是 V8 和 SpiderMonkey 所做的。这种优化缩短了转换链,并提高了构造对象的效率。

下面是一个具有 “x”“y”“z” 属性的 3D 点位对象的示例:

const point = {};
point.x = 4;
point.y = 5;
point.z = 6;

正如我们之前所了解的,这会在内存中创建一个具有 3 个 Shape 的对象(除空Shape之外)。如果你在程序中编写 point.x,JavaScript 引擎就会遵循链表:从底部的 Shape 开始,然后一直到顶部引入了 “x” 的 Shape 结束。

如果我们更频繁地这样做,效率就会非常慢,尤其是当对象有很多属性时。找到属性的时间是 O(n),即对象的属性数量是线性的。为了加快属性搜索速度,JavaScript 引擎添加了一个 ShapeTable 数据结构。这个 ShapeTable 是一个字典,将属性键映射到引入给定属性的各个 Shapes。

现在,我们回到字典查找,也就是我们开始添加 Shape 之前的位置!显然要查找很多很多次!这时候怎么办?

Shape 启用了另一种称为 内联缓存 的优化。

内联缓存(Inline Caches,ICs)

Shape 背后的主要逻辑是 内联缓存(IC) 。 IC 是让 JavaScript 快速运行的关键因素! JavaScript 引擎使用 IC 来记忆有关在何处查找对象属性的信息,以减少昂贵的查找次数。
这是一个 getX 函数,它接受一个对象参数并从中加载属性 x:

function getX(o) {
	return o.x;
}

如果我们在 JSC 中运行这个函数,它会生成以下字节码:

第一条 get_by_id 指令从第一个参数 (arg1) 加载属性 “x” 并将结果存储到 loc0。第二条指令将我们存储的内容返回到 loc0
JSC 还在 get_by_id 指令中嵌入了一个内联缓存,该指令由两个未初始化的插槽组成:

现在假设我们传入一个对象 { x: 'a' }getX。正如我们所了解的,这个对象有一个带有属性 “x” 的 Shape,并且该 Shape 存储了该属性 x 的offset和属性。第一次执行该函数时,get_by_id 指令查找属性 'x' 并发现该值存储在offset 0 处:

嵌入到 get_by_id 指令中的 IC 会记住找到属性的 Shape 和offset:

对于后续的运行,IC只需比较 Shape 即可,如果与之前相同,则从内存的offset中加载值。具体来说,如果 JavaScript 引擎看到具有 IC 之前记录的 Shape 的对象,它就不再需要访问属性信息——相反,可以完全跳过代价极大的属性信息查找。这比每次查找属性要快得多。

高效存储数组

对于数组,通常会存储作为数组索引的属性,此类属性的值称为数组元素。在每个数组中存储每个数组元素的属性都会浪费内存。相反,JavaScript 引擎会使用数组索引属性操作(是可写、可枚举和可配置的时候),并将数组元素与其他命名属性分开存储。

来看这个例子:

const array = [
	'#jsconfeu',
];

引擎存储数组长度为 1,并指向包含offset 和 “length”属性 的 Shape。

这与我们之前看到的结构很像,但是数组值存储在哪里?

每个数组都有一个单独的元素后备存储,其中包含所有数组索引的属性值。 JavaScript 引擎不必为数组元素存储任何属性,因为通常它们都是可写、可枚举和可配置的。
但是,在不寻常的情况下会发生什么?如果更改数组元素的属性属性怎么办?

// 千万不要这样做!
const array = Object.defineProperty(
	[],
	'0',
	{
		value: 'Oh noes!!1',
		writable: false,
		enumerable: false,
		configurable: false,
	}
);

上面的代码片段定义了一个名为 '0' 的属性(它恰好是一个数组索引),但将其属性设置为非默认值。
在这种边缘情况下,JavaScript 引擎将整个后备存储元素表示为将数组索引映射到属性属的字典。

即使只有一个数组元素具有非默认属性,整个数组的后备存储也会进入这种缓慢且低效的模式。一定要避免在数组索引上使用 Object.defineProperty

最后

我们已经了解了 JavaScript 引擎如何存储对象和数组,以及 Shapes 和 IC 如何帮助优化它们的常见操作。基于这些知识,我们确定了一些有助于提高性能的实用 JavaScript 编码技巧:

  • 始终以相同的方式初始化你的对象,它们最终不会具有不同的 Shape。
  • 不要乱用数组元素的属性。

相关资料

https://mathiasbynens.be/notes/shapes-ics

https://github.com/FEDarling/fe-translate-weekly/blob/master/JavaScript_Weekly/399/js_engine_shape_and_inline_caches.md