【用Golang实现JVM第一篇】知识准备&前言

司青玄 · · 778 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

学习JVM最好的方法,就是实现它,没有之一。

对JVM感兴趣的朋友可能会去主动寻找讲解JVM的书,比如《深入理解JVM》、《Java虚拟机规范》、《虚拟机的设计与实现》,但是这些书都是定性讲解,多数人看过以后对不少概念还是会很模糊,其根本原因就是我们无法只根据定义在脑袋里想象出具体用代码应该怎么实现,就会有一种空中楼阁的感觉。既然虚拟机规范都是公开的,为什么我们不尝试着去实现一个能跑就行的JVM呢?

方法论:将复杂问题化解为简单问题的集合

国外有一本著名的操作系统教材,叫作《Operating Systems: Three Easy Pieces》,读过的朋友一定会对内容的通俗易懂印象深刻,因为作者总是先从一种最简单的情况入手,然后逐步考虑更多的情况,最后扩展到实际问题。Oracle的Hotspot JVM实现是极其复杂的,如果打个比喻的话,我认为可以类比成美国已经退役的航天飞机,都是巨型工程。因此仅凭一己之力想实现完整JVM是很难的,必须将复杂的问题简化,然后各个击破。 比如,垃圾回收可以直接利用Golang自身回收机制,线程可以映射到golang的协程,native方法可以用开发语言直接实现,可以先不实现类,可以先不调用方法等等。当把最简单的零件实现以后,再拼凑起来实现更复杂的功能。这样一来,我们可以把实现JVM这个艰巨的任务分解成以下步骤:

  • 从classpath中读取class文件

  • 解析class文件

  • 实现解释器

其中解释器的实现可以根据字节码含义的复杂程度循序渐进的去做:

  • Mock一下System.out.println()方法(非常重要)

  • 操作数入栈、出栈、本地变量表读写、PC(程序计数器)跳转等基本指令

  • 基本的数学运算指令

  • static方法调用指令(invokestatic)

  • 数组、对象的创建指令(new, newarray)

  • 继承、接口、方法重载、方法重写等特性(invokespecial, invokevirtual)

  • 实现native方法、线程、GC等高级特性

我们习以为常的输出调用System.out.println()看似简单,但从JVM的角度来看却是巨复杂。这里我们可以特殊处理一下,比如Java中写一个native的print()方法,解释器遇到这个方法后就直接调用go的fmt.Printf() 函数输出即可。这一点很重要,因为输出计算结果是实现JVM的一个重要里程碑,如果过早的陷入System.out.println()的复杂度中的话就会很容易被劝退,而且前期在这里折腾时间挫败感会很强,也没啥意义,后续实现了对象创建、方法调用以后,System.out.println()自然就实现了。当我们把所有的字节码(200多个)都实现以后,JVM就真的实现了。别管什么性能好坏,先跑起来。其实只要实现基本的数学运算和数组,就能用自己的山寨JVM解leetcode了。

此外,在解释字节码的时候千万不要照着字节码指令表从头到尾一条条实现,更好的方法是自己写一段简单的Java代码,编译以后用JDK自带的javap -verbose XXXX来分析指令,然后看哪条没实现,就专门去实现哪条。Java代码要从易到难,开始先简单的定义一个变量加加减减,然后增加if判断,for循环,static方法,最后再new新对象,调用对象方法等等,循序渐进。这样就能给JVM这个大工程增加很多可衡量的里程碑,防止一开始就实现类导致掉进无穷的大坑中被劝退。

知识准备

实现一个能跑的JVM并不难,只要愿意查资料,一定能写出来,但是想要达到或接近Hotsport性能就很难了。这里我们的目标是用golang实现一个能跑的JVM,因此要熟练掌握至少一门编程语言, 然后查资料详细了解class文件结构。这方面网文很多,但都不够系统,最好从书里找,推荐《深入理解JVM》,这本书里面对class结构的介绍就已经足够让你完成解析class文件的任务了。

解析完class以后,我们还要构建一个能跑字节码的"环境",比如方法栈,操作数栈,本地变量表,程序计数器等,这些在书里都有详细的说明,也可以根据描述自己实现出来。

字节码的解释。这里推荐直接看JVM规范,Oracle有在线文档:https://docs.oracle.com/javase/specs/jvms/se7/html/jvms-6.html#jvms-6.5 ,可以直接看字节码指令这一部分,需要什么就直接把它当成一个字典去查。随着解释的字节码越来越多,你会发现需要实现的东西也会变多,根据指令需求去实现缺的东西就可以了。

其实JVM规范给JVM的具体实现留下了很大的空间,只要能准确实现指令本身的语义,不管用什么方法都是可以的,千万不要纠结于性能,过早优化是万恶之源。

最后,我已经用golang做了一个实现了条件判断、循环、静态or对象方法调用的Mini-JVM, 后期会持续开发,目标是有一天能够完全实现一个JVM,有兴趣可以关注一下: https://github.com/wanghongfei/mini-jvm


有疑问加站长微信联系(非本文作者)

本文来自:简书

感谢作者:司青玄

查看原文:【用Golang实现JVM第一篇】知识准备&前言

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

778 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传