有哪些技术可以促进高效的操作码调度,从而实现快速解释?是否有一些技术仅适用于现代硬件,而其他技术因硬件的进步而无法正常工作?在易于实施,速度和可移植性之间必须做出哪些权衡取舍?
我很高兴Python的C实现最终超越了switch (opcode) {...}
操作码调度的简单实现,以及作为编译时间选项的间接线程,但我不太高兴他们花了20年的时间才到达那里.也许如果我们在stackoverflow上记录这些策略,下一种语言将会更快地加速.
关于不同类型的派遣有很多论文:
M. Anton Ertl和David Gregg,在ACM SIGPLAN 2003会议编程语言设计和实现会议(PLDI 03),第278-288页,加利福尼亚州圣地亚哥,2003年6月,优化虚拟机解释器中的间接分支预测准确性.
M. Anton Ertl和David Gregg,"现代架构上高效虚拟机解释器的行为 ",第7届欧洲并行计算会议论文集(Europar 2001),第403-412页,LNCS 2150,曼彻斯特,2001年8月.
Yunhe Shi在他的博士论文中提供了一个很好的总结.
此外,有人在几年前发现了一种新技术,它是有效的ANSI C.
因为你开始做任何事,检查Lua.
它很小(150Kb),纯ANSI C,适用于任何具有C编译器的东西.非常快.
最重要的是 - 源代码清晰可读.值得一试.