7赞

介绍Java CAS 原理分析

作者：mobiledu2402851373 | 2021-10-20 23:35

java基础教程栏目介绍CAS全称是compareandswap，是一种用于在多线程环境下实现同步功能的机制。CAS操作包含三个操作数--内存位置、预期数值和新值。

java基础教程栏目介绍分析Java CAS

Causes the processor’s LOCK# signal to be asserted during execution of the accompanying instruction (turns the instruction into an atomic instruction). In a multiprocessor environment, the LOCK# signal ensures that the processor has exclusive use of any shared memory while the signal is asserted.

上面描述的重点已经用黑体标出了，在多处理器环境下，LOCK# 信号可以确保处理器独占使用某些共享内存。lock 可以被添加在下面的指令前：

ADD, ADC, AND, BTC, BTR, BTS, CMPXCHG, CMPXCH8B, CMPXCHG16B, DEC, INC, NEG, NOT, OR, SBB, SUB, XOR, XADD, and XCHG.

通过在 inc 指令前添加 lock 前缀，即可让该指令具备原子性。多个核心同时执行同一条 inc 指令时，会以串行的方式进行，也就避免了上面所说的那种情况。那么这里还有一个问题，lock 前缀是怎样保证核心独占某片内存区域的呢？答案如下：

在 Intel 处理器中，有两种方式保证处理器的某个核心独占某片内存区域。第一种方式是通过锁定总线，让某个核心独占使用总线，但这样代价太大。总线被锁定后，其他核心就不能访问内存了，可能会导致其他核心短时内停止工作。第二种方式是锁定缓存，若某处内存数据被缓存在处理器缓存中。处理器发出的 LOCK# 信号不会锁定总线，而是锁定缓存行对应的内存区域。其他处理器在这片内存区域锁定期间，无法对这片内存区域进行相关操作。相对于锁定总线，锁定缓存的代价明显比较小。关于总线锁和缓存锁，更详细的描述请参考 Intel 开发人员手册 Volume 3 Software Developer’s Manual，Chapter 8 Multiple-Processor Management。

3.源码分析

有了上面的背景知识，现在我们就可以从容不迫的阅读 CAS 的源码了。本章的内容将对 java.util.concurrent.atomic 包下的原子类 AtomicInteger 中的 compareAndSet 方法进行分析，相关分析如下：

public class AtomicInteger extends Number implements java.io.Serializable {

    // setup to use Unsafe.compareAndSwapInt for updates
    private static final Unsafe unsafe = Unsafe.getUnsafe();
    private static final long valueOffset;

    static {
        try {
            // 计算变量 value 在类对象中的偏移
            valueOffset = unsafe.objectFieldOffset
                (AtomicInteger.class.getDeclaredField("value"));
        } catch (Exception ex) { throw new Error(ex); }
    }

    private volatile int value;
    
    public final boolean compareAndSet(int expect, int update) {
        /*
         * compareAndSet 实际上只是一个壳子，主要的逻辑封装在 Unsafe 的 
         * compareAndSwapInt 方法中
         */
        return unsafe.compareAndSwapInt(this, valueOffset, expect, update);
    }
    
    // ......
}

public final class Unsafe {
    // compareAndSwapInt 是 native 类型的方法，继续往下看
    public final native boolean compareAndSwapInt(Object o, long offset,
                                                  int expected,
                                                  int x);
    // ......
}

// unsafe.cpp
/*
 * 这个看起来好像不像一个函数，不过不用担心，不是重点。UNSAFE_ENTRY 和 UNSAFE_END 都是宏，
 * 在预编译期间会被替换成真正的代码。下面的 jboolean、jlong 和 jint 等是一些类型定义（typedef）：
 * 
 * jni.h
 *     typedef unsigned char   jboolean;
 *     typedef unsigned short  jchar;
 *     typedef short           jshort;
 *     typedef float           jfloat;
 *     typedef double          jdouble;
 * 
 * jni_md.h
 *     typedef int jint;
 *     #ifdef _LP64 // 64-bit
 *     typedef long jlong;
 *     #else
 *     typedef long long jlong;
 *     #endif
 *     typedef signed char jbyte;
 */
UNSAFE_ENTRY(jboolean, Unsafe_CompareAndSwapInt(JNIEnv *env, jobject unsafe, jobject obj, jlong offset, jint e, jint x))
  UnsafeWrapper("Unsafe_CompareAndSwapInt");
  oop p = JNIHandles::resolve(obj);
  // 根据偏移量，计算 value 的地址。这里的 offset 就是 AtomaicInteger 中的 valueOffset
  jint* addr = (jint *) index_oop_from_field_offset_long(p, offset);
  // 调用 Atomic 中的函数 cmpxchg，该函数声明于 Atomic.hpp 中
  return (jint)(Atomic::cmpxchg(x, addr, e)) == e;
UNSAFE_END

// atomic.cpp
unsigned Atomic::cmpxchg(unsigned int exchange_value,
                         volatile unsigned int* dest, unsigned int compare_value) {
  assert(sizeof(unsigned int) == sizeof(jint), "more work to do");
  /*
   * 根据操作系统类型调用不同平台下的重载函数，这个在预编译期间编译器会决定调用哪个平台下的重载
   * 函数。相关的预编译逻辑如下：
   * 
   * atomic.inline.hpp：
   *    #include "runtime/atomic.hpp"
   *    
   *    // Linux
   *    #ifdef TARGET_OS_ARCH_linux_x86
   *    # include "atomic_linux_x86.inline.hpp"
   *    #endif
   *   
   *    // 省略部分代码
   *    
   *    // Windows
   *    #ifdef TARGET_OS_ARCH_windows_x86
   *    # include "atomic_windows_x86.inline.hpp"
   *    #endif
   *    
   *    // BSD
   *    #ifdef TARGET_OS_ARCH_bsd_x86
   *    # include "atomic_bsd_x86.inline.hpp"
   *    #endif
   * 
   * 接下来分析 atomic_windows_x86.inline.hpp 中的 cmpxchg 函数实现
   */
  return (unsigned int)Atomic::cmpxchg((jint)exchange_value, (volatile jint*)dest,
                                       (jint)compare_value);
}

上面的分析看起来比较多，不过主流程并不复杂。如果不纠结于代码细节，还是比较容易看懂的。接下来，我会分析 Windows 平台下的 Atomic::cmpxchg 函数。继续往下看吧。

// atomic_windows_x86.inline.hpp
#define LOCK_IF_MP(mp) __asm cmp mp, 0  \
                       __asm je L0      \
                       __asm _emit 0xF0 \
                       __asm L0:
              
inline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint compare_value) {
  // alternative for InterlockedCompareExchange
  int mp = os::is_MP();
  __asm {
    mov edx, dest
    mov ecx, exchange_value
    mov eax, compare_value
    LOCK_IF_MP(mp)
    cmpxchg dword ptr [edx], ecx
  }
}

上面的代码由 LOCK_IF_MP 预编译标识符和 cmpxchg 函数组成。为了看到更清楚一些，我们将 cmpxchg 函数中的 LOCK_IF_MP 替换为实际内容。如下：

inline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint compare_value) {
  // 判断是否是多核 CPU
  int mp = os::is_MP();
  __asm {
    // 将参数值放入寄存器中
    mov edx, dest    // 注意: dest 是指针类型，这里是把内存地址存入 edx 寄存器中
    mov ecx, exchange_value
    mov eax, compare_value
    
    // LOCK_IF_MP
    cmp mp, 0
    /*
     * 如果 mp = 0，表明是线程运行在单核 CPU 环境下。此时 je 会跳转到 L0 标记处，
     * 也就是越过 _emit 0xF0 指令，直接执行 cmpxchg 指令。也就是不在下面的 cmpxchg 指令
     * 前加 lock 前缀。
     */
    je L0
    /*
     * 0xF0 是 lock 前缀的机器码，这里没有使用 lock，而是直接使用了机器码的形式。至于这样做的
     * 原因可以参考知乎的一个回答：
     *     https://www.zhihu.com/question/50878124/answer/123099923
     */ 
    _emit 0xF0
L0:
    /*
     * 比较并交换。简单解释一下下面这条指令，熟悉汇编的朋友可以略过下面的解释:
     *   cmpxchg: 即“比较并交换”指令
     *   dword: 全称是 double word，在 x86/x64 体系中，一个 
     *          word = 2 byte，dword = 4 byte = 32 bit
     *   ptr: 全称是 pointer，与前面的 dword 连起来使用，表明访问的内存单元是一个双字单元
     *   [edx]: [...] 表示一个内存单元，edx 是寄存器，dest 指针值存放在 edx 中。
     *          那么 [edx] 表示内存地址为 dest 的内存单元
     *          
     * 这一条指令的意思就是，将 eax 寄存器中的值（compare_value）与 [edx] 双字内存单元中的值
     * 进行对比，如果相同，则将 ecx 寄存器中的值（exchange_value）存入 [edx] 内存单元中。
     */
    cmpxchg dword ptr [edx], ecx
  }
}

到这里 CAS 的实现过程就讲完了，CAS 的实现离不开处理器的支持。以上这么多代码，其实核心代码就是一条带lock 前缀的 cmpxchg 指令，即lock cmpxchg dword ptr [edx], ecx。

4.ABA 问题

谈到 CAS，基本上都要谈一下 CAS 的 ABA 问题。CAS 由三个步骤组成，分别是“读取->比较->写回”。考虑这样一种情况，线程1和线程2同时执行 CAS 逻辑，两个线程的执行顺序如下：

时刻1：线程1执行读取操作，获取原值 A，然后线程被切换走
时刻2：线程2执行完成 CAS 操作将原值由 A 修改为 B
时刻3：线程2再次执行 CAS 操作，并将原值由 B 修改为 A
时刻4：线程1恢复运行，将比较值（compareValue）与原值（oldValue）进行比较，发现两个值相等。然后用新值（newValue）写入内存中，完成 CAS 操作

如上流程，线程1并不知道原值已经被修改过了，在它看来并没什么变化，所以它会继续往下执行流程。对于 ABA 问题，通常的处理措施是对每一次 CAS 操作设置版本号。java.util.concurrent.atomic 包下提供了一个可处理 ABA 问题的原子类 AtomicStampedReference，具体的实现这里就不分析了，有兴趣的朋友可以自己去看看。

5.总结

写到这里，这篇文章总算接近尾声了。虽然 CAS 本身的原理，包括实现都不是很难，但是写起来真的不太好写。这里面涉及到了一些底层的知识，虽然能看懂，但想说明白，还是有点难度的。由于我底层的知识比较欠缺，上面的一些分析难免会出错。所以如有错误，请轻喷，当然最好能说明怎么错的，感谢。

好了，本篇文章就到这里。感谢阅读，再见。

附录

在前面源码分析一节中用到的几个文件，这里把路径贴出来。有助于大家进行索引，如下：

文件名	路径
Unsafe.java	openjdk/jdk/src/share/classes/sun/misc/Unsafe.java
unsafe.cpp	openjdk/hotspot/src/share/vm/prims/unsafe.cpp
atomic.cpp	openjdk/hotspot/src/share/vm/runtime/atomic.cpp
atomic_windows_x86.inline.hpp	openjdk/hotspot/src/os_cpu/windows_x86/vm/atomic_windows_x86.inline.hpp

以上就是介绍Java CAS 原理分析的详细内容，更多请关注其它相关文章！

推荐阅读

程序员
引导时间选择器不显示时间选择器选项

如何解决《引导时间选择器不显示时间选择器选项》经验，为你挑选了1个好方法。 ... [详细]

程序员
如何使用Relay调度即席查询？

如何解决《如何使用Relay调度即席查询？》经验，为你挑选了1个好方法。 ... [详细]

程序员
在js.erb Ruby on Rails中渲染部分后,资产中的Javascript无法正常工作

如何解决《在js.erbRubyonRails中渲染部分后,资产中的Javascript无法正常工作》经验，为你挑选了1个好方法。 ... [详细]

程序员
如何使用NUnit 3在Atlassian Bamboo中运行NUnit Runner？

如何解决《如何使用NUnit3在AtlassianBamboo中运行NUnitRunner？》经验，为你挑选了1个好方法。 ... [详细]

程序员
如何在没有毫秒和Z的情况下在ISO 8601中的javascript中输出日期

如何解决《如何在没有毫秒和Z的情况下在ISO8601中的javascript中输出日期》经验，为你挑选了4个好方法。 ... [详细]

程序员
UI Bootstrap uib-tabs面板右侧

如何解决《UIBootstrapuib-tabs面板右侧》经验，为你挑选了1个好方法。 ... [详细]

程序员
哈希码是否存储在SyncBlockIndex / SyncBlock中

如何解决《哈希码是否存储在SyncBlockIndex/SyncBlock中》经验，为你挑选了1个好方法。 ... [详细]

程序员
使用其他文本中的多行创建JLabel

如何解决《使用其他文本中的多行创建JLabel》经验，为你挑选了1个好方法。 ... [详细]

程序员
处理HTTP请求正文中的可选JSON字段

如何解决《处理HTTP请求正文中的可选JSON字段》经验，为你挑选了1个好方法。 ... [详细]

程序员
连接3个字符串并返回指向新字符串C的指针

如何解决《连接3个字符串并返回指向新字符串C的指针》经验，为你挑选了2个好方法。 ... [详细]

程序员
在Angular 2中使用逗号作为列表分隔符

如何解决《在Angular2中使用逗号作为列表分隔符》经验，为你挑选了2个好方法。 ... [详细]

程序员
Alamofire - 如何通过分段上传获得进度和完成关闭

如何解决《Alamofire-如何通过分段上传获得进度和完成关闭》经验，为你挑选了1个好方法。 ... [详细]

程序员
根据填充的必填字段构建和操作数组

如何解决《根据填充的必填字段构建和操作数组》经验，为你挑选了0个好方法。 ... [详细]

程序员
如何将字符串资源添加到cordova项目中的strings.xml

如何解决《如何将字符串资源添加到cordova项目中的strings.xml》经验，为你挑选了0个好方法。 ... [详细]

程序员
使用Autolayout水平对齐5个按钮的最佳方法是什么

如何解决《使用Autolayout水平对齐5个按钮的最佳方法是什么》经验，为你挑选了1个好方法。 ... [详细]

程序员
如何正确实现抽象类？

如何解决《如何正确实现抽象类？》经验，为你挑选了1个好方法。 ... [详细]

程序员
如何在Espresso中测试ActionMenuItemView的图标

如何解决《如何在Espresso中测试ActionMenuItemView的图标》经验，为你挑选了1个好方法。 ... [详细]

程序员
Visual Studio Text Visualizer缺少文本

如何解决《VisualStudioTextVisualizer缺少文本》经验，为你挑选了1个好方法。 ... [详细]

程序员
覆盖UIImageView的图像getter/setter方法

如何解决《覆盖UIImageView的图像getter/setter方法》经验，为你挑选了1个好方法。 ... [详细]

程序员
Selenium浏览器窗口大小

如何解决《Selenium浏览器窗口大小》经验，为你挑选了1个好方法。 ... [详细]

吐了个 "CAO" !

吐个槽吧,看都看了

会员登录 | 用户注册

mobiledu2402851373

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

actionscrip

bash

c#

c++

c语言

erlang

flutter

go

golang

java

javascript

lua

node.js

perl

php

python

scala

typescript

RankList | 热门文章

1如何创建使用用户定义函数的BigQuery视图？

2如何要求gson避免在json响应中转义json？

3重新绑定Elixir中外部作用域中的变量

4在Win10中拼写检查文本框 - 慢

5Flask:NameError:未定义全局名称"redirect"

6无法在Tensorflow中优化多元线性回归

7R:如何得到两个分布的总和？

8如何在ReactiveCocoa 4中创建自定义信号？

9任何状态更新,在Tensorflow的iOS示例上？

10如何列出所有Presto工作人员？

11在配置单元中,有没有办法指定添加新列的列之间？

12Android AWS S3 SDK TransferUtility在服务中不起作用

13std :: transform命令保证

14使用python将opencv图像传输到ffmpeg

15序列化UTC时间c#

16模型中的Laravel 5.1 bool属性在模型类中加入时返回空数组

17等待使用异步方法的Task.Run不会在正确的线程上抛出异常

18是否有可能将一个clojure矢量解构为最后两个项目,其余的？

19不使用Marshmallow调用Spinner onItemSelected

20清除所有setIntervals