JVM基础知识和调优基础原理


欢迎加入王导的VIP学习qq群:==>932194668<==


JVM原理

什么是jvm

java虚拟机,就是个应用程序,工作在用户态

详解

JVM是按照运行时数据的存储结构来划分内存结构的,JVM在运行java程序时,将它们划分成几种不同格式的数据,分别存储在不同的区域,这些数据统一称为运行时数据。运行时数据包括java程序本身的数据信息和JVM运行java需要的额外数据信息。

JVM运行时数据区

  • 程序计数器–线程私有

    行号,指示程序执行到哪个位置

  • Java虚拟机栈–线程私有
  • 本地方法栈–线程私有

    操作系统底层的方法

  • Java堆–线程公用

JVM内存分配

栈内存分配 -xss 默认1M

保存参数、局部变量、中间计算过程和其他数据。退出方法的时候,修改栈顶指针就可以把栈帧中的内容销毁。

  • 栈的优点:存取速度比堆块,仅次于寄存器,栈数据可以共享。
  • 栈的缺点:存在栈中的数据大小、生存期是在编译时就确定的,导致其缺乏灵活性。

    stack out of memory

    一般情况下不会溢出,方法不会写那么大

    堆内存分配:

    保存对象
  • 堆的优点:动态分配内存大小,生存期不必事先告诉编译器,它是在运行期动态分配的,垃圾回收器会自动收走不再使用的空间区域。
  • 堆的缺点:运行时动态分配内存,在分配和销毁时都要占用时间,因此堆的效率较低。

    堆结构:

  • Young:E区,S0,S1
  • Old:
  • Permanent:

JVM堆配置参数:

概述

  • -Xms 初始堆大小

    默认物理内存的1/64(<1GB)

  • -Xmx最大堆大小

    默认物理内存的1/4(<1GB),实际中建议不大于4GB

  • 一般建议设置 -Xms=-Xmx

    好处是避免每次在gc后,调整堆的大小,减少系统内存分配开销

  • 整个堆大小=年轻代大小+年老代大小+持久代大小

新生代:

  • 新生代=1个eden区+2个survivor区
  • -Xmn 年轻代大小(1.4 or later)

    -XX:NewSize,-XX:MaxNewSize(设置年轻代大小,1.4之前)

  • -XX:NewRatio

    年轻代(包括E区和两个S区)与年老代的比值(除去持久代)
    一般情况下设置了Xms=Xmx并且设置了Xmn的情况下,该参数不需要设置。

  • -XX:ServivorRatio

    1个S区与E区大小的比值,默认设置为8,则1个S区占整个年轻代的1/10

  • 新生代用来存放JVM刚分配的Java对象

老年代:

  • 老年代=整个堆-年轻代大小-持久代大小
  • 年轻代中经过垃圾回收没有回收掉的对象被复制到年老代
  • 老年代存储对象比年轻代年龄大的多,而且不乏大对象(缓存)
  • 新建的对象也有可能直接进入老年代
    • 大对象,可通过启动参数设置-XX:PretnureSizeThreshold=1024(单位为字节,默认为0)来代表超过多大时就不在新生代分配,而是直接在老年代分配。
    • 大的数组对象,切数组中无引用外部对象
  • 老年代大小无配置参数

持久代:

  • 持久代=整个堆-年轻代大小-老年代大小
  • -XX:PermSize -XX:MaxPermSize

    设置持久代的大小,一般情况推荐把-XX:PermSize设置成-XX:MaxPermSize的值为相同的值,因为持久代大小的调整也会导致堆内存需要触发fgc。

  • 存放Class、Method元信息,其大小与项目的规模、类、方法的数量有关。一般设置为128M就足够,设置原则是预留30%的空间。
  • 持久代的回收方式
    • 常量池中的常量,无用的类信息,常量的回收很简单,没有引用了就可以被回收
    • 对于无用的类进行回收,必须保证3点:
      • 类的所有实例都已经被回收
      • 加载类的ClassLoader已经被回收
      • 类对象Class对象没有被引用(即没有通过反射引用该类的地方)

JVM内存垃圾回收:

垃圾收集算法:

  • 引用计数算法(濒临被抛弃
  • 根搜索算法:

    从GC Roots开始向下搜索,搜索所走过的路径称为引用链。当一个对象到GC Roots没有任何引用链相连时,则证明对象是不可用的。即不可达对象。
    在Java语言中,GC Roots包括:

  • 虚拟机栈中引用的对象。(大部分被回收的)
  • 方法区中静态属性实体引用的对象。
  • 方法区中常量引用的对象。
  • 本地方法栈中JNI引用的对象。

垃圾回收算法:

复制算法(Copying)

当空间存活的对象比较少时,极为高效,此算法用于新生代内存回收,从E区回收到S0或S1

标记清除算法(Mark-Sweep)

产生碎片,适合老年代垃圾回收。

标记整理压缩算法(Mark-Compac)

稍慢,适合老年代垃圾回收,解决碎片问题,对象连续,成本更高

名词解释:

  • 串行回收:gc单线程内存回收、会暂停所有用户线程,用于client端
  • 并行回收:收集是指多个GC线程并行工作,但此时用户线程是暂停的
  • 并发回收:是指用户线程与GC线程同时执行(不一定是并行,可能交替,但总体上是同时执行的),不需要停顿用户线程(其实CMS中用户线程还是需要停顿的,只是非常短,GC线程在另一个CPU上执行)

JVM常见的垃圾回收器:

Serial回收器(串行回收器)

是一个单线程的收集器,只能使用一个CPU或者一条线程去完成垃圾收集,在进行垃圾收集时,必须暂停所有其他工作线程,直到收集完成

  • -XX:+UseSerialGC来开启(新生代和老年代都开启)
  • 使用复制算法(新生代)标记-压缩算法(老年代)
  • 串行的、独占式的垃圾回收器
  • 缺点:Stop-The-World

ParNew回收器(并行回收器)

也是独占式回收器,在收集过程中,应用程序全部暂停。如果是单CPU上或者并发能力较弱的系统上,还不如串行回收器性能好。

  • -XX:+UseParNewGC开启
  • -XX:ParallelGCThreads指定线程数,默认最好与CPU数量相当

新生代Parallel Scavenge回收器

吞吐量优先回收器

  • 关注CPU吞吐量,即运行用户代码的时间/总时间,适合运行后台运算
  • -XX:+UserParallelGC开启,这也是在Server模式下的默认值
  • -XX:GCTimeRatio
  • -XX:MaxGCPauseMillis

老年代ParallelOld回收器

  • -XX:+UseParallelOldGC开启

CMS(并发标记清除)回收器

用的最广泛,标记和重新标记两个阶段仍然需要停止用户线程,但时间很快

初始标记
并发标记
重新标记
并发清除

  • 标记-清除算法:同时它又是一个使用多线程并发回收的垃圾收集器
  • -XX:ParallelCMSThreads:手工设定CMS线程数量,CMS默认启动的线程数是(ParallelGCThreads+3)/4
  • -XX:+UseConcMarkSweepGC开启
  • -XX:CMSInitialtingOccupancyFraction
    设置CMS收集器在老年代空间被使用多少后触发垃圾收集,默认值为68%,仅在CMS收集器时有效,-XX:CMSInitiatingOccupancyFraction=70
  • -XX:+UseCMSCompactAtFullCollection
    由于CMS收集器会产生碎片,此参数设置在垃圾收集器后是否需要一次内存碎片整理过程,仅在CMS收集器时有效。
  • -XX:+CMSFullGCBeforeCompaction
    设置CMS收集器在进行若干次垃圾收集后再进行一次内存碎片整理过程,通常与UseCMSCompactAtFullCollection参数一起使用
  • -XX:CMSInitiatingPermOccupancyFraction
    设置持久代

GC性能指标

吞吐量

应用花在非GC上的时间百分比

GC负荷

花在GC时间百分比

暂停时间(看GClog)

应用划在GC stop-the-world的时间

GC频率

反应速度

从一个对象变成垃圾到这个对象被回收的时间

小结

  • 一个交互式的应用要求暂停时间越少越好,然而,一个非交互式的应用,希望GC负荷越低越好
  • 一个实时系统对暂停时间和GC负荷要求,都是越低越好

内存容量配置原则

年轻代大小选择

  • 响应时间优先的应用

    尽可能设大,直到接近系统的最低响应时间限制(根据实际情况选择),在此情况下,年轻代收集发生的频率也是最小的,同时减少到达老年代的对象

  • 吞吐量优先的应用

    尽可能设置大,可能到达Gbit的程度,因为对响应时间没有要求,垃圾收集可以并行进行,一般适合8CPU以上的应用
    避免设置过小,当新生代设置过小时会导致

  • YGC次数更加频繁
  • 可能导致YGC对象直接进入老年代,如果此时老年代满了,会触发FGC

老年代大小选择

  • 响应时间优先的应用

    使用并发垃圾收集器(CMS)设置小了会造成内存碎片,高回收频率以及应用暂停而使用传统的标记清除方式,如果堆大了,需要较长的收集时间,最优化的方案,一般参考以下数据获得:
    并发垃圾收集信息、持久代并发收集次数、传统GC信息、花在年轻代和年老代回收上的时间比例

  • 吞吐量优先的应用

    一般吞吐量优先的应用都有一个很大的年轻代和一个较小的年老代。原因是,这样可以尽可能回收掉大部分短期对象,减少中期的对象,而年老代尽量存放长期存活对象。

java排障

使用jps获取java进程的pid

1
# jps -lvm

导出CPU占用高进程的线程栈

1
jstack `$pid` >> java.txt

查看对应进程的哪个线程占用CPU过高

1
# top -H -p 22056

将线程的pid转换为16进制

1
# echo "obase=16;`$pid`"|bc

第二步中导出的java.txt中查找转换为16进制的线程pid,找到对应的线程栈

分析负载高的线程栈都是什么业务操作,优化程序并处理问题

坚持原创技术分享,您的支持将鼓励我继续创作!