网站首页 > 博客文章 正文
作者:洪斌
背景
在用 xtrabackup 等备份工具做备份时会有全局锁,正常情况锁占用时间很短,但偶尔会遇到锁长时间占用导致系统写入阻塞,现象是 show processlist 看到众多会话显示 wait global read lock,那可能对业务影响会很大。而且 show processlist 是无法看到哪个会话持有了全局锁,如果直接杀掉备份进程有可能进程杀掉了,但锁依然没释放,数据库还是无法写入。这时我们需要有快速定位持有全局锁会话的方法,杀掉对应会话数据库就恢复正常了。
通常这种紧急情况发生,需要 DBA 有能力快速恢复业务,如果平时没有储备,现找方法肯定是来不及的,所以我整理了几种方法,在实际故障中帮助我快速的定位到锁会话恢复了业务,非常有效,与大家分享。
方法
方法1:利用 metadata_locks 视图
此方法仅适用于 MySQL 5.7 以上版本,该版本 performance_schema 新增了 metadata_locks,如果上锁前启用了元数据锁的探针(默认是未启用的),可以比较容易的定位全局锁会话。过程如下。
开启元数据锁对应的探针 mysql> UPDATE performance_schema.setup_instruments SET ENABLED = 'YES' WHERE NAME = 'wait/lock/metadata/sql/mdl'; Query OK, 1 row affected (0.04 sec) Rows matched: 1 Changed: 1 Warnings: 0 模拟上锁 mysql> flush tables with read lock; Query OK, 0 rows affected (0.06 sec) mysql> select * from performance_schema.metadata_locks; +-------------+--------------------+----------------+-----------------------+---------------------+---------------+-------------+-------------------+-----------------+----------------+ | OBJECT_TYPE | OBJECT_SCHEMA | OBJECT_NAME | OBJECT_INSTANCE_BEGIN | LOCK_TYPE | LOCK_DURATION | LOCK_STATUS | SOURCE | OWNER_THREAD_ID | OWNER_EVENT_ID | +-------------+--------------------+----------------+-----------------------+---------------------+---------------+-------------+-------------------+-----------------+----------------+ | GLOBAL | NULL | NULL | 140613033070288 | SHARED | EXPLICIT | GRANTED | lock.cc:1110 | 268969 | 80 | | COMMIT | NULL | NULL | 140612979226448 | SHARED | EXPLICIT | GRANTED | lock.cc:1194 | 268969 | 80 | | GLOBAL | NULL | NULL | 140612981185856 | INTENTION_EXCLUSIVE | STATEMENT | PENDING | sql_base.cc:3189 | 303901 | 665 | | TABLE | performance_schema | metadata_locks | 140612983552320 | SHARED_READ | TRANSACTION | GRANTED | sql_parse.cc:6030 | 268969 | 81 | +-------------+--------------------+----------------+-----------------------+---------------------+---------------+-------------+-------------------+-----------------+----------------+ 4 rows in set (0.01 sec) OBJECT_TYPE=GLOBAL LOCK_TYPE=SHARED 表示全局锁 mysql> select t.processlist_id from performance_schema.threads t join performance_schema.metadata_locks ml on ml.owner_thread_id = t.thread_id where ml.object_type='GLOBAL' and ml.lock_type='SHARED'; +----------------+ | processlist_id | +----------------+ | 268944 | +----------------+ 1 row in set (0.00 sec)
定位到锁会话 ID 直接 kill 该会话即可。
方法2:利用 events_statements_history 视图
此方法适用于 MySQL 5.6 以上版本,启用 performance_schema.eventsstatements_history(5.6 默认未启用,5.7 默认启用),该表会 SQL 历史记录执行,如果请求太多,会自动清理早期的信息,有可能将上锁会话的信息清理掉。过程如下。
mysql> update performance_schema.setup_consumers set enabled = 'YES' where NAME = 'events_statements_history' Query OK, 0 rows affected (0.00 sec) Rows matched: 1 Changed: 0 Warnings: 0 mysql> flush tables with read lock; Query OK, 0 rows affected (0.00 sec) mysql> select * from performance_schema.events_statements_history where sql_text like 'flush tables%'\G *************************** 1. row *************************** THREAD_ID: 39 EVENT_ID: 21 END_EVENT_ID: 21 EVENT_NAME: statement/sql/flush SOURCE: socket_connection.cc:95 TIMER_START: 94449505549959000 TIMER_END: 94449505807116000 TIMER_WAIT: 257157000 LOCK_TIME: 0 SQL_TEXT: flush tables with read lock DIGEST: 03682cc3e0eaed3d95d665c976628d02 DIGEST_TEXT: FLUSH TABLES WITH READ LOCK ... NESTING_EVENT_LEVEL: 0 1 row in set (0.00 sec) mysql> select t.processlist_id from performance_schema.threads t join performance_schema.events_statements_history h on h.thread_id = t.thread_id where h.digest_text like 'FLUSH TABLES%'; +----------------+ | processlist_id | +----------------+ | 12 | +----------------+ 1 row in set (0.01 sec)
方法3:利用 gdb 工具
如果上述两种都用不了或者没来得及启用,可以尝试第三种方法。利用 gdb 找到所有线程信息,查看每个线程中持有全局锁对象,输出对应的会话 ID,为了便于快速定位,我写成了脚本形式。也可以使用 gdb 交互模式,但 attach mysql 进程后 mysql 会完全 hang 住,读请求也会受到影响,不建议使用交互模式。
#!/bin/bash set -v threads=$(gdb -p $1 -q -batch -ex 'info threads'| awk '/mysql/{print $1}'|grep -v '*'|sort -nk1) for i in $threads; do echo "######## thread $i ########" lock=`gdb -p $1 -q -batch -ex "thread $i" -ex 'p do_command::thd->thread_id' -ex 'p do_command::thd->global_read_lock'|grep -B3 GRL_ACQUIRED_AND_BLOCKS_COMMIT` if [[ $lock =~ 'GRL_ACQUIRED_AND_BLOCKS_COMMIT' ]]; then echo "$lock" break fi done # thread_id变量,5.6和5.7版本有所不同,5.6版本是thd->thread_id,5.7版本是thd->m_thread_id,这里需要留意下
脚本输出
######## thread 2 ######## [Switching to thread 2 (Thread 0x7f610812b700 (LWP 10702))] #0 0x00007f6129685f0d in poll () from /lib64/libc.so.6 $1 = 9 此处就是mysql中的会话ID $2 = {static m_active_requests = 1, m_state = Global_read_lock::GRL_ACQUIRED_AND_BLOCKS_COMMIT, m_mdl_global_shared_lock = 0x7f60e800cb10, m_mdl_blocks_commits_lock = 0x7f60e801c900}
但实际环境可能会比较复杂,用 gdb 可能也无法获得你想要的信息,是不是就没辙了。
方法4:show processlist
如果备份程序使用的特定用户执行备份,如果是 root 用户备份,那 time 值越大的是持锁会话的概率越大,如果业务也用 root 访问,重点是 state 和 info 为空的,这里有个小技巧可以快速筛选,筛选后尝试 kill 对应 ID,再观察是否还有 wait global read lock 状态的会话。
mysql>pager awk '/username/{if (length($7) == 4) {print $0}}'|sort -rk6 mysql>show processlist
如果以上方法全部无效,最后释放终极大招...
方法5:重启试试!
如果你有更好的方法,可以留言分享。
猜你喜欢
- 2024-09-26 技术分享:Linux 问题故障定位(linux系统故障及解决方法)
- 2024-09-26 10个最高频的Java NIO面试题剖析(java8)
- 2024-09-26 TCP/IP协议栈在Linux内核中的运行时序分析
- 2024-09-26 四十二、Linux网络管理,软件安装,进程管理总结
- 2024-09-26 JAVA中的BIO、NIO、AIO分别指的是什么?懂得不防也要看看对不对
- 2024-09-26 RPC框架的可靠性设计(rpc框架选型)
- 2024-09-26 JVM优化1 jvm的运行参数 内存模型 jstack命令 VisualJVM工具
- 2024-09-26 问题排查神器 - Git Bisect 命令实战分享
- 2024-09-26 深入浅出!阿里运维专家三种方法教你如何应对高并发“海啸”场景
- 2024-09-26 实战录 | HttpClient的超时设置(实战录+|+httpclient的超时设置在哪里)
你 发表评论:
欢迎- 最近发表
-
- 给3D Slicer添加Python第三方插件库
- Python自动化——pytest常用插件详解
- Pycharm下安装MicroPython Tools插件(ESP32开发板)
- IntelliJ IDEA 2025.1.3 发布(idea 2020)
- IDEA+Continue插件+DeepSeek:开发者效率飙升的「三体组合」!
- Cursor:提升Python开发效率的必备IDE及插件安装指南
- 日本旅行时想借厕所、买香烟怎么办?便利商店里能解决大问题!
- 11天!日本史上最长黄金周来了!旅游万金句总结!
- 北川景子&DAIGO缘定1.11 召开记者会宣布结婚
- PIKO‘PPAP’ 洗脑歌登上美国告示牌
- 标签列表
-
- ifneq (61)
- messagesource (56)
- aspose.pdf破解版 (56)
- promise.race (63)
- 2019cad序列号和密钥激活码 (62)
- window.performance (66)
- qt删除文件夹 (72)
- mysqlcaching_sha2_password (64)
- ubuntu升级gcc (58)
- nacos启动失败 (64)
- ssh-add (70)
- jwt漏洞 (58)
- macos14下载 (58)
- yarnnode (62)
- abstractqueuedsynchronizer (64)
- source~/.bashrc没有那个文件或目录 (65)
- springboot整合activiti工作流 (70)
- jmeter插件下载 (61)
- 抓包分析 (60)
- idea创建mavenweb项目 (65)
- vue回到顶部 (57)
- qcombobox样式表 (68)
- vue数组concat (56)
- tomcatundertow (58)
- pastemac (61)
本文暂时没有评论,来添加一个吧(●'◡'●)