本篇內(nèi)容主要講解“l(fā)inux oops指的是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“l(fā)inux oops指的是什么”吧!
創(chuàng)新互聯(lián)公司是一家專注于成都網(wǎng)站設(shè)計(jì)、網(wǎng)站建設(shè)與策劃設(shè)計(jì),舟曲網(wǎng)站建設(shè)哪家好?創(chuàng)新互聯(lián)公司做網(wǎng)站,專注于網(wǎng)站建設(shè)十多年,網(wǎng)設(shè)計(jì)領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:舟曲等地區(qū)。舟曲做網(wǎng)站價(jià)格咨詢:13518219792
linux oops的意思是指當(dāng)Linux內(nèi)核在發(fā)生“kernel panic”時(shí),打印出的Oops信息,然后會(huì)把目前的寄存器狀態(tài)、堆棧內(nèi)容、以及完整的Call trace都show給我們看,這樣就可以幫助我們定位錯(cuò)誤。
Linux內(nèi)核的Oops介紹
什么是Oops?從語言學(xué)的角度說,Oops應(yīng)該是一個(gè)擬聲詞。當(dāng)出了點(diǎn)小事故,或者做了比較尷尬的事之后,你可以說"Oops",翻譯成中國話就叫做“哎呦”。“哎呦,對(duì)不起,對(duì)不起,我真不是故意打碎您的杯子的”???,Oops就是這個(gè)意思。
在Linux內(nèi)核開發(fā)中的Oops是什么呢?其實(shí),它和上面的解釋也沒什么本質(zhì)的差別,只不過說話的主角變成了Linux。當(dāng)某些比較致命的問題出現(xiàn)時(shí),我們的Linux內(nèi)核也會(huì)抱歉的對(duì)我們說:“哎呦(Oops),對(duì)不起,我把事情搞砸了”。Linux內(nèi)核在發(fā)生kernel panic時(shí)會(huì)打印出Oops信息,把目前的寄存器狀態(tài)、堆棧內(nèi)容、以及完整的Call trace都show給我們看,這樣就可以幫助我們定位錯(cuò)誤。
下面,我們來看一個(gè)實(shí)例。為了突出本文的主角--Oops,這個(gè)例子唯一的作用就是造一個(gè)空指針引用錯(cuò)誤。
#include
#include
static int __init hello_init(void)
{
int *p = 0;
*p = 1;
return 0;
}
static void __exit hello_exit(void)
{
return;
}
module_init(hello_init);
module_exit(hello_exit);
MODULE_LICENSE("GPL");
很明顯,錯(cuò)誤的地方就是第8行。
接下來,我們把這個(gè)模塊編譯出來,再用insmod來插入到內(nèi)核空間,正如我們預(yù)期的那樣,Oops出現(xiàn)了。
[ 100.243737] BUG: unable to handle kernel NULL pointer dereference at (null)
[ 100.244985] IP: [
] hello_init+0x5/0x11 [hello] [ 100.262266] *pde = 00000000
[ 100.288395] Oops: 0002 [#1] SMP
[ 100.305468] last sysfs file: /sys/devices/virtual/sound/timer/uevent
[ 100.325955] Modules linked in: hello(+) vmblock vsock vmmemctl vmhgfs acpiphp snd_ens1371 gameport snd_ac97_codec ac97_bus snd_pcm_oss snd_mixer_oss snd_pcm snd_seq_dummy snd_seq_oss snd_seq_midi snd_rawmidi snd_seq_midi_event snd_seq snd_timer snd_seq_device ppdev psmouse serio_raw fbcon tileblit font bitblit softcursor snd parport_pc soundcore snd_page_alloc vmci i2c_piix4 vga16fb vgastate intel_agp agpgart shpchp lp parport floppy pcnet32 mii mptspi mptscsih mptbase scsi_transport_spi vmxnet
[ 100.472178] [ 100.494931] Pid: 1586, comm: insmod Not tainted (2.6.32-21-generic #32-Ubuntu) VMware Virtual Platform
[ 100.540018] EIP: 0060:[
] EFLAGS: 00010246 CPU: 0 [ 100.562844] EIP is at hello_init+0x5/0x11 [hello]
[ 100.584351] EAX: 00000000 EBX: fffffffc ECX: f82cf040 EDX: 00000001
[ 100.609358] ESI: f82cf040 EDI: 00000000 EBP: f1b9ff5c ESP: f1b9ff5c
[ 100.631467] DS: 007b ES: 007b FS: 00d8 GS: 00e0 SS: 0068
[ 100.657664] Process insmod (pid: 1586, ti=f1b9e000 task=f137b340 task.ti=f1b9e000)
[ 100.706083] Stack:
[ 100.731783] f1b9ff88 c0101131 f82cf040 c076d240 fffffffc f82cf040 0072cff4 f82d2000
[ 100.759324] <0> fffffffc f82cf040 0072cff4 f1b9ffac c0182340 f19638f8 f137b340 f19638c0
[ 100.811396] <0> 00000004 09cc9018 09cc9018 00020000 f1b9e000 c01033ec 09cc9018 00015324
[ 100.891922] Call Trace:
[ 100.916257] [
] ? do_one_initcall+0x31/0x190 [ 100.943670] [
] ? hello_init+0x0/0x11 [hello] [ 100.970905] [
] ? sys_init_module+0xb0/0x210 [ 100.995542] [
] ? syscall_call+0x7/0xb [ 101.024087] Code:
05 00 00 00 00 01 00 00 00 5d c3 00 00 00 00 00 00 00 00 00 00 [ 101.079592] EIP: [
] hello_init+0x5/0x11 [hello] SS:ESP 0068:f1b9ff5c [ 101.134682] CR2: 0000000000000000
[ 101.158929] ---[ end trace e294b69a66d752cb ]---
Oops首先描述了這是一個(gè)什么樣的bug,然后指出了發(fā)生bug的位置,即“IP: [
在這里,我們需要用到一個(gè)輔助工具objdump來幫助分析問題。objdump可以用來反匯編,命令格式如下:
objdump -S hello.o
下面是hello.o反匯編的結(jié)果,而且是和C代碼混排的,非常的直觀。
hello.o: file format elf32-i386
Disassembly of section .init.text:
00000000 :
#include
#include
static int __init hello_init(void)
{
0: 55 push %ebp
int *p = 0;
*p = 1;
return 0;
}
1: 31 c0 xor %eax,%eax
#include
#include
static int __init hello_init(void)
{
3: 89 e5 mov %esp,%ebp
int *p = 0;
*p = 1;
5: c7 05 00 00 00 00 01 movl $0x1,0x0
c: 00 00 00
return 0;
}
f: 5d pop %ebp
10: c3 ret
Disassembly of section .exit.text:
00000000 :
static void __exit hello_exit(void)
{
0: 55 push %ebp
1: 89 e5 mov %esp,%ebp
3: e8 fc ff ff ff call 4
return;
}
8: 5d pop %ebp
9: c3 ret
對(duì)照Oops的提示,我們可以很清楚的看到,出錯(cuò)的位置hello_init+0x5的匯編代碼是:
5:c7 05 00 00 00 00 01 movl $0x1,0x0
這句代碼的作用是把數(shù)值1存入0這個(gè)地址,這個(gè)操作當(dāng)然是非法的。
我們還能看到它對(duì)應(yīng)的c代碼是:
*p = 1;
Bingo!在Oops的幫助下我們很快就解決了問題。
我們?cè)倩剡^頭來檢查一下上面的Oops,看看Linux內(nèi)核還有沒有給我們留下其他的有用信息。
Oops: 0002 [#1]
這里面,0002表示Oops的錯(cuò)誤代碼(寫錯(cuò)誤,發(fā)生在內(nèi)核空間),#1表示這個(gè)錯(cuò)誤發(fā)生一次。
Oops的錯(cuò)誤代碼根據(jù)錯(cuò)誤的原因會(huì)有不同的定義,本文中的例子可以參考下面的定義(如果發(fā)現(xiàn)自己遇到的Oops和下面無法對(duì)應(yīng)的話,最好去內(nèi)核代碼里查找):
* error_code:
* bit 0 == 0 means no page found, 1 means protection fault
* bit 1 == 0 means read, 1 means write
* bit 2 == 0 means kernel, 1 means user-mode
* bit 3 == 0 means data, 1 means instruction
有時(shí)候,Oops還會(huì)打印出Tainted信息。這個(gè)信息用來指出內(nèi)核是因何種原因被tainted(直譯為“玷污”)。具體的定義如下:
1: 'G' if all modules loaded have a GPL or compatible license, 'P' if any proprietary module has been loaded. Modules without a MODULE_LICENSE or with a MODULE_LICENSE that is not recognised by insmod as GPL compatible are assumed to be proprietary.
2: 'F' if any module was force loaded by "insmod -f", ' ' if all modules were loaded normally.
3: 'S' if the oops occurred on an SMP kernel running on hardware that hasn't been certified as safe to run multiprocessor. Currently this occurs only on various Athlons that are not SMP capable.
4: 'R' if a module was force unloaded by "rmmod -f", ' ' if all modules were unloaded normally.
5: 'M' if any processor has reported a Machine Check Exception, ' ' if no Machine Check Exceptions have occurred.
6: 'B' if a page-release function has found a bad page reference or some unexpected page flags.
7: 'U' if a user or user application specifically requested that the Tainted flag be set, ' ' otherwise.
8: 'D' if the kernel has died recently, i.e. there was an OOPS or BUG.
9: 'A' if the ACPI table has been overridden.
10: 'W' if a warning has previously been issued by the kernel. (Though some warnings may set more specific taint flags.)
11: 'C' if a staging driver has been loaded.
12: 'I' if the kernel is working around a severe bug in the platform firmware (BIOS or similar).
基本上,這個(gè)Tainted信息是留給內(nèi)核開發(fā)者看的。用戶在使用Linux的過程中如果遇到Oops,可以把Oops的內(nèi)容發(fā)送給內(nèi)核開發(fā)者去debug,內(nèi)核開發(fā)者根據(jù)這個(gè)Tainted信息大概可以判斷出kernel panic時(shí)內(nèi)核運(yùn)行的環(huán)境。如果我們只是debug自己的驅(qū)動(dòng),這個(gè)信息就沒什么意義了。
本文的這個(gè)例子非常簡(jiǎn)單,Oops發(fā)生以后沒有造成宕機(jī),這樣我們就可以從dmesg中查看到完整的信息。但更多的情況是Oops發(fā)生的同時(shí)系統(tǒng)也會(huì)宕機(jī),此時(shí)這些出錯(cuò)信息是來不及存入文件中的,關(guān)掉電源后就無法再看到了。我們只能通過其他的方式來記錄:手抄或者拍照。
還有更壞的情況,如果Oops信息過多的話,一頁屏幕顯示不全,我們?cè)趺磥聿榭赐暾膬?nèi)容呢?第一種方法,在grub里用vga參數(shù)指定更高的分辨率以使屏幕可以顯示更多的內(nèi)容。很明顯,這個(gè)方法其實(shí)解決不了太多的問題;第二種方法,使用兩臺(tái)機(jī)器,把調(diào)試機(jī)的Oops信息通過串口打印到宿主機(jī)的屏幕上。但現(xiàn)在大部分的筆記本電腦是沒有串口的,這個(gè)解決方法也有很大的局限性;第三種方法,使用內(nèi)核轉(zhuǎn)儲(chǔ)工具kdump把發(fā)生Oops時(shí)的內(nèi)存和CPU寄存器的內(nèi)容dump到一個(gè)文件里,之后我們?cè)儆胓db來分析問題。開發(fā)內(nèi)核驅(qū)動(dòng)的過程中可能遇到的問題是千奇百怪的,調(diào)試的方法也是多種多樣,Oops是Linux內(nèi)核給我們的提示,我們要用好它。
到此,相信大家對(duì)“l(fā)inux oops指的是什么”有了更深的了解,不妨來實(shí)際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!