IT技术博客大学习 共学习 共进步

linux无法识别存储的一个低级问题

Linux|系统管理|WEB开发 2010-03-17 09:29:20 浏览 3,481 次

上午同事打电话过来,说某项目中,咱们的系统无法识别到HP的存储。HBA卡是Qlogic 2400系列的.驱动是最新的,而且卡已经正常工作了,在dmesg里能看到HP存储的型号,但是就是看不到存储磁盘。不过有一个提示信息,具体的日志是这样:

QLogic Fibre Channel HBA Driver
ACPI: PCI Interrupt 0000:0a:00.0[A] -> GSI 31 (level, low) -> IRQ 225
qla2400 0000:0a:00.0: Found an ISP2432, irq 225, iobase 0xffffff0000028000
qla2400 0000:0a:00.0: Configuring PCI space...
PCI: Setting latency timer of device 0000:0a:00.0 to 64
qla2400 0000:0a:00.0: Configure NVRAM parameters...
qla2400 0000:0a:00.0: Verifying loaded RISC code...
qla2400 0000:0a:00.0: Allocated (64 KB) for EFT...
qla2400 0000:0a:00.0: Allocated (1413 KB) for firmware dump...
qla2400 0000:0a:00.0: Waiting for LIP to complete...
qla2400 0000:0a:00.0: LIP reset occured (f700).
qla2400 0000:0a:00.0: LOOP UP detected (4 Gbps).
qla2400 0000:0a:00.0: Topology - (F_Port), Host Loop address 0x0
scsi5 : qla2xxx
qla2400 0000:0a:00.0:
 QLogic Fibre Channel HBA Driver: 8.02.09.02.04.08-d
  QLogic HPAE311A - Sun PCI-X 2.0 to 4Gb FC, Single Channel
  ISP2432: PCIe (2.5Gb/s x4) @ 0000:0a:00.0 hdma+, host#=5, fw=4.04.09 [IP] [84XX]
scsi: unknown device type 12
  Vendor: HP        Model: HSV200            Rev: 6110
  Type:   RAID                               ANSI SCSI revision: 05
qla2400 0000:0a:00.0: scsi(5:0:0:0): Enabled tagged queuing, queue depth 16.
scsi: unknown device type 12
  Vendor: HP        Model: HSV200            Rev: 6110
  Type:   RAID                               ANSI SCSI revision: 05
qla2400 0000:0a:00.0: scsi(5:0:1:0): Enabled tagged queuing, queue depth 16.
scsi: unknown device type 12
  Vendor: HP        Model: HSV200            Rev: 6110
  Type:   RAID                               ANSI SCSI revision: 05
qla2400 0000:0a:00.0: scsi(5:0:2:0): Enabled tagged queuing, queue depth 16.
scsi: unknown device type 12
  Vendor: HP        Model: HSV200            Rev: 6110
  Type:   RAID                               ANSI SCSI revision: 05
qla2400 0000:0a:00.0: scsi(5:0:3:0): Enabled tagged queuing, queue depth 16.

查看了一下SCSI SP3,device type 12是Automation/Adapter interface设备。那就是说应该只是识别到了存储控制器本身。从纯粹系统的角度来看,可能是存储设备上还没有划分LUN,或者划分了LUN,但是没有做映射(LUN map,Lun Mask,Host Channel)。不过HP的工程师一口咬定说都做了,而且还说这个项目的其他实施点都是这么做的。没有问题。

既然这么肯定,那就用一个办法来判断是不是我们系统的问题吧,采取最简单的拓扑结构,去掉双控制器,去掉光纤交换机。从单控制器上直接拉一根光纤到HBA卡上,我们看看会怎样。

换成这样的拓扑结构后,别入LUN了,连存储都找不到了,就和只安装了HBA卡,没有接光纤线或者说接了光纤线但是没有连接到存储的现象一样。这就明显不对呀,如果是系统的问题,那至少会给出一些核心信息出来呀。而且只是简化了结构,怎么连存储控制器都找不到了,这不能说存储没有问题了吧。

同时在HP官方论坛也找到了一个类似的信息,其中就有人很肯定的说到应该设置host entry,也就是磁盘映射之类的配置了。同事把这些信息告知了用户,后来HP同意下午来人看看。

到了下午3点,同事没有打来电话,到3点半了,同事电话打过来了,说已经好了,我问怎么回事,他说是存储控制器电池没电了,估计作的配置压根就没有生效。这还是用户告诉他的,HP的人没有给同事打电话。同事很气氛,因为上午的时候,用户发现了电池报警的事情,告诉了HP,HP工程师说没有问题(同事是远程支持),结果折腾了大半天。

警告,自然有它的道理,既然有了警告,为什么不愿意花1分钟时间看看是怎么回事呢?

建议继续学习

  1. HFile存储格式 (阅读 15,822)
  2. 我对技术方向的一些反思 (阅读 11,144)
  3. 淘宝图片存储架构 (阅读 10,843)
  4. 海量小文件存储 (阅读 9,702)
  5. HBase技术介绍 (阅读 7,942)
  6. 存储基础知识之——硬盘接口简述 (阅读 7,405)
  7. 如果用户在5分钟内重复上线,就给他发警告,问如何设计? (阅读 5,882)
  8. 在perl中连接和使用sqlite做数据存储 (阅读 5,701)
  9. Redis新的存储模式diskstore (阅读 5,440)
  10. HTML5本地存储初探(二) (阅读 5,063)