Windows-Server-2012-R2

在伺服器 2012R2 中為 HPC 集群部署基本說明掛起

  • July 14, 2015

我們正在評估帶有 HPC 包的伺服器 2012R2 標準,用於一小群節點(大約 40 個開始 - 目前設置只有一個計算節點)。

目前,我們使用舊硬體來嘗試事物並了解我們需要什麼。但是現在我在裸機部署基本節點時被卡住了。

供應日誌:

Time                Message
28-6-2015 15:19:56  Sending PXE command to boot node to WINPE (Expected boot time: 5-15 minutes)
28-6-2015 15:19:46  Sending PXE command to boot node to WINPE (Expected boot time: 5-15 minutes)
28-6-2015 15:19:43  Waiting for node to boot into WINPE
28-6-2015 15:19:43  Initiating configuration operations for template: VideoEncoder Base Template
28-6-2015 15:19:43  Computer account ENCODER1004 created
28-6-2015 15:19:42  The computer account ENCODER1004 does not exist; creating a new account in Active Directory.
28-6-2015 15:19:42  Searching for an existing account in Active Directory
28-6-2015 15:19:42  Connecting to domain controller: encoders.local
28-6-2015 15:19:42  Initiating provisioning operations for template: VideoEncoder Base Template
28-6-2015 15:19:42  Creating DHCP reservation 192.168.20.5 on scope 192.168.20.0
28-6-2015 15:19:41  Setting DHCP option 17 to iscsi:192.168.20.1::::iqn.1991-05.com.microsoft:head-node-encoder1004-base-target
28-6-2015 15:19:41  Setting DHCP option 12 to encoder1004
28-6-2015 15:19:41  Setting DHCP option 203 to iqn.1991-05.com.microsoft:encoder1004.encoders.local
28-6-2015 15:19:41  Creating a reservation for network adapter: FCAA14656038
28-6-2015 15:19:41  Mapping successful
28-6-2015 15:19:40  Mapping client [iqn.1991-05.com.microsoft:encoder1004.encoders.local] to target LUN [ENCODER1004-BASE] on storage array [127.0.0.1]
28-6-2015 15:19:39  Remote disk disconnected
28-6-2015 15:18:52  Disconnecting remote disk
28-6-2015 15:18:37  Configuring bootloader
28-6-2015 15:18:20  Copying WinPE files
28-6-2015 15:18:16  Placing bootloader
28-6-2015 15:18:16  Mount successful at: C:\Windows\TEMP\larluozy.ekq
28-6-2015 15:17:41  Connection established, mounting disk
28-6-2015 15:17:40  Connecting to iSCSI target: 192.168.20.1 / iqn.1991-05.com.microsoft:head-node-encoder1004-base-target
28-6-2015 15:17:40  Mapping successful
28-6-2015 15:17:39  Mapping client [iqn.1991-05.com.microsoft:HEAD-NODE.encoders.local] to target LUN [ENCODER1004-BASE] on storage array [127.0.0.1]
28-6-2015 15:17:39  Base LUN creation complete
28-6-2015 15:17:39  Creation successful
28-6-2015 15:17:38  Creating base LUN "ENCODER1004-BASE"
28-6-2015 15:17:37  Setting boot-initiator information
28-6-2015 15:17:37  Associating template VideoEncoder Base Template with node ENCODERS\ENCODER1004
28-6-2015 15:17:37  Moving node ENCODERS\ENCODER1004 from state Unknown to state Provisioning
28-6-2015 15:17:37  Assigning template VideoEncoder Base Template to node ENCODER1004

基本節點螢幕的網路攝像頭擷取:

(小代表發布圖片 - 需要 10+ - 所以這裡輸入最後幾行)

Contacting Server: 192.168.20.1.....

PXE->EB: !PXE at 8AC4:0070. entry point at 8AC4:0100
        UNDI code segment 8AC4:3BE8. data segment 7E79:C4B0 (505-571kB)
        UNDI device is PCI 03:00.0 type DIX+802.3
        505kB free base memory after PXE unload
iPXI initialising devices...ok

iPXE 1.0.0+ (d739) ..


net0: fc:aa.. ..60:38 using undionly on UNDI-PCI03:00.0 (open)
 [Link:up, TX:0 TXE:0 RX:0 RXE:0]
Configuring (net0: fc:aa.. ..60:38)...... ok
net0: 192.168.20.5/255.255.255.0 gw 192.168.20.1
Root path: iscsi:192.168.20.1::::iqn.1991-05.com.microsift:head-node-encoder1004-base-target
Registered SAN device 0x80
Booting from SAN device 0x80

如果有本地 HDD(意外發生),則在節點上通過 PXE 安裝有效。然而,裸機停止了螢幕和上面發布的日誌。此時未連接 iSCSI 驅動器。

設置:

  • 伺服器: DELL 1520 筆記型電腦,2GB RAM + 135 GB HDD

    • 作業系統:伺服器 2012R2 標準(評估)+ HPC 包 2012 SP1
    • 充當:AD、DNS、DHCP、WDS、HPC 控制器和 iSCSI 目標
    • PXE 載入器: iPXI 鍊式載入
  • ***基本節點:***帶有 Celeron n2807 的 Gigabyte ITX 板,4GB RAM,沒有 HDD(我們需要快速同步而不是純 CPU 能力)

    • 作業系統:Server 2012R2 標準核心(評估,無啟動密鑰)Win8.1 嵌入式行業,鏡像中嵌入了批量許可證和啟動密鑰
    • 啟用 PXE 啟動,啟用掉電自動啟動

**問題:**我可以做些什麼來解決問題或至少找到問題的原因?

我是程序員而不是管理員,所以我對這些東西的了解是有限的,但是在像我們這樣的小型初創公司中,沒有其他人可以做到這一點。因此,任何幫助和指示都非常受歡迎。我們知道我們正在用這個硬體推動它。將在接下來的幾天內訂購第一個測試設置。但我想讓這個工作之前,看看我們是否需要我們迄今為止忽略的東西。

似乎問題是舊硬體的組合,可能沒有提供網路驅動程序。至少這是我的猜測。

我們收到了新的硬體,現在部署過程繼續進行。(它現在如何掛在最後。無法加入域。)

萬一你想知道。新硬體是:

伺服器 華擎 J1900D2Y,16 GB,3TB 硬碟

基本節點華擎 Q1900TM-ITX,4 GB,無硬碟

引用自:https://serverfault.com/questions/702166