
SSH 文件傳輸在 ~700KB 後掛起

  • February 22, 2012


我在現場的 Windows 7 機器上編寫 SFTP 文件傳輸腳本。當我傳輸大於 1 兆字節左右的 zip 文件時,傳輸(和 SSH)在大約 700KB 後意外停止。SSH 程序似乎掛起,但它並沒有開始大量消耗 CPU 或記憶體,而且 Windows 也沒有說它停止響應。伺服器最終放棄並超時,但客戶端永遠不會返回(儘管設置了 ServerAliveCountMax 和 ServerAliveInterval)。伺服器日誌顯示傳輸開始,然後是超時並在很長一段時間後斷開連接。



命令行 sftp.exe 客戶端使用預設選項正常工作;那些較大的 zip 文件傳輸成功。我無法測試 scp.exe,因為 SSH 使用者帳戶沒有 shell 訪問權限。我相信這個問題在從 XP 到 7 的作業系統擦除和重新映像中仍然存在,所以我懷疑是網路問題,但我無法理解什麼樣的問題會導致這種行為。

我正在使用 Perl 和 Net::SFTP::Foreign 模組編寫腳本。以下是從我的測試案例腳本中提取的相關程式碼(SSH 輸出日誌附在下面):

my %connectOpts = ( 
 user     => $username
 ,timeout => $timeout
 ,warn    => sub {}
 ,more    => [ "-o PreferredAuthentications=publickey",
              "-o ServerAliveCountMax=6",
              "-o ServerAliveInterval=" . int($timeout/6),
              "-vvvv" ]

my $sftp = Net::SFTP::Foreign::Compat->new( $host, %connectOpts );

foreach my $local_file ( @local_files ) {
 $sftp->do_stat( 'upload.tmp' ) && print( "Overwriting upload.tmp\n" );

 $sftp->put( $local_file, 'upload.tmp' );

 $sftp->do_rename( 'upload.tmp', basename( $local_file ));

為了相同的目的,我在數十台其他現場 PC 上使用此程式碼和非常相似的配置。這是我第一次看到這個問題。我正在尋找根本原因或診斷建議,而不是這個生態系統之外的解決方法。有無數種編寫腳本的方法,但我需要 Net::SFTP::Foreign 模組的粒度、回饋和模組化來進行日誌記錄和錯誤報告。Perl 是唯一可用的腳本語言。



  • Windows 7的
  • ActivePerl 5.8.9
  • Net::SFTP::國外 v1.69
  • OpenSSH 5.3p1(來自 CopSSH 發行版的 Windows 客戶端)
  • OpenVPN 2.2-rc(Windows 連接回企業網路)
  • Tectia Server SSH 伺服器)

客戶端輸出 (-vvvv) 直到我在 ssh.exe 橫盤後手動終止它:

更新 1

根據@Daniel Lawson 的建議,我嘗試使用 netsh 將 VPN 介面的 MTU 限制為 1280,以避免在伺服器路徑上的 MTU 不匹配的情況下填充客戶端的 TCP 緩衝區。轉移仍然在大約同一點停滯不前。我還嘗試斷開 VPN 並將物理介面的 MTU 限制為 1280,但結果相同。

這對我來說就像一個 MTU 問題。當路徑 MTU 不匹配時,我已經看到與 scping 文件類似的問題。主機上的 TCP 緩衝區可能會填滿,這就是為什麼您發送多個數據包的原因,但是一旦它們填滿您的客戶端就會停止 - 在 MTU 問題本身實際產生影響之後很久。

要驗證這一點,您可以查看像scamper這樣的工具。或者您可以嘗試手動將您的 MTU 限製到某個較低的點(例如 1280 字節)並查看是否可以解決問題。很有可能只有輕微的不匹配,例如因為路徑中的 PPPoE 鏈路將 MTU 降低到 1492。

也許你可以玩這個block_size參數?我經歷了一些與通過 SSH/SSL 上傳文件相關的怪事,並且以某種方式調整塊/塊大小有所幫助。我相信預設值是32 * 1024,所以也許將其降低到 16、8、4 並嘗試可能會有所不同。可能值得一試。
