Apache-2.2

如何使用我的主域的物理 robots.txt 文件禁止抓取所有子域

  • June 9, 2017

我有多個物理子域,我不想更改任何子域的任何 robots.txt 文件。

有沒有辦法在不使用任何子域的物理文件的情況下禁止我的主域的物理 robots.txt 文件中的所有子域?

任何可以訪問所有子域和主域的通用伺服器(Apache)文件?

subdomain.example.com不可能對on說什麼example.com/robots.txt

robots.txt語法非常有限,例如

User-agent: Google
Disallow: /administrator

User-agent: *
Disallow: /

其中User-agent:定義了搜尋引擎和Disallow:與伺服器根目錄相關的路徑。在此範例中,Google允許抓取任何內容/administrator,但不允許休息。與往常一樣,robots.txt它不會限制任何東西。不去那裡只是一個美好的願望。

該語法根本沒有子域的位置,Web Robot 只查找/robots.txtie subdomain.example.com/robots.txt,而不是example.com/robots.txt.

引用自:https://serverfault.com/questions/854659