Apache-2.2
如何使用我的主域的物理 robots.txt 文件禁止抓取所有子域
我有多個物理子域,我不想更改任何子域的任何 robots.txt 文件。
有沒有辦法在不使用任何子域的物理文件的情況下禁止我的主域的物理 robots.txt 文件中的所有子域?
任何可以訪問所有子域和主域的通用伺服器(Apache)文件?
subdomain.example.com
不可能對on說什麼example.com/robots.txt
。的
robots.txt
語法非常有限,例如User-agent: Google Disallow: /administrator User-agent: * Disallow: /
其中
User-agent:
定義了搜尋引擎和Disallow:
與伺服器根目錄相關的路徑。在此範例中,/administrator
,但不允許休息。與往常一樣,robots.txt
它不會限制任何東西。不去那裡只是一個美好的願望。該語法根本沒有子域的位置,Web Robot 只查找
/robots.txt
iesubdomain.example.com/robots.txt
,而不是example.com/robots.txt
.