ubuntu 上的非貪婪 grep 命令？

May 3, 2010

我正在建構一個腳本，它會從我們的模板系統中過濾掉所有可翻譯的內容。我面臨的問題是 2 個可翻譯文本在一條線上的情況。
這些是模板文件中的 2 行範例，它們都包含一個或多個可翻譯
&lt;img src="/captcha/generate.jpg" alt="[#Captcha#]" /&gt;
&lt;span&gt;[#Velden met een * zijn verplicht in te vullen#]&lt;/span&gt; &lt;button type="submit" name="frm_submit" class="right"&gt;[#Verzend#]
當我放開以下正則表達式時
egrep "\[#(.*)#\]" . -Rohis
我得到這個輸出
[#Captcha#]"
[#Velden met een * zijn verplicht in te vullen#]&lt;/span&gt; &lt;button type="submit" name="frm_submit" class="right"&gt;[#Verzend#]
雖然所需的輸出是
[#Captcha#]
[#Velden met een * zijn verplicht in te vullen#]
[#Verzend#]

同意凱爾。但是，在這種情況下，您可以這樣做：egrep "\[#([^]])*)#\]" . -Rohis得到您正在尋找的東西。
[^]]*匹配非]字元，所以它會在第一個命中]時停止。

嘗試使用正則表達式解析 HTML 會很痛苦，只是不要這樣做。Jeff 在Parsing Html The Cthulhu Way中寫道。“但我只想______”，沒關係，認真的，別做。花點時間學習一些旨在解析 html 的東西。
我個人會為此推荐一個 Perl 模組（例如HTML::TreeBuilder），但是您知道哪些語言？其他選項是：tidy+ xmlstarlet xmlgawk xpath xml2。
如果您只想要文本中的“渲染”html，您可以使用連結之類的東西：links -dump www.google.com

引用自：https://serverfault.com/questions/109586

ubuntu 上的非貪婪 grep 命令？

相關問答

如何查找不包含給定搜尋字元串的文件

grep 查找包含長度大於 x 個字元的字元串的文件？

如何從文件中提取值，將其與變數進行比較並發送到輸出文件

如何讓 pgrep 顯示完整的程序資訊

Linux cli 管道命令 tail 和 grep

如何以程式方式在 sudoers 文件中添加secure_path