鍍金池/ 問答/Java/ JAVA正則

JAVA正則

問題:輸入兩個(gè)任意整數(shù)的參數(shù),如:88-3333,返回能匹配該范圍所有數(shù)值的正則表達(dá)式.
起初看起來挺簡(jiǎn)單的問題,之后發(fā)現(xiàn)實(shí)現(xiàn)太過復(fù)雜(不確定對(duì)不對(duì)),有什么簡(jiǎn)約的方式?

回答
編輯回答
遲月

正則不擅長(zhǎng)做這個(gè),也不是不能做

根據(jù)生成正則表達(dá)式來匹配任意數(shù)值范圍, 并在 Regex_For_Range 中為您的示例生成這樣的 regex 后:

\b0*(1[1-9][0-9]|[2-9][0-9]{2}|1[0-9]{3}|2[01][0-9]{2}|22[0-2][0-9]|223[0-4])\b


能實(shí)現(xiàn)你的需求:

過程如下 (仍然按那 Regex 生成器步驟操作):

首先, 分成相等的長(zhǎng)度范圍:

110-999
1000-2234

第二, 分?jǐn)喈a(chǎn)生簡(jiǎn)單 regexes 的范圍:

110-199
200-999
1000-1999
2000-2199
2200-2229
2230-2234

將每個(gè)范圍變?yōu)?regex:

1 [1-9] [0-9]
[2-9][0-9]{2}
1 [0-9] {3}
2 [01] [0-9] {2}
22 [0-2] [0-9]
223 [0-4]

折疊相鄰的 10進(jìn)制數(shù)位: 1[1-9][0-9] [2-9][0-9]{2} 1[0-9]{3} 2[01][0-9]{2} 22[0-2][0-9] 223[0-4]

結(jié)合以上 regex:

0*(1[1-9][0-9]|[2-9][0-9]{2}|1[0-9]{3}|2[01][0-9]{2}|22[0-2][0-9]|223[0-4])

接下來, 我們將嘗試使用樹來分解常用前綴:
基于 regex 前綴分析成樹:

.1 [1-9] [0-9]
+ [0-9] {3}
+ [2-9] [0-9] {2}
+ 2 [01] [0-9] {2}
+ 2 [0-2] [0-9]
+ 3 [0-4]

將分析樹轉(zhuǎn)變?yōu)檎齽t:

0*(1([1-9][0-9]|[0-9]{3})|[2-9][0-9]{2}|2([01][0-9]{2}|2([0-2][0-9]|3[0-4])))

我們選擇較短的一個(gè)作為我們的結(jié)果。

\b0*(1[1-9][0-9]|[2-9][0-9]{2}|1[0-9]{3}|2[01][0-9]{2}|22[0-2][0-9]|223[0-4])\b



參見:

How to match numbers between X and Y with regexp?

2017年12月12日 15:33