2017年7月6日 星期四

正規表達式(Regular Expression, regex) for Java


--------------------------------------------------------------------------------------------------------------------------
普通字元組

[0-9], \d    =>比對數字串
[a-z]    =>比對小寫英文字母串
[0-9A-Za-z], \w=>比對數字串大小寫英文字母串

-g         =>(global) 全域比對,如果沒家只會比對第一個
-i          =>(ignore case) 大小寫不區分
-m        =>(mulltiline) 多行比對

[...]      =>代表那些括號內的字元
[^...]    =>代表不要那些括號內的字元

+         =>代表出現1次以上
*         =>代表出現0次以上
?         =>代表出現0次或1次

\n       =>換行(newLine, ASCII=0x0a)
\t        =>跳格(tab)
\r        =>windows中常接著\n一起代表換行(ASCII=0x0c)
\s       =>空白型字元
\b       =>匹配邊界
.         =>代表任何字母(換行除外)
^        =>不在[...]裡面時,代表字串手
$        =>代表字串結尾

(預設)Greedy   =>貪婪模式會一直匹配下去,直到無法匹配為止
(?)Reluctant      =>勉強模式,只會匹配最少字元。
(+)Possessive    =>只有Java

\X代表不是\x的那些字母
(...)    =>代表一個群組

*可以看這個網頁,補充很多知識
https://atedev.wordpress.com/2007/11/23/%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%A4%BA%E5%BC%8F-regular-expression/
--------------------------------------------------------------------------------------------------------------------------

POSIX字元組

e.gs., test1檔案,可以更改1或a來看一下執行結果


--------------------------------------------------------------------------------------------------------------------------



利用Java來練習

e.gs.,
(1).
可以觀看test2檔案執行結果
inputStr="abdZZcdeQQbe";
需找出c或d所在的位置。
regex="[c-d]{1}";
而如果要連續重複兩次的話,則
regex="[c-d]{2}";
matcher的start=5,group=cd;

(2).
可以觀看test3檔案執行結果
來看一下+,*,? 和貪婪模式、勉強模式的差別。


(3).
可以觀看test4檔案執行結果
來看一下group的執行結果,其中他會依序尋找其結果

(4)
可以觀看test5檔案執行結果
用一個簡單的例子,試著抓出他的電話號碼

(5)
可以觀看test6檔案執行結果
找出每個句首大寫的單字

(6)
可以觀看test7檔案執行結果
可以利用此程式,知道該號碼為手機、家裡電話、或錯誤號碼

*
http://notes.maxwi.com/2015/10/06/Regex-practice/
* 如果想看更多範例可以到下面網址
http://www.iteye.com/topic/350789

沒有留言:

張貼留言