JAVA

JAVA_regex_정규식 패턴 [가-힣] [a-zA-Z] [0-9]

원코딩 2022. 6. 10. 09:51

 

 

자바 라이브러리에서 

' regex ' 라고 표기되어 있다면

정규식을 사용해야 한다. 

( regex = 정규식 )

 

 

예를 들어 

많은 문자열 중에서 

숫자,

한글,

영 소문자,

영 대문자

를 포함한 글자를 추출하고 싶다고 할 때

정규식을 사용해야 한다. 

 

 

문자 정규식
한글 [가-힣]
영문 대문자 [A-Z]
영문 소문자 [a-z]
영문자 [A-Za-z]
숫자 [0-9]

 

 

c[a-z]

c로 시작하는 두 글자 (영문 소문자)

 

c[0-9]

c로 시작하는 숫자

 

나[가-힣]

나로 시작하는 두 글자 (한글)

 

 

이처럼 나타낼 수 있다. 

함께 사용하는 기호들을 알아보겠다. 

 

 

기호 기능 활용
. 임의의 문자, 모든 문자열을 뜻한다.
숫자, 한글, 영문, 특수문자, 공백
c.   
c로 시작하는 두글자 문자
* . 과 같이 모든 문자열이지만 
글자 수 제한이 없다. 
c*
c로 시작하는 모든 문자
\\ 기능이 없는 문자 그대로의 기호를 찾을 때  c\\.
c.와 일치하는 문자열 
해당 기호들은 문자로 찾을 때 앞에 \\ 붙이기! 
^ 시작하는 문자 또는 문자 제외

^[가-힣]  한글로 시작하는 문자
[^가-힣]  한글 제외
{ num } {} 안의 숫자는 글자 수를 뜻함 [A-Z]{1,3}
A~Z 중에서 1 ~ 3 글자의 문자
A, AB, ABC 
.*  모든 문자 .*  a .*
a가 포함된 모든 문자
| 또는( OR 기능 ) [ a | b ] 
a또는 b를 포함하는 문자
$ 끝나는 문자 [0-9]$ 
숫자로 끝나는 문자
[  ] 괄호 안에는 범위를 지정함  [A-Z] , [0-9] , [A|B}

 

 

 

[ b | d ] .*

b 또는 d로 시작한 모든 문자

 

 

 

[ ba | da ] .*

ba 또는 da로 시작하는 모든 문자

 

 

 

[ ^ b-c ] .*

 b나 c로 시작하는 모든 문자를

제외하고 가져와라 

 

 

 

c.*t

c로 시작하면서 t로 끝나는 문자 

 

 

 

c[a-z]*

c로 시작하는 한글자 이상

c, ca, caaaa, cddddd, cadfsdfsdf 등 

 

 

 

c[a-z]+

c로 시작하는 두글자 이상

ca, caaa, cdddddd, csdfsdfsdfdsf

c(얘는 못찾음)

 

 

 

* 이상으로 정규식에 대해 알아보았다 *